海纳嗨数平台自带的 Cloudeon 集成了快速配置监控报警能力,要想使用则需要服务列表提前安装了 Monitor 服务

如何使用

可以看到右侧有告警 tab 栏,在海纳嗨数默认安装完成后,其内置的告警规则会被自动配置完成。可以查看其中正在活跃的告警,历史告警,已经配置的告警规则

新增告警规则

有时候提前内置的规则或许不能满足用户的需求,那么用户可以选择自己新增告警规则。
点击 告警规则 -> 新增告警规则 则会弹出。

例如,如果你想对已经安装的 doris 服务,添加一个告警规则用于监测 Doris BE 的计算节点是否存活。
那么可以作如下配置。

这里面其实涉及到的配置和自己去配置 Prometheus 的Alert Manager 告警规则是一致的。

实现原理

Cloudeon集成监控告警的能力,本质上是去读写每个已经注册 Monitor 服务中 Alert Manager 组件的告警 yml 文件。

例如,在新增任意一条告警规则的时候,将会根据对应的告警框架服务和角色,去操作对应提前安装好的服务中的告警 yml 文件,这样以来被 AlertManager 关注的这些已经提前在安装阶段配置好的告警yml文件中的告警规则将会自动同步到AlertManager中。