海纳嗨数-软件私有化中心
监控告警配置
海纳嗨数平台自带的 Cloudeon 集成了快速配置监控报警能力,要想使用则需要服务列表提前安装了 Monitor 服务
如何使用
可以看到右侧有告警 tab 栏,在海纳嗨数默认安装完成后,其内置的告警规则会被自动配置完成。可以查看其中正在活跃的告警,历史告警,已经配置的告警规则
新增告警规则
有时候提前内置的规则或许不能满足用户的需求,那么用户可以选择自己新增告警规则。
点击 告警规则 -> 新增告警规则 则会弹出。
例如,如果你想对已经安装的 doris 服务,添加一个告警规则用于监测 Doris BE 的计算节点是否存活。
那么可以作如下配置。
这里面其实涉及到的配置和自己去配置 Prometheus 的Alert Manager 告警规则是一致的。
实现原理
Cloudeon集成监控告警的能力,本质上是去读写每个已经注册 Monitor 服务中 Alert Manager 组件的告警 yml 文件。
例如,在新增任意一条告警规则的时候,将会根据对应的告警框架服务和角色,去操作对应提前安装好的服务中的告警 yml 文件,这样以来被 AlertManager 关注的这些已经提前在安装阶段配置好的告警yml文件中的告警规则将会自动同步到AlertManager中。