清除无效告警常用方法

时间:2025-01-06 18:48:40

1、告警的本质没有多少系统的告警是设计得当的。良好的告警设计是一项非常困难的工作。如何知道你收到的告警是糟糕的?多少次你收到了告警之后,立即就关掉了的?

清除无效告警常用方法

2、告警对象可以分为两种:业务规则监控系统可靠性监控

清除无效告警常用方法

3、高质量的告警是actionable的,不应该用采集的难度决定你使用什么指标去告警

清除无效告警常用方法

4、1:不要别人做什么告警,你就做什么,要做“真正”有用的告警:特别是cpu使用率告警is work getting done:请求数 + 成功率

清除无效告警常用方法

5、2:is the user having good experience:响应延迟只要采集对了指标,大部分时候告警不需要复杂算法

清除无效告警常用方法

6、3:基于算法的异常检测:算法不难,实在必要也是可以做到的

清除无效告警常用方法
© 手抄报圈