K3中级

告警阈值设置

30 分钟调优告警时

格式:设计合理的告警阈值。

常见错误

  • 阈值太低 → 告警风暴("狼来了"效应,真正的问题被忽略)
  • 阈值太高 → 问题发现太晚

练习:为以下指标设置告警阈值:

                警告      严重
响应时间       >___ms    >___ms
错误率         >___%     >___%
CPU 使用率     >___%     >___%
磁盘使用率     >___%     >___%
API 调用失败率  >___%     >___%

我的笔记