认识
2024年04月24日
一、认识
1.1 工作流
Web
监控是一个全链路的监控体系, 包括数据采集、数据加工处理、削峰限流、数据上报、数据聚合、数据清洗、数据入库、数据分析与数据挖掘以及根据分析结果进行针对性的调整、消息推送等。
-
数据采集: 包括页面性能数据、异常数据、用户行为、资源数据、个性化指标等数据采集的过程
-
数据加工处理: 包括数据格式化、丰富上下文信息
-
削峰限流: 频率限制
-
数据上报: 上报方式、上报时机、上报优化
-
数据聚合
-
数据清洗
-
数据入库
-
数据分析与挖掘: 性能数据分析、异常数据分析、用户行为数据分析
-
消息推送
1.2 告警设计
监控告警不是一件容易的事, 在什么情况下,我们需要进行告警的推送?们先来了解两个概念:宏观告警 和 微观告警
-
宏观预警: 更加关注的是一段时间区间内,新增异常的数量、比率是否超过了阈值;如果超过了那就进行告警
-
微观预警: 更加关注的是:是否有新增的、且未解决的异常
我们团队这边目前做的都是微观告警;只要出现的新异常,它的 uid
是当前已激活的异常中全新的一个, 那么就进行告警, 通知大群、通知负责人、在缺陷平台上新建 bug
指派给负责人