在软件开发中,监控与观测是保障系统高可用的关键。优秀的软件往往内置故障发现与应对机制,通过暴露监控数据,帮助用户观测健康状况,及时感知问题。随着时代演进,监控已从最初的“及时感知问题”发展为“预知问题并洞察业务经营”,这一转变凸显了监控的核心价值。
课程目录:
01|背景信息:监控需求与开源方案对比(含音频、PDF)
02|基本概念:监控行业术语解析
03|架构概述:典型监控系统架构
04|快速搭建Prometheus系统
05|Prometheus关键设计
06|PromQL常见使用场景
07|解决Prometheus存储容量问题
08|用Nightingale管理Prometheus告警
09|监控概论(上):数据采集方法
10|监控概论(下):采集方式与原理
11|机器监控:操作系统关键指标
12|网络监控:链路与设备监控
13|组件监控:MySQL关键指标
14|组件监控:Redis关键指标
15|组件监控:Kafka关键指标
16|组件监控:Elasticsearch关键指标
17|组件监控:Kubernetes Node指标
18|组件监控:Kubernetes控制面指标
19|应用监控:埋点方式
20|应用监控:日志监控
21|事件管理(上):事件降噪手段
22|事件管理(下):事件闭环处理
结束语|弱水三千,只取一瓢饮
开篇词|关注高可用,必懂监控
期末测验|满分挑战
{{LINK}} {{IMG}}


声明:本站所有文章,如无特殊说明或标注,均来自互联网采集。本站不对其安全性实用性负责。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
