Prometheus监控技术与实践

Prometheus监控技术与实践
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
2020-04
版次: 1
ISBN: 9787111649649
定价: 99.00
装帧: 其他
开本: 16开
纸张: 胶版纸
页数: 344页
字数: 400千字
  • Prometheus是云监控领域的瑞士军刀,本书系统地介绍Prometheus的基本理论与应用,包含作者多年的实战经验。本书主要内容分为三部分,共14章。

      *部分(1-2章)介绍监控系统的技术发展与基础原理以及Prometheus的核心组件及架构;

      第二部分(3-8章)介绍Prometheus的Exporter导出器、服务发现、PromQL数据查询、告警处理、可视化Grafana、Pushgateway等;

      第三部分(9-14章)介绍Prometheus与其他系统结合的综合案例,如与OpenStack、Docker、Kubernetes、日志系统等结合,*后介绍了Prometheus监控系统的生产部署和统一监控系统平台的构建。 陈金窗



    资深运维技术专家,曾就职于太极、普天、姬慕石、金山软件、中国电信等多家国内外著名企业。从事IT基础设施建设、运维与技术管理20多年,建设、维护超过100个大、中型IT项目和产品,既对服务器、存储、网络、系统、中间件等IT技术有丰富的实践经验,又对ITIL、DevOps、PMP等运维管理有落地经验,特别是对云计算环境中维护管理的相关开源技术有深刻理解,牵头著有《Ansible自动化运维技术与最佳实践》。



    刘政委



    资深运维技术与管理人员,大型在线游戏和手游自动化运维老兵;对自动化运维和监控技术有着丰富的实践经验,善于互联网技术团队的建设和管理; 深耕IT基础运维规划和建设,对私有云项目实施有一定的实践经验,曾合著《Ansible自动化运维技术与最佳实践》一书。



    郑少斌



    长期从事云计算相关产品、研发、运维等工作,具备丰富的理论及实践经验,主持国家专项1个,获得已授权专利6个,并曾在通信协会担任数据中心联盟可信云工作组核心专家、通信网络安全服务能力评定技术专家。



    张其栋



    中国电信云公司软件工程师,主要负责私有容器云平台的研发工作。一直从事云计算、SDN领域的研究与实践,对Docker、Kubernetes、Prometheus、Mesos等技术有丰富的实战经验。 前 言



    第一部分 概述



    第1章 云计算时代的监控系统 2



    1.1 云计算时代的应用系统 2



    1.1.1企业“IT云化”实现数字化转型 3



    1.1.2 云计算时代的IT架构特点 3



    1.1.3 云计算时代的IT管理变革 4



    1.2 云计算监控的目标和挑战 5



    1.2.1 云计算监控目标 5



    1.2.2 云计算监控挑战 7



    1.3 云计算监控的范围和架构 8



    1.3.1 监控管理的范围 8



    1.3.2 监控系统的基本架构 9



    1.4 百花齐放的开源监控软件工具 10



    1.4.1 监控系统成熟度 11



    1.4.2 Zabbix 11



    1.4.3 OpenTSDB 12



    1.5 Prometheus监控系统 13



    1.5.1 应运而生,茁壮成长 13



    1.5.2 功能完善、监控所有层级指标 15



    1.5.3开放、高效、易用的完整解决方案 16



    1.6 本章小结 18



    第2章Prometheus基本概念及部署 19



    2.1 Prometheus架构 19



    2.2 Prometheus快速部署 20



    2.2.1 使用二进制文件快速部署 21



    2.2.2 使用Docker快速安装 25



    2.2.3 Prometheus Web UI 26



    2.3 Prometheus相关概念 29



    2.3.1 数据模型 29



    2.3.2 Metric的四种类型 30



    2.3.3 Jobs 和 Instances 32



    2.4 Prometheus核心组件 34



    2.5 本章小结 35



    第二部分 Prometheus技术基础



    第3章 Exporter 38



    3.1 概述 38



    3.1.1 Exporter类型 38



    3.1.2 文本数据格式 39



    3.1.3 获取Exporter 40



    3.2 主机监控 42



    3.2.1 Linux主机监控 42



    3.2.2 Windows主机监控 52



    3.3 数据库监控 53



    3.3.1 MySQL Server exporter 54



    3.3.2 Redis exporter 60



    3.4 Nginx监控 62



    3.5 Prometheus之黑盒监控 64



    3.5.1 软件安装与部署 65



    3.5.2 配置文件 67



    3.6 本章小结 71



    第4章 服务发现 73



    4.1 基于文件的服务发现 74



    4.2 基于Consul的服务发现 78



    4.2.1 Consul体验应用信息 80



    4.2.2 软件下载与部署 80



    4.2.3 服务注册发现 83



    4.2.4 与Prometheus集成 85



    4.3 基于DNS的服务发现 87



    4.3.1自建DNS服务SRV记录设置 87



    4.3.2阿里云域名解析SRV记录设置 88



    4.4 Relabelling 89



    4.5 本章小结 93



    第5章 PromQL 94



    5.1 时序数据库 94



    5.2 PromQL简介 96



    5.2.1 数据模型与数据类型 96



    5.2.2 时间序列选择器 97



    5.3 PromQL聚合操作 100



    5.4 PromQL运算符 102



    5.4.1 算术运算符 102



    5.4.2 关系运算符 103



    5.4.3 向量匹配 105



    5.4.4 逻辑运算符 107



    5.4.5 运算符优先级 108



    5.5 PromQL函数 108



    5.5.1 数学函数 108



    5.5.2 时间函数 109



    5.5.3 标签操作函数 110



    5.5.4 Counter指标增长率 111



    5.5.5 Gauge指标趋势变化预测 111



    5.6 PromQL查询分析 112



    5.6.1 指标分析 112



    5.6.2 PromQL操作分析 113



    5.7 本章小结 113



    第6章 告警处理 115



    6.1 概述 115



    6.2 Alertmanager部署 116



    6.2.1 Alertmanager机制 116



    6.2.2 使用二进制文件方式安装 117



    6.2.3 使用Docker安装 120



    6.3 Alertmanager配置 120



    6.3.1 global 120



    6.3.2 templates 122



    6.3.3 route 122



    6.3.4 receivers 124



    6.3.5 inhibit_rules 125



    6.4 Prometheus告警规则 126



    6.4.1 与Alertmanager关联 126



    6.4.2 告警规则 127



    6.4.3 使用模板 132



    6.5 告警接收器 133



    6.5.1 Email接收告警 133



    6.5.2 企业微信接收告警 136



    6.5.3基于Webhook的钉钉接收告警 142



    6.5.4 告警通知模板 146



    6.6 告警临时静默 147



    6.7 本章小结 148



    第7章 可视化 149



    7.1 概述 149



    7.2 Grafana安装 150



    7.2.1 在CentOS上安装 151



    7.2.2 在Windows上安装 154



    7.2.3 使用Docker安装 155



    7.3 Grafana基本概念 156



    7.4 Prometheus数据源 158



    7.4.1 数据源添加 158



    7.4.2 页面UI说明 160



    7.5 仪表盘导入 161



    7.5.1 Node Exporter仪表盘 161



    7.5.2 Windows Node仪表盘 164



    7.5.3 MySQL仪表盘 166



    7.5.4 Redis仪表盘 168



    7.5.5 Nginx仪表盘 168



    7.5.6 Blackbox Exporter仪表盘 169



    7.6 定制监控图表 171



    7.6.1 定制仪表盘 171



    7.6.2 定制面板 175



    7.7 本章小结 183



    第8章 Pushgateway 184



    8.1 概述 184



    8.2 Pushgateway集成 185



    8.2.1 软件下载与部署 186



    8.2.2 Pushgateway UP状态 187



    8.3 Pushgateway数据管理 187



    8.3.1向Pushgateway发送和查看监控指标 187



    8.3.2删除Pushgateway中的监控标准 189



    8.3.3基于推送的Prometheus监控 189



    8.4 本章小结 192



    第三部分 监控综合实践



    第9章 OpenStack云计算监控 194



    9.1 OpenStack监控架构 194



    9.2 OpenStack Exporter 196



    9.2.1 OpenStack Exporter部署 197



    9.2.2 OpenStack监控可视化 199



    9.3 OpenStack Helm监控 200



    9.3.1基于OpenStack Helm部署Prometheus 200



    9.3.2基于OpenStack Helm部署Grafana 203



    9.4 本章小结 204



    第10章 Docker容器监控 205



    10.1 Docker容器架构与监控 205



    10.1.1 Docker容器架构 205



    10
  • 内容简介:
    Prometheus是云监控领域的瑞士军刀,本书系统地介绍Prometheus的基本理论与应用,包含作者多年的实战经验。本书主要内容分为三部分,共14章。

      *部分(1-2章)介绍监控系统的技术发展与基础原理以及Prometheus的核心组件及架构;

      第二部分(3-8章)介绍Prometheus的Exporter导出器、服务发现、PromQL数据查询、告警处理、可视化Grafana、Pushgateway等;

      第三部分(9-14章)介绍Prometheus与其他系统结合的综合案例,如与OpenStack、Docker、Kubernetes、日志系统等结合,*后介绍了Prometheus监控系统的生产部署和统一监控系统平台的构建。
  • 作者简介:
    陈金窗



    资深运维技术专家,曾就职于太极、普天、姬慕石、金山软件、中国电信等多家国内外著名企业。从事IT基础设施建设、运维与技术管理20多年,建设、维护超过100个大、中型IT项目和产品,既对服务器、存储、网络、系统、中间件等IT技术有丰富的实践经验,又对ITIL、DevOps、PMP等运维管理有落地经验,特别是对云计算环境中维护管理的相关开源技术有深刻理解,牵头著有《Ansible自动化运维技术与最佳实践》。



    刘政委



    资深运维技术与管理人员,大型在线游戏和手游自动化运维老兵;对自动化运维和监控技术有着丰富的实践经验,善于互联网技术团队的建设和管理; 深耕IT基础运维规划和建设,对私有云项目实施有一定的实践经验,曾合著《Ansible自动化运维技术与最佳实践》一书。



    郑少斌



    长期从事云计算相关产品、研发、运维等工作,具备丰富的理论及实践经验,主持国家专项1个,获得已授权专利6个,并曾在通信协会担任数据中心联盟可信云工作组核心专家、通信网络安全服务能力评定技术专家。



    张其栋



    中国电信云公司软件工程师,主要负责私有容器云平台的研发工作。一直从事云计算、SDN领域的研究与实践,对Docker、Kubernetes、Prometheus、Mesos等技术有丰富的实战经验。
  • 目录:
    前 言



    第一部分 概述



    第1章 云计算时代的监控系统 2



    1.1 云计算时代的应用系统 2



    1.1.1企业“IT云化”实现数字化转型 3



    1.1.2 云计算时代的IT架构特点 3



    1.1.3 云计算时代的IT管理变革 4



    1.2 云计算监控的目标和挑战 5



    1.2.1 云计算监控目标 5



    1.2.2 云计算监控挑战 7



    1.3 云计算监控的范围和架构 8



    1.3.1 监控管理的范围 8



    1.3.2 监控系统的基本架构 9



    1.4 百花齐放的开源监控软件工具 10



    1.4.1 监控系统成熟度 11



    1.4.2 Zabbix 11



    1.4.3 OpenTSDB 12



    1.5 Prometheus监控系统 13



    1.5.1 应运而生,茁壮成长 13



    1.5.2 功能完善、监控所有层级指标 15



    1.5.3开放、高效、易用的完整解决方案 16



    1.6 本章小结 18



    第2章Prometheus基本概念及部署 19



    2.1 Prometheus架构 19



    2.2 Prometheus快速部署 20



    2.2.1 使用二进制文件快速部署 21



    2.2.2 使用Docker快速安装 25



    2.2.3 Prometheus Web UI 26



    2.3 Prometheus相关概念 29



    2.3.1 数据模型 29



    2.3.2 Metric的四种类型 30



    2.3.3 Jobs 和 Instances 32



    2.4 Prometheus核心组件 34



    2.5 本章小结 35



    第二部分 Prometheus技术基础



    第3章 Exporter 38



    3.1 概述 38



    3.1.1 Exporter类型 38



    3.1.2 文本数据格式 39



    3.1.3 获取Exporter 40



    3.2 主机监控 42



    3.2.1 Linux主机监控 42



    3.2.2 Windows主机监控 52



    3.3 数据库监控 53



    3.3.1 MySQL Server exporter 54



    3.3.2 Redis exporter 60



    3.4 Nginx监控 62



    3.5 Prometheus之黑盒监控 64



    3.5.1 软件安装与部署 65



    3.5.2 配置文件 67



    3.6 本章小结 71



    第4章 服务发现 73



    4.1 基于文件的服务发现 74



    4.2 基于Consul的服务发现 78



    4.2.1 Consul体验应用信息 80



    4.2.2 软件下载与部署 80



    4.2.3 服务注册发现 83



    4.2.4 与Prometheus集成 85



    4.3 基于DNS的服务发现 87



    4.3.1自建DNS服务SRV记录设置 87



    4.3.2阿里云域名解析SRV记录设置 88



    4.4 Relabelling 89



    4.5 本章小结 93



    第5章 PromQL 94



    5.1 时序数据库 94



    5.2 PromQL简介 96



    5.2.1 数据模型与数据类型 96



    5.2.2 时间序列选择器 97



    5.3 PromQL聚合操作 100



    5.4 PromQL运算符 102



    5.4.1 算术运算符 102



    5.4.2 关系运算符 103



    5.4.3 向量匹配 105



    5.4.4 逻辑运算符 107



    5.4.5 运算符优先级 108



    5.5 PromQL函数 108



    5.5.1 数学函数 108



    5.5.2 时间函数 109



    5.5.3 标签操作函数 110



    5.5.4 Counter指标增长率 111



    5.5.5 Gauge指标趋势变化预测 111



    5.6 PromQL查询分析 112



    5.6.1 指标分析 112



    5.6.2 PromQL操作分析 113



    5.7 本章小结 113



    第6章 告警处理 115



    6.1 概述 115



    6.2 Alertmanager部署 116



    6.2.1 Alertmanager机制 116



    6.2.2 使用二进制文件方式安装 117



    6.2.3 使用Docker安装 120



    6.3 Alertmanager配置 120



    6.3.1 global 120



    6.3.2 templates 122



    6.3.3 route 122



    6.3.4 receivers 124



    6.3.5 inhibit_rules 125



    6.4 Prometheus告警规则 126



    6.4.1 与Alertmanager关联 126



    6.4.2 告警规则 127



    6.4.3 使用模板 132



    6.5 告警接收器 133



    6.5.1 Email接收告警 133



    6.5.2 企业微信接收告警 136



    6.5.3基于Webhook的钉钉接收告警 142



    6.5.4 告警通知模板 146



    6.6 告警临时静默 147



    6.7 本章小结 148



    第7章 可视化 149



    7.1 概述 149



    7.2 Grafana安装 150



    7.2.1 在CentOS上安装 151



    7.2.2 在Windows上安装 154



    7.2.3 使用Docker安装 155



    7.3 Grafana基本概念 156



    7.4 Prometheus数据源 158



    7.4.1 数据源添加 158



    7.4.2 页面UI说明 160



    7.5 仪表盘导入 161



    7.5.1 Node Exporter仪表盘 161



    7.5.2 Windows Node仪表盘 164



    7.5.3 MySQL仪表盘 166



    7.5.4 Redis仪表盘 168



    7.5.5 Nginx仪表盘 168



    7.5.6 Blackbox Exporter仪表盘 169



    7.6 定制监控图表 171



    7.6.1 定制仪表盘 171



    7.6.2 定制面板 175



    7.7 本章小结 183



    第8章 Pushgateway 184



    8.1 概述 184



    8.2 Pushgateway集成 185



    8.2.1 软件下载与部署 186



    8.2.2 Pushgateway UP状态 187



    8.3 Pushgateway数据管理 187



    8.3.1向Pushgateway发送和查看监控指标 187



    8.3.2删除Pushgateway中的监控标准 189



    8.3.3基于推送的Prometheus监控 189



    8.4 本章小结 192



    第三部分 监控综合实践



    第9章 OpenStack云计算监控 194



    9.1 OpenStack监控架构 194



    9.2 OpenStack Exporter 196



    9.2.1 OpenStack Exporter部署 197



    9.2.2 OpenStack监控可视化 199



    9.3 OpenStack Helm监控 200



    9.3.1基于OpenStack Helm部署Prometheus 200



    9.3.2基于OpenStack Helm部署Grafana 203



    9.4 本章小结 204



    第10章 Docker容器监控 205



    10.1 Docker容器架构与监控 205



    10.1.1 Docker容器架构 205



    10
查看详情
12
您可能感兴趣 / 更多
Prometheus监控技术与实践
Ansible自动化运维:技术与佳实践
陈金窗、沈灿、刘政委 著