监控运维实践 原则与策略

监控运维实践 原则与策略
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] (Mike Julian)
2020-11
版次: 1
ISBN: 9787115550750
定价: 59.00
装帧: 其他
开本: 其他
纸张: 胶版纸
页数: 122页
17人买过
  • 本书围绕监控这个庞大而复杂的主题,从其原则和策略入手,详细介绍了监控系统的组成、日志和告警的适用范围、有关构建监控平台的可靠建议,以及监控背后的原理和基本机制等一些实用信息,你可以在任何工具中去实践这些内容。更为重要的是,本书还为你的公司设计和实现健壮的监控基础提供了直接的战略和策略。 迈克·朱利安(Mike Julian),Duckbill Group CEO,应用程序和基础设施监控顾问,在线出版物Monitoring Weekly主编。曾在Taos Consulting、Peak Hosting、美国橡树岭国家实验室等机构担任运营 DevOps工程师。

    【译者介绍】

    王作佳,长期从事通信行业数据库运维工作,曾参与翻译《Oracle性能诊断艺术(第2版)》一书。拥抱开源,支持数据库软件国产化。

    孙浩文,现任职于中国联合网络通信有限公司吉林省分公司,正高级工程师、联通IT专家人才,主要从事信息系统规划管理、项目管理、成本管理、运维管理、网络信息安全管理等工作。 前言 xiii

    第一部分 监控的原则

    第 1 章 监控反模式 3

    1.1 反模式1:沉迷工具 3

    1.1.1 监控是多个复杂问题的总称 4

    1.1.2 避免对工具船货崇拜 6

    1.1.3 有时候,你确实需要自己创建工具 7

    1.1.4 单一窗口只是个神话 7

    1.2 反模式2:监控岗位化 7

    1.3 反模式3:复选框式监控 8

    1.3.1 “正常运行”的真正含义是什么?答案就是监控 9

    1.3.2 对告警来说,操作系统指标不是很有用 9

    1.3.3 增加收集指标数据的频率 9

    1.4 反模式4:把监控当作拐杖 10

    1.5 反模式5:手动配置 10

    1.6 小结 11

    第 2 章 监控设计模式 13

    2.1 设计模式1:可组合监控 13

    2.2 设计模式2:从用户角度监控 20

    2.3 设计模式3:购买,不要构建 21

    2.3.1 这样更省钱 22

    2.3.2 你(可能)不是一个设计这些工具的专家 23

    2.3.3 SaaS允许你关注公司的产品 23

    2.3.4 不,是真的,SaaS实际上更好 23

    2.4 设计模式4:持续改善 24

    2.5 小结 24

    第 3 章 告警、待命值班以及事件管理 25

    3.1 怎样才能创建优秀的告警 26

    3.1.1 停止使用电子邮件发送告警 26

    3.1.2 撰写运行手册 27

    3.1.3 任意的静态阈值不是唯一的方法 28

    3.1.4 删除告警和优化告警 28

    3.1.5 使用维护周期 29

    3.1.6 优先尝试自动修复 29

    3.2 待命值班 30

    3.2.1 修正假警报 30

    3.2.2 减少不必要的救火 31

    3.2.3 制定更好的待命值班周期 31

    3.3 事件管理 33

    3.4 事后分析 35

    3.5 小结 35

    第 4 章 统计入门 37

    4.1 在系统运行统计之前 37

    4.2 数学来拯救 38

    4.3 统计不是魔法 38

    4.4 平均值和平均数 39

    4.5 中位数 40

    4.6 季节效应 41

    4.7 分位数 41

    4.8 标准差 42

    4.9 小结 43

    第二部分 监控的策略

    第 5 章 监控业务 47

    5.1 业务KPI 47

    5.2 两个真实的案例 49

    5.2.1 Yelp 50

    5.2.2 Reddit 50

    5.3 将业务KPI与技术指标绑定 51

    5.4 应用程序没有提供这些指标 52

    5.5 找到公司的业务KPI 52

    5.6 小结 53

    第 6 章 前端监控 55

    6.1 一个慢应用的代价 56

    6.2 前端监控的两种方法 57

    6.3 文档对象模型 57

    6.3.1 前端性能指标 58

    6.3.2 这很棒,但是我要怎么使用呢 60

    6.4 日志 61

    6.5 合成监控 61

    6.6 小结 62

    第 7 章 应用程序监控 63

    7.1 用指标衡量应用程序 63

    7.2 监控构建和发布管道 66

    7.3 health端点模式 67

    7.4 应用程序日志 71

    7.4.1 等等……我应该有一个指标或日志条目吗 72

    7.4.2 应该给什么记录日志 72

    7.4.3 写入磁盘还是写入网络 73

    7.5 Serverless FaaS(函数即服务) 73

    7.6 监控微服务架构 74

    7.7 小结 76

    第 8 章 服务器监控 77

    8.1 标准操作系统指标 77

    8.1.1 CPU 78

    8.1.2 内存 78

    8.1.3 网络 79

    8.1.4 磁盘 79

    8.1.5 负载 80

    8.2 SSL证书 81

    8.3 SNMP 81

    8.4 Web服务器 82

    8.5 数据库服务器 83

    8.6 负载均衡器 84

    8.7 消息队列 84

    8.8 缓存 84

    8.9 DNS 85

    8.10 NTP 85

    8.11 其他企业基础设施 86

    8.11.1 DHCP 86

    8.11.2 SMTP 86

    8.12 监控定时任务 87

    8.13 记录日志 88

    8.13.1 采集 88

    8.13.2 存储 89

    8.13.3 分析 89

    8.14 小结 90

    第 9 章 网络监控 91

    9.1 SNMP之痛 92

    9.1.1 什么是SNMP 92

    9.1.2 它的工作原理是什么 92

    9.1.3 关于安全的一点建议 94

    9.1.4 如何使用SNMP 94

    9.1.5 接口指标 97

    9.1.6 接口和日志 99

    9.1.7 要点总结 99

    9.2 配置跟踪 99

    9.3 语音和视频 99

    9.4 路由 100

    9.5 生成树协议(STP) 101

    9.6 机架 101

    9.6.1 CPU和内存 101

    9.6.2 硬件 101

    9.7 流监控 102

    9.8 容量规划 103

    9.8.1 倒推 103

    9.8.2 预测 103

    9.9 小结 104

    第 10 章 安全监控 105

    10.1 监控和合规 106

    10.2 用户、命令以及文件系统审计 107

    10.2.1 配置并运行auditd 107

    10.2.2 auditd和远端日志 108

    10.3 主机入侵检测系统 108

    10.4 rkhunter 109

    10.5 网络入侵检测系统 110

    10.6 小结 111

    第 11 章 监控评估 113

    11.1 业务KPI 113

    11.2 前端监控 114

    11.3 应用程序和服务器监控 114

    11.4 安全监控 116

    11.5 告警 116

    11.6 小结 116

    附录A 运行手册示例:一个演示应用程序 117

    附录B 可用性表格 121

    作者介绍 122

    封面介绍 122
  • 内容简介:
    本书围绕监控这个庞大而复杂的主题,从其原则和策略入手,详细介绍了监控系统的组成、日志和告警的适用范围、有关构建监控平台的可靠建议,以及监控背后的原理和基本机制等一些实用信息,你可以在任何工具中去实践这些内容。更为重要的是,本书还为你的公司设计和实现健壮的监控基础提供了直接的战略和策略。
  • 作者简介:
    迈克·朱利安(Mike Julian),Duckbill Group CEO,应用程序和基础设施监控顾问,在线出版物Monitoring Weekly主编。曾在Taos Consulting、Peak Hosting、美国橡树岭国家实验室等机构担任运营 DevOps工程师。

    【译者介绍】

    王作佳,长期从事通信行业数据库运维工作,曾参与翻译《Oracle性能诊断艺术(第2版)》一书。拥抱开源,支持数据库软件国产化。

    孙浩文,现任职于中国联合网络通信有限公司吉林省分公司,正高级工程师、联通IT专家人才,主要从事信息系统规划管理、项目管理、成本管理、运维管理、网络信息安全管理等工作。
  • 目录:
    前言 xiii

    第一部分 监控的原则

    第 1 章 监控反模式 3

    1.1 反模式1:沉迷工具 3

    1.1.1 监控是多个复杂问题的总称 4

    1.1.2 避免对工具船货崇拜 6

    1.1.3 有时候,你确实需要自己创建工具 7

    1.1.4 单一窗口只是个神话 7

    1.2 反模式2:监控岗位化 7

    1.3 反模式3:复选框式监控 8

    1.3.1 “正常运行”的真正含义是什么?答案就是监控 9

    1.3.2 对告警来说,操作系统指标不是很有用 9

    1.3.3 增加收集指标数据的频率 9

    1.4 反模式4:把监控当作拐杖 10

    1.5 反模式5:手动配置 10

    1.6 小结 11

    第 2 章 监控设计模式 13

    2.1 设计模式1:可组合监控 13

    2.2 设计模式2:从用户角度监控 20

    2.3 设计模式3:购买,不要构建 21

    2.3.1 这样更省钱 22

    2.3.2 你(可能)不是一个设计这些工具的专家 23

    2.3.3 SaaS允许你关注公司的产品 23

    2.3.4 不,是真的,SaaS实际上更好 23

    2.4 设计模式4:持续改善 24

    2.5 小结 24

    第 3 章 告警、待命值班以及事件管理 25

    3.1 怎样才能创建优秀的告警 26

    3.1.1 停止使用电子邮件发送告警 26

    3.1.2 撰写运行手册 27

    3.1.3 任意的静态阈值不是唯一的方法 28

    3.1.4 删除告警和优化告警 28

    3.1.5 使用维护周期 29

    3.1.6 优先尝试自动修复 29

    3.2 待命值班 30

    3.2.1 修正假警报 30

    3.2.2 减少不必要的救火 31

    3.2.3 制定更好的待命值班周期 31

    3.3 事件管理 33

    3.4 事后分析 35

    3.5 小结 35

    第 4 章 统计入门 37

    4.1 在系统运行统计之前 37

    4.2 数学来拯救 38

    4.3 统计不是魔法 38

    4.4 平均值和平均数 39

    4.5 中位数 40

    4.6 季节效应 41

    4.7 分位数 41

    4.8 标准差 42

    4.9 小结 43

    第二部分 监控的策略

    第 5 章 监控业务 47

    5.1 业务KPI 47

    5.2 两个真实的案例 49

    5.2.1 Yelp 50

    5.2.2 Reddit 50

    5.3 将业务KPI与技术指标绑定 51

    5.4 应用程序没有提供这些指标 52

    5.5 找到公司的业务KPI 52

    5.6 小结 53

    第 6 章 前端监控 55

    6.1 一个慢应用的代价 56

    6.2 前端监控的两种方法 57

    6.3 文档对象模型 57

    6.3.1 前端性能指标 58

    6.3.2 这很棒,但是我要怎么使用呢 60

    6.4 日志 61

    6.5 合成监控 61

    6.6 小结 62

    第 7 章 应用程序监控 63

    7.1 用指标衡量应用程序 63

    7.2 监控构建和发布管道 66

    7.3 health端点模式 67

    7.4 应用程序日志 71

    7.4.1 等等……我应该有一个指标或日志条目吗 72

    7.4.2 应该给什么记录日志 72

    7.4.3 写入磁盘还是写入网络 73

    7.5 Serverless FaaS(函数即服务) 73

    7.6 监控微服务架构 74

    7.7 小结 76

    第 8 章 服务器监控 77

    8.1 标准操作系统指标 77

    8.1.1 CPU 78

    8.1.2 内存 78

    8.1.3 网络 79

    8.1.4 磁盘 79

    8.1.5 负载 80

    8.2 SSL证书 81

    8.3 SNMP 81

    8.4 Web服务器 82

    8.5 数据库服务器 83

    8.6 负载均衡器 84

    8.7 消息队列 84

    8.8 缓存 84

    8.9 DNS 85

    8.10 NTP 85

    8.11 其他企业基础设施 86

    8.11.1 DHCP 86

    8.11.2 SMTP 86

    8.12 监控定时任务 87

    8.13 记录日志 88

    8.13.1 采集 88

    8.13.2 存储 89

    8.13.3 分析 89

    8.14 小结 90

    第 9 章 网络监控 91

    9.1 SNMP之痛 92

    9.1.1 什么是SNMP 92

    9.1.2 它的工作原理是什么 92

    9.1.3 关于安全的一点建议 94

    9.1.4 如何使用SNMP 94

    9.1.5 接口指标 97

    9.1.6 接口和日志 99

    9.1.7 要点总结 99

    9.2 配置跟踪 99

    9.3 语音和视频 99

    9.4 路由 100

    9.5 生成树协议(STP) 101

    9.6 机架 101

    9.6.1 CPU和内存 101

    9.6.2 硬件 101

    9.7 流监控 102

    9.8 容量规划 103

    9.8.1 倒推 103

    9.8.2 预测 103

    9.9 小结 104

    第 10 章 安全监控 105

    10.1 监控和合规 106

    10.2 用户、命令以及文件系统审计 107

    10.2.1 配置并运行auditd 107

    10.2.2 auditd和远端日志 108

    10.3 主机入侵检测系统 108

    10.4 rkhunter 109

    10.5 网络入侵检测系统 110

    10.6 小结 111

    第 11 章 监控评估 113

    11.1 业务KPI 113

    11.2 前端监控 114

    11.3 应用程序和服务器监控 114

    11.4 安全监控 116

    11.5 告警 116

    11.6 小结 116

    附录A 运行手册示例:一个演示应用程序 117

    附录B 可用性表格 121

    作者介绍 122

    封面介绍 122
查看详情
您可能感兴趣 / 更多
监控运维实践 原则与策略
归属感:如何通过社群获得商业竞争优势
[美]大卫·斯平克斯(David Spinks) 著;颉腾文化 出品
监控运维实践 原则与策略
《世界上最大的肚子》2024百班千人暑期书目学前中班名师推荐全新正版现货速发
[美]雷米·查利普(美)柏顿·萨普瑞
监控运维实践 原则与策略
经济学通义
[美]阿门·A.阿尔钦 (美)威廉·R.艾伦 著;[美]杰里·L.乔丹 编
监控运维实践 原则与策略
数字化领导力 数字化转型锦囊,领导力精进指南 一本书掌握数字化转型领导力之道
[美]艾萨克·萨科里克 著;王磊 译;颉腾文化 出品;邓斌
监控运维实践 原则与策略
法哲学基本原理
[美]马克·C.墨菲
监控运维实践 原则与策略
雪花的故事(用照片展示雪花的秘密,为你揭开冬日奇景的奥秘)
[美]马克·卡西诺[美]乔恩·尼尔森
监控运维实践 原则与策略
杜甫传
[美]弗洛伦斯.艾思柯
监控运维实践 原则与策略
神奇的数字零:从数字0开始的极简数学史和人类发展史
[美]查尔斯·塞弗(Charles Seife)著 杨杨立汝 译
监控运维实践 原则与策略
美利坚在燃烧:20世纪60年代以来的警察暴力与黑人反抗
[美]伊丽莎白·欣顿 著 胡位钧 译
监控运维实践 原则与策略
温柔亲启
[美]艾米莉·狄金森 著;[美]艾伦·路易斯·哈特、[美]玛莎·内尔·史密斯 编
监控运维实践 原则与策略
儒教中国及其现代命运(三部曲)
[美]列文森 作者;[中]季剑青 译者
监控运维实践 原则与策略
逃家小兔成长绘本系列
[美]玛格丽特.怀兹.布朗