SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈

SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
2023-12
版次: 1
ISBN: 9787111738923
定价: 139.00
装帧: 其他
开本: 16开
纸张: 胶版纸
页数: 328页
字数: 412千字
  • 本书提供了一套实用的方法和工具,帮助读者更好地理解、设定和管理SLO。书中主要介绍了SLO的基本概念、设计过程、实施方法及相关案例研究。作者不仅解释了SLO的重要性,以及为什么在现代IT环境中需要它们,详细阐述了SLO的定义、类型和级别,以及如何将它们与业务目标相结合,而且详细介绍了设计SLO的过程,包括需求收集、目标设定、指标选择、约束条件设定等步骤,旨在确保SLO既符合业务需求,又具有可度量性和可操作性,同时提供了一些实用的方法和工具,帮助读者有效地实施和管理SLO,包括使用监控工具、定期审查和调整SLO等。此外,书中还包含了一系列实际案例研究,展示了如何将SLO应用于不同的场景和环境。这些案例可以帮助读者更好地理解SLO的实际应用价值。 Alex Hidalgo是一名站点可靠性工程师,也是SLO相关领域的专家。他先后担任过网络工程师、安全工程师和系统管理员等多个职务,并在IT支持领域积累了丰富的经验。在Google工作期间,Alex在SRE(站点可靠性工程)方面表现出色,之后他加入了Squarespace,致力于在公司内部和整个行业推广基于SLO的服务可靠性方法的理念。他是 Coursera Google IT Professional Certification的主要开发人员之一,还是教育家、作家和演讲者。 目录

    序1

    前言3

    第一部分 SLO开发11

    第1章 可靠性栈13

    1.1 服务的真理14

    1.2 可靠性栈概述14

    1.3 什么是服务19

    1.4 要记住的事情22

    1.5 总结23

    第2章 如何看待可靠性25

    2.1 可靠性工程25

    2.2 过去的性能和你的用户26

    2.3 服务应该有多可靠29

    2.4 总结33

    第3章 制定有意义的SLI35

    3.1 有意义的SLI能提供什么36

    3.2 很多事情需要关心38

    3.3 更复杂的东西41

    3.4 总结46

    第4章 选择好的SLO47

    4.1 可靠性目标47

    4.2 服务依赖项和组件51

    4.3 你依赖的服务的可靠性55

    4.4 选择目标57

    4.5 总结65

    第5章 如何使用错误预算66

    5.1 错误预算实践66

    5.2 错误预算的度量74

    5.3 总结86

    第二部分 SLO实现87

    第6章 获得认同89

    6.1 工程不只是代码89

    6.2 主要利益相关者90

    6.3 行动起来94

    6.4 惨痛的教训100

    6.5 总结101

    第7章 度量SLI和SLO 102

    7.1 设计目标102

    7.2 通用结构104

    7.3 常见案例111

    7.4 一般案例114

    7.5 其他注意事项115

    7.6 总结116

    第8章 SLO监控和告警117

    8.1 动机:SLO告警是什么,为什么要这样做117

    8.2 如何进行SLO告警125

    8.3 剥离建议134

    8.4 总结135

    第9章 用于SLI和SLO的概率论与统计学136

    9.1 概率论137

    9.2 统计学154

    9.3 SLI示例:持久性179

    9.4 延伸阅读182

    9.5 总结183

    第10章 可靠性架构184

    10.1 示例系统:图像服务186

    10.2 架构考虑:重新审视硬件196

    10.3 SLO作为系统SLI的结果 196

    10.4 识别和理解依赖项的重要性 197

    10.5 总结198

    第11章 数据可靠性199

    11.1 数据服务199

    11.2数据服务的用户201

    11.3 设定可度量的数据目标 201

    11.4 系统设计关注点219

    11.5 数据沿袭221

    11.6 总结221

    第12章 有效案例223

    12.1 给小狗穿衣服223

    12.2 将SLI 和SLO 作为用户旅程226

    12.3 总结238

    第三部分 SLO文化239

    第13章 打造SLO文化241

    13.1 没有SLO的文化241

    13.2 文化转变策略242

    13.3 通往SLO文化的路径243

    13.4 总结252

    第14章 SLO演进253

    14.1 SLO起始254

    14.2 使用方式的变化255

    14.3 依赖项的变化258

    14.4 故障引起的变化260

    14.5 用户期望和需求的变化261

    14.6 工具的变化262

    14.7 基于直觉的变化263

    14.8 制定理想的SLO264

    14.9 识别不正确的SLO264

    14.10 如何改变SLO265

    14.11 总结266

    第15章 可发现和可理解的SLO267

    15.1 可理解性267

    15.2 可发现性273

    15.3 总结277

    第16章 SLO倡导278

    16.1 起步阶段280

    16.2 推广阶段286

    16.3 扩张阶段289

    16.4 总结291

    第17章 可靠性报告292

    17.1 基本报告292

    17.2 高级报告302

    17.3 总结304

    附录A SLO定义模板305

    附录B 第9章的证明308
  • 内容简介:
    本书提供了一套实用的方法和工具,帮助读者更好地理解、设定和管理SLO。书中主要介绍了SLO的基本概念、设计过程、实施方法及相关案例研究。作者不仅解释了SLO的重要性,以及为什么在现代IT环境中需要它们,详细阐述了SLO的定义、类型和级别,以及如何将它们与业务目标相结合,而且详细介绍了设计SLO的过程,包括需求收集、目标设定、指标选择、约束条件设定等步骤,旨在确保SLO既符合业务需求,又具有可度量性和可操作性,同时提供了一些实用的方法和工具,帮助读者有效地实施和管理SLO,包括使用监控工具、定期审查和调整SLO等。此外,书中还包含了一系列实际案例研究,展示了如何将SLO应用于不同的场景和环境。这些案例可以帮助读者更好地理解SLO的实际应用价值。
  • 作者简介:
    Alex Hidalgo是一名站点可靠性工程师,也是SLO相关领域的专家。他先后担任过网络工程师、安全工程师和系统管理员等多个职务,并在IT支持领域积累了丰富的经验。在Google工作期间,Alex在SRE(站点可靠性工程)方面表现出色,之后他加入了Squarespace,致力于在公司内部和整个行业推广基于SLO的服务可靠性方法的理念。他是 Coursera Google IT Professional Certification的主要开发人员之一,还是教育家、作家和演讲者。
  • 目录:
    目录

    序1

    前言3

    第一部分 SLO开发11

    第1章 可靠性栈13

    1.1 服务的真理14

    1.2 可靠性栈概述14

    1.3 什么是服务19

    1.4 要记住的事情22

    1.5 总结23

    第2章 如何看待可靠性25

    2.1 可靠性工程25

    2.2 过去的性能和你的用户26

    2.3 服务应该有多可靠29

    2.4 总结33

    第3章 制定有意义的SLI35

    3.1 有意义的SLI能提供什么36

    3.2 很多事情需要关心38

    3.3 更复杂的东西41

    3.4 总结46

    第4章 选择好的SLO47

    4.1 可靠性目标47

    4.2 服务依赖项和组件51

    4.3 你依赖的服务的可靠性55

    4.4 选择目标57

    4.5 总结65

    第5章 如何使用错误预算66

    5.1 错误预算实践66

    5.2 错误预算的度量74

    5.3 总结86

    第二部分 SLO实现87

    第6章 获得认同89

    6.1 工程不只是代码89

    6.2 主要利益相关者90

    6.3 行动起来94

    6.4 惨痛的教训100

    6.5 总结101

    第7章 度量SLI和SLO 102

    7.1 设计目标102

    7.2 通用结构104

    7.3 常见案例111

    7.4 一般案例114

    7.5 其他注意事项115

    7.6 总结116

    第8章 SLO监控和告警117

    8.1 动机:SLO告警是什么,为什么要这样做117

    8.2 如何进行SLO告警125

    8.3 剥离建议134

    8.4 总结135

    第9章 用于SLI和SLO的概率论与统计学136

    9.1 概率论137

    9.2 统计学154

    9.3 SLI示例:持久性179

    9.4 延伸阅读182

    9.5 总结183

    第10章 可靠性架构184

    10.1 示例系统:图像服务186

    10.2 架构考虑:重新审视硬件196

    10.3 SLO作为系统SLI的结果 196

    10.4 识别和理解依赖项的重要性 197

    10.5 总结198

    第11章 数据可靠性199

    11.1 数据服务199

    11.2数据服务的用户201

    11.3 设定可度量的数据目标 201

    11.4 系统设计关注点219

    11.5 数据沿袭221

    11.6 总结221

    第12章 有效案例223

    12.1 给小狗穿衣服223

    12.2 将SLI 和SLO 作为用户旅程226

    12.3 总结238

    第三部分 SLO文化239

    第13章 打造SLO文化241

    13.1 没有SLO的文化241

    13.2 文化转变策略242

    13.3 通往SLO文化的路径243

    13.4 总结252

    第14章 SLO演进253

    14.1 SLO起始254

    14.2 使用方式的变化255

    14.3 依赖项的变化258

    14.4 故障引起的变化260

    14.5 用户期望和需求的变化261

    14.6 工具的变化262

    14.7 基于直觉的变化263

    14.8 制定理想的SLO264

    14.9 识别不正确的SLO264

    14.10 如何改变SLO265

    14.11 总结266

    第15章 可发现和可理解的SLO267

    15.1 可理解性267

    15.2 可发现性273

    15.3 总结277

    第16章 SLO倡导278

    16.1 起步阶段280

    16.2 推广阶段286

    16.3 扩张阶段289

    16.4 总结291

    第17章 可靠性报告292

    17.1 基本报告292

    17.2 高级报告302

    17.3 总结304

    附录A SLO定义模板305

    附录B 第9章的证明308
查看详情
12
相关图书 / 更多
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLUMGIRL DREAMING : My Journey to the Stars
with Anne Berthod and Divya Dugar 著;Rubina Ali
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLAM DUNK スラムダンク 完全版(21)
井上 雄彦
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLAM DUNK スラムダンク 完全版(1)
井上 雄彦
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLAM DUNK スラムダンク 完全版(4)
井上 雄彦
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLR测量及其应用
王小亚;胡小工;赵春梅;邵璠;杨昊
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL201-2015江河流域规划编制规程
中国水利水电出版社 编
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL25-2006DesignSpecificationforStoneMasonryDam
中华人民共和国水利部 著
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL551-2012TechnicalSpecificationforEmbankmentDamSafet
中华人民共和国水利部 编
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL251-2015水利水电工程天然建筑材料勘察规程(英文版)
中华人民共和国水利部 编
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL 58-2014 Specification for Geodesic Survey in Hydrology(水文测量规范英文版)
中华人民共和国水利部 著
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLAM DUNK スラムダンク 完全版(18)
井上 雄彦
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL618-2013 Code for Preparing Feasibility Study Report of Water and Hydropower Projects (水利水电工程可行性研究报告编制规程 英文版)
中华人民共和国水利部 发布
您可能感兴趣 / 更多
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
有效地招聘:掌握面试策略、背景调查和入职培训 职场领导力提升系列丛书
[美],保罗·法尔科内(Paul,Falcone)
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
永生的海拉:划时代的癌细胞和时代洪流下的细胞主人一家 外国现当代文学 [美]丽贝卡·思科鲁特 新华正版
[美]丽贝卡·思科鲁特
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
火焰冰封的迷宫(经典福尔摩斯风格侦探小说!“千面人”侦探,邀你一起参与谜之真相的寻找!)
[美]托马斯·W.汉肖
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
憾动力
[美]丹尼尔·平克
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
进阶书系-思考,好与坏:如何用哲学拯救你的逻辑与理性
[美]史蒂文·纳德勒 [美]劳伦斯·夏皮罗
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
漫长的告别(雷蒙德·钱德勒无可争议的代表作,全新修订译本)
[美]雷蒙德·钱德勒
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
喜欢写作的女孩:简·奥斯丁如何找到自己的声音
[美]贾丝明·A.斯特林
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
丧钟为谁而鸣(是海明威广为流传的长篇代表之一,文学与历史的宿命相遇)
[美]欧内斯特·海明威
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
甲骨文丛书·常识:一部政治史
[美]索菲娅·罗森菲尔德
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
露莉的中国茶(一杯中国茶,建立起沟通的桥梁,为孩子打开看世界的眼光)
[美]陈郁如 著,[美]廉惠媛 绘,常立 黎亮 译 青豆书坊 出品
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
寂静的剧场:霍珀画谈(“眼与心”,美国普利策诗歌奖得主与桂冠诗人马克?斯特兰德谈论大画家霍珀)
[美] 马克?斯特兰德(Mark Strand) 著
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
狼王四部曲之二:21号狼的统治(《8号狼的崛起》重磅续集!黄石国家公园伟大的狼王21号的传奇故事!)
[美]瑞克·麦金提尔