SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈

SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
2023-12
版次: 1
ISBN: 9787111738923
定价: 139.00
装帧: 其他
开本: 16开
纸张: 胶版纸
页数: 328页
字数: 412千字
  • 本书提供了一套实用的方法和工具,帮助读者更好地理解、设定和管理SLO。书中主要介绍了SLO的基本概念、设计过程、实施方法及相关案例研究。作者不仅解释了SLO的重要性,以及为什么在现代IT环境中需要它们,详细阐述了SLO的定义、类型和级别,以及如何将它们与业务目标相结合,而且详细介绍了设计SLO的过程,包括需求收集、目标设定、指标选择、约束条件设定等步骤,旨在确保SLO既符合业务需求,又具有可度量性和可操作性,同时提供了一些实用的方法和工具,帮助读者有效地实施和管理SLO,包括使用监控工具、定期审查和调整SLO等。此外,书中还包含了一系列实际案例研究,展示了如何将SLO应用于不同的场景和环境。这些案例可以帮助读者更好地理解SLO的实际应用价值。 Alex Hidalgo是一名站点可靠性工程师,也是SLO相关领域的专家。他先后担任过网络工程师、安全工程师和系统管理员等多个职务,并在IT支持领域积累了丰富的经验。在Google工作期间,Alex在SRE(站点可靠性工程)方面表现出色,之后他加入了Squarespace,致力于在公司内部和整个行业推广基于SLO的服务可靠性方法的理念。他是 Coursera Google IT Professional Certification的主要开发人员之一,还是教育家、作家和演讲者。 目录

    序1

    前言3

    第一部分 SLO开发11

    第1章 可靠性栈13

    1.1 服务的真理14

    1.2 可靠性栈概述14

    1.3 什么是服务19

    1.4 要记住的事情22

    1.5 总结23

    第2章 如何看待可靠性25

    2.1 可靠性工程25

    2.2 过去的性能和你的用户26

    2.3 服务应该有多可靠29

    2.4 总结33

    第3章 制定有意义的SLI35

    3.1 有意义的SLI能提供什么36

    3.2 很多事情需要关心38

    3.3 更复杂的东西41

    3.4 总结46

    第4章 选择好的SLO47

    4.1 可靠性目标47

    4.2 服务依赖项和组件51

    4.3 你依赖的服务的可靠性55

    4.4 选择目标57

    4.5 总结65

    第5章 如何使用错误预算66

    5.1 错误预算实践66

    5.2 错误预算的度量74

    5.3 总结86

    第二部分 SLO实现87

    第6章 获得认同89

    6.1 工程不只是代码89

    6.2 主要利益相关者90

    6.3 行动起来94

    6.4 惨痛的教训100

    6.5 总结101

    第7章 度量SLI和SLO 102

    7.1 设计目标102

    7.2 通用结构104

    7.3 常见案例111

    7.4 一般案例114

    7.5 其他注意事项115

    7.6 总结116

    第8章 SLO监控和告警117

    8.1 动机:SLO告警是什么,为什么要这样做117

    8.2 如何进行SLO告警125

    8.3 剥离建议134

    8.4 总结135

    第9章 用于SLI和SLO的概率论与统计学136

    9.1 概率论137

    9.2 统计学154

    9.3 SLI示例:持久性179

    9.4 延伸阅读182

    9.5 总结183

    第10章 可靠性架构184

    10.1 示例系统:图像服务186

    10.2 架构考虑:重新审视硬件196

    10.3 SLO作为系统SLI的结果 196

    10.4 识别和理解依赖项的重要性 197

    10.5 总结198

    第11章 数据可靠性199

    11.1 数据服务199

    11.2数据服务的用户201

    11.3 设定可度量的数据目标 201

    11.4 系统设计关注点219

    11.5 数据沿袭221

    11.6 总结221

    第12章 有效案例223

    12.1 给小狗穿衣服223

    12.2 将SLI 和SLO 作为用户旅程226

    12.3 总结238

    第三部分 SLO文化239

    第13章 打造SLO文化241

    13.1 没有SLO的文化241

    13.2 文化转变策略242

    13.3 通往SLO文化的路径243

    13.4 总结252

    第14章 SLO演进253

    14.1 SLO起始254

    14.2 使用方式的变化255

    14.3 依赖项的变化258

    14.4 故障引起的变化260

    14.5 用户期望和需求的变化261

    14.6 工具的变化262

    14.7 基于直觉的变化263

    14.8 制定理想的SLO264

    14.9 识别不正确的SLO264

    14.10 如何改变SLO265

    14.11 总结266

    第15章 可发现和可理解的SLO267

    15.1 可理解性267

    15.2 可发现性273

    15.3 总结277

    第16章 SLO倡导278

    16.1 起步阶段280

    16.2 推广阶段286

    16.3 扩张阶段289

    16.4 总结291

    第17章 可靠性报告292

    17.1 基本报告292

    17.2 高级报告302

    17.3 总结304

    附录A SLO定义模板305

    附录B 第9章的证明308
  • 内容简介:
    本书提供了一套实用的方法和工具,帮助读者更好地理解、设定和管理SLO。书中主要介绍了SLO的基本概念、设计过程、实施方法及相关案例研究。作者不仅解释了SLO的重要性,以及为什么在现代IT环境中需要它们,详细阐述了SLO的定义、类型和级别,以及如何将它们与业务目标相结合,而且详细介绍了设计SLO的过程,包括需求收集、目标设定、指标选择、约束条件设定等步骤,旨在确保SLO既符合业务需求,又具有可度量性和可操作性,同时提供了一些实用的方法和工具,帮助读者有效地实施和管理SLO,包括使用监控工具、定期审查和调整SLO等。此外,书中还包含了一系列实际案例研究,展示了如何将SLO应用于不同的场景和环境。这些案例可以帮助读者更好地理解SLO的实际应用价值。
  • 作者简介:
    Alex Hidalgo是一名站点可靠性工程师,也是SLO相关领域的专家。他先后担任过网络工程师、安全工程师和系统管理员等多个职务,并在IT支持领域积累了丰富的经验。在Google工作期间,Alex在SRE(站点可靠性工程)方面表现出色,之后他加入了Squarespace,致力于在公司内部和整个行业推广基于SLO的服务可靠性方法的理念。他是 Coursera Google IT Professional Certification的主要开发人员之一,还是教育家、作家和演讲者。
  • 目录:
    目录

    序1

    前言3

    第一部分 SLO开发11

    第1章 可靠性栈13

    1.1 服务的真理14

    1.2 可靠性栈概述14

    1.3 什么是服务19

    1.4 要记住的事情22

    1.5 总结23

    第2章 如何看待可靠性25

    2.1 可靠性工程25

    2.2 过去的性能和你的用户26

    2.3 服务应该有多可靠29

    2.4 总结33

    第3章 制定有意义的SLI35

    3.1 有意义的SLI能提供什么36

    3.2 很多事情需要关心38

    3.3 更复杂的东西41

    3.4 总结46

    第4章 选择好的SLO47

    4.1 可靠性目标47

    4.2 服务依赖项和组件51

    4.3 你依赖的服务的可靠性55

    4.4 选择目标57

    4.5 总结65

    第5章 如何使用错误预算66

    5.1 错误预算实践66

    5.2 错误预算的度量74

    5.3 总结86

    第二部分 SLO实现87

    第6章 获得认同89

    6.1 工程不只是代码89

    6.2 主要利益相关者90

    6.3 行动起来94

    6.4 惨痛的教训100

    6.5 总结101

    第7章 度量SLI和SLO 102

    7.1 设计目标102

    7.2 通用结构104

    7.3 常见案例111

    7.4 一般案例114

    7.5 其他注意事项115

    7.6 总结116

    第8章 SLO监控和告警117

    8.1 动机:SLO告警是什么,为什么要这样做117

    8.2 如何进行SLO告警125

    8.3 剥离建议134

    8.4 总结135

    第9章 用于SLI和SLO的概率论与统计学136

    9.1 概率论137

    9.2 统计学154

    9.3 SLI示例:持久性179

    9.4 延伸阅读182

    9.5 总结183

    第10章 可靠性架构184

    10.1 示例系统:图像服务186

    10.2 架构考虑:重新审视硬件196

    10.3 SLO作为系统SLI的结果 196

    10.4 识别和理解依赖项的重要性 197

    10.5 总结198

    第11章 数据可靠性199

    11.1 数据服务199

    11.2数据服务的用户201

    11.3 设定可度量的数据目标 201

    11.4 系统设计关注点219

    11.5 数据沿袭221

    11.6 总结221

    第12章 有效案例223

    12.1 给小狗穿衣服223

    12.2 将SLI 和SLO 作为用户旅程226

    12.3 总结238

    第三部分 SLO文化239

    第13章 打造SLO文化241

    13.1 没有SLO的文化241

    13.2 文化转变策略242

    13.3 通往SLO文化的路径243

    13.4 总结252

    第14章 SLO演进253

    14.1 SLO起始254

    14.2 使用方式的变化255

    14.3 依赖项的变化258

    14.4 故障引起的变化260

    14.5 用户期望和需求的变化261

    14.6 工具的变化262

    14.7 基于直觉的变化263

    14.8 制定理想的SLO264

    14.9 识别不正确的SLO264

    14.10 如何改变SLO265

    14.11 总结266

    第15章 可发现和可理解的SLO267

    15.1 可理解性267

    15.2 可发现性273

    15.3 总结277

    第16章 SLO倡导278

    16.1 起步阶段280

    16.2 推广阶段286

    16.3 扩张阶段289

    16.4 总结291

    第17章 可靠性报告292

    17.1 基本报告292

    17.2 高级报告302

    17.3 总结304

    附录A SLO定义模板305

    附录B 第9章的证明308
查看详情
12
相关图书 / 更多
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLUMGIRL DREAMING : My Journey to the Stars
with Anne Berthod and Divya Dugar 著;Rubina Ali
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLAM DUNK スラムダンク 完全版(21)
井上 雄彦
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLAM DUNK スラムダンク 完全版(1)
井上 雄彦
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLAM DUNK スラムダンク 完全版(4)
井上 雄彦
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLR测量及其应用
王小亚;胡小工;赵春梅;邵璠;杨昊
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL201-2015江河流域规划编制规程
中国水利水电出版社 编
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL25-2006DesignSpecificationforStoneMasonryDam
中华人民共和国水利部 著
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL551-2012TechnicalSpecificationforEmbankmentDamSafet
中华人民共和国水利部 编
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL251-2015水利水电工程天然建筑材料勘察规程(英文版)
中华人民共和国水利部 编
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL 58-2014 Specification for Geodesic Survey in Hydrology(水文测量规范英文版)
中华人民共和国水利部 著
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SLAM DUNK スラムダンク 完全版(18)
井上 雄彦
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
SL618-2013 Code for Preparing Feasibility Study Report of Water and Hydropower Projects (水利水电工程可行性研究报告编制规程 英文版)
中华人民共和国水利部 发布
您可能感兴趣 / 更多
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
猎物《纽约时报》畅销书作者史黛西·威林厄姆 Goodreads年度悬疑惊悚小说 LibraryReads月度值得关注图书
[美]史黛西·威林厄姆著
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
纳博科夫短篇小说全集(纳博科夫精选集V)
[美]弗拉基米尔·纳博科夫著
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
你和我真的太像啦!(奇想国童书)
[美]安妮·拜罗斯/著;
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
海外中国研究·寻找六边形:中国农村的市场和社会结构(海外中国研究丛书精选版第四辑)
[美]施坚雅 著;徐秀丽 译;史建云
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
杰出投资者的底层认知:成功投资与明智创富的10个茅塞顿开之问(《聪明的投资者》新时代精华版)
[美]J.戴维·斯坦恩(J.David Stein) 著;刘寅龙 译;庞鑫
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
巴菲特致管理者的信:价值投资和公司治理经典教程(如实呈现从未发表的巴菲特致运通公司原始信件)
[美]杰夫·格拉姆(Jeff Gramm) 著;路本福 译;陈祺祺
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
德川时代的宗教
[美]罗伯特·N.贝拉 著
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
小屁孩日记(平装双语版)35-36奶狗肠大作战和一日校长记 全2册
[美]杰夫·金尼(Jeff Kinney)
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
洛丽塔原型:小说《洛丽塔》背后的萨莉?霍纳绑架案
[美]萨拉·魏恩曼 著;真故图书 出品
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
鸡蛋的胜利和其他故事(安德森教科书级别的短篇典范,一枚鸡蛋引发的“美国梦”的幻灭!)
[美]舍伍德·安德森
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
拖延心理学:从心理学的角度看拖延,跨越“想做”与“做”的鸿沟,赢回内驱力、专注力、执行力!
[美]海登·芬奇 著;张紫钰 译;斯坦威 出品
SLO与SLI:软件可靠性实践指南 [美]亚历克斯·伊达尔戈
治疗性催眠的本质(艾瑞克森催眠治疗大典)
[美]Milton H. Erickson(美) Ernest L. Rossi(美) Roxanna Erickson-Klein