未读消息消息

店铺

我的订单收藏

拍卖

拍卖交易我的竞拍收藏

我的好友资金账户

客服 |

帮助中心 9:00-20:30 在线留言

客服电话

010-89648155

服务时间

客服咨询 8:00-21:00

纠纷处理 9:00-21:00

图书审核 9:00-18:00

监督与建议

请选择

手机孔网

大数据处理之道

大数据处理之道

分享

作者: 何金池著

出版社: 电子工业出版社

出版时间: 2016-09

版次: 1

ISBN: 9787121287237

定价: 79.00

装帧: 平装

开本: 16开

纸张: 轻型纸

页数: 284页

字数: 341千字

正文语种: 简体中文

丛书: 大数据丛书

分类: 计算机与互联网

62人买过

　　本书覆盖了当前大数据处理领域的热门技术，包括Hadoop、Spark、Storm、Dremel、Drill等，详细分析了各种技术的应用场景和优缺点；同时阐述了大数据下的日志分析系统，重点讲解了ELK日志处理方案；最后分析了大数据处理技术的发展趋势。本书采用幽默的表述风格，使读者容易理解、轻松掌握；重点从各种技术的起源、设计思想、架构等方面阐述，以帮助读者从根源上悟出大数据处理之道。
0“疯狂”的大数据 1
0．1大数据时代 1
0．2数据就是“金库” 3
0．3让大数据“活”起来 4
第1篇Hadoop军营
1 Hadoop一石激起千层浪 7
1．1Hadoop诞生――不仅仅是玩具 7
1．2Hadoop发展――各路英雄集结 8
1．3Hadoop和它的小伙伴们 10
1．4Hadoop应用场景 12
1．5小结 13
2 MapReduce奠定基石 14
2．1MapReduce设计思想 14
2．2MapReduce运行机制 19
2．2．1MapReduce的组成 19
2．2．2MapReduce作业运行流程 20
2．2．3JobTracker解剖 26
2．2．4TaskTracker解剖 34
2．2．5失败场景分析 42
2．3MapReduce实例分析 43
2．3．1运行WordCount程序 44
2．3．2WordCount源码分析 45
2．4小结 48
3 分布式文件系统 49
3．1群雄并起的DFS 49
3．2HDFS文件系统 51
3．2．1HDFS 设计与架构 52
3．2．2HDFS 操作与API 56
3．2．3HDFS的优点及适用场景 60
3．2．4HDFS的缺点及改进策略 61
3．3小结 62
4 Hadoop体系的“四剑客” 63
4．1数据仓库工具Hive 63
4．1．1Hive缘起何处 63
4．1．2Hive和数据库的区别 65
4．1．3Hive设计思想与架构 66
4．1．4适用场景 74
4．2大数据仓库HBase 74
4．2．1HBase因何而生 74
4．2．2HBase的设计思想和架构 77
4．2．3HBase优化技巧 84
4．2．4HBase和Hive的区别 86
4．3Pig编程语言 87
4．3．1Pig的缘由 87
4．3．2Pig的基本架构 88
4．3．3Pig与Hive的对比 90
4．3．4Pig的执行模式 90
4．3．5Pig Latin语言及其应用 91
4．4协管员ZooKeeper 96
4．4．1ZooKeeper是什么 96
4．4．2ZooKeeper的作用 97
4．4．3ZooKeeper的架构 98
4．4．4ZooKeeper的数据模型 100
4．4．5ZooKeeper的常用接口及操作 102
4．4．6ZooKeeper的应用场景分析 105
4．5小结 108
5 Hadoop资源管理与调度 110
5．1Hadoop调度机制 110
5．1．1FIFO 111
5．1．2计算能力调度器 111
5．1．3公平调度器 113
5．2Hadoop YARN资源调度 114
5．2．1YARN产生的背景 114
5．2．2Hadoop YARN的架构 116
5．2．3YARN的运作流程 118
5．3Apache Mesos资源调度 120
5．3．1Apache Mesos的起因 120
5．3．2Apache Mesos的架构 121
5．3．3基于Mesos的Hadoop 123
5．4Mesos与YARN对比 127
5．5小结 128
6 Hadoop集群管理之道 129
6．1Hadoop 集群管理与维护 129
6．1．1Hadoop集群管理 129
6．1．2Hadoop集群维护 131
6．2Hadoop 集群调优 132
6．2．1Linux文件系统调优 132
6．2．2Hadoop通用参数调整 133
6．2．3HDFS相关配置 133
6．2．4MapReduce相关配置 134
6．2．5Map任务相关配置 136
6．2．6HBase搭建重要的HDFS参数 137
6．3Hadoop 集群监控 137
6．3．1Apache Ambari监控 137
6．3．2Ganglia监控Hadoop 138
6．4小结 138
第2篇Spark星火燎原
7 Spark宝刀出鞘 141
7．1Spark的历史渊源 141
7．1．1Spark的诞生 141
7．1．2Spark的发展 142
7．2Spark和Hadoop MapReduce对比 143
7．3Spark的适用场景 145
7．4Spark的硬件配置 146
7．5Spark架构 147
7．5．1Spark生态架构 147
7．5．2Spark运行架构 149
7．6小结 151
8 Spark核心RDD 153
8．1RDD简介 153
8．1．1什么是RDD 153
8．1．2为什么需要RDD 154
8．1．3RDD本体的设计 154
8．1．4RDD与分布式共享内存 155
8．2RDD的存储级别 155
8．3RDD依赖与容错 157
8．3．1RDD依赖关系 157
8．3．2RDD容错机制 160
8．4RDD操作与接口 161
8．4．1RDD Transformation操作与接口 162
8．4．2RDD Action操作与接口 164
8．5RDD编程示例 165
8．6小结 166
9 Spark运行模式和流程 167
9．1Spark运行模式 167
9．1．1Spark的运行模式列表 167
9．1．2Local模式 168
9．1．3Standalone模式 169
9．1．4Spark on Mesos模式 171
9．1．5Spark on YARN 模式 173
9．1．6Spark on EGO 模式 175
9．2Spark作业流程 177
9．2．1YARN-Client模式的作业流程 178
9．2．2YARN-Cluster模式的作业流程 179
9．3小结 181
10 Shark和Spark SQL 183
10．1从Shark到Spark SQL 183
10．1．1Shark的撤退是进攻 183
10．1．2Spark SQL接力 185
10．1．3Spark SQL与普通SQL的区别 186
10．2Spark SQL应用架构 187
10．3Spark SQL之DataFrame 188
10．3．1什么是DataFrame 188
10．3．2DataFrame的创建 188
10．3．3DataFrame的使用 190
10．4Spark SQL运行过程分析 190
10．5小结 192
11 Spark Streaming流数据处理新贵 193
11．1Spark Streaming是什么 193
11．2Spark Streaming的架构 194
11．3Spark Streaming的操作 195
11．3．1Spark Streaming的Transformation操作 196
11．3．2Spark Streaming的Window操作 197
11．3．3Spark Streaming的Output操作 198
11．4Spark Streaming性能调优 198
11．5小结 200
12 Spark GraphX图计算系统 201
12．1图计算系统 201
12．1．1图存储模式 202
12．1．2图计算模式 203
12．2Spark GraphX的框架 206
12．3Spark GraphX的存储模式 207
12．4Spark GraphX的图运算符 208
12．5小结 211
13 Spark Cluster管理 212
13．1Spark Cluster部署 212
13．2Spark Cluster管理与监控 213
13．2．1内存优化机制 213
13．2．2Spark日志系统 213
13．3Spark 高可用性 215
13．4小结 216
第3篇其他大数据处理技术
14 专为流数据而生的Storm 218
14．1Storm起因 218
14．2Storm的架构与组件 220
14．3Storm的设计思想 222
14．4Storm与Spark的区别 224
14．5Storm的适用场景 225
14．6Storm的应用 226
14．7小结 227
15 Dremel和Drill 228
15．1Dremel和Drill的历史背景 228
15．2Dremel的原理与应用 230
15．3Drill的架构与流程 232
15．4Dremel和Drill的适用场景与应用 234
15．5小结 234
第4篇大数据下的日志分析系统
16 日志分析解决方案 236
16．1百花齐放的日志处理技术 236
16．2日志处理方案ELK 238
16．2．1ELK的三大金刚 238
16．2．2ELK的架构 240
16．2．3ELK的组网形式 242
16．3Logstash日志收集解析 245
16．3．1Input Plugins及应用示例 246
16．3．2Filter Plugins及应用示例 248
16．3．3Output Plugins及应用示例 249
16．4ElasticSearch存储与搜索 250
16．4．1ElasticSearch的主要概念 251
16．4．2ElasticSearch Rest API 252
16．5Kibana展示 253
16．6小结 255
17 ELK集群部署与应用 256
17．1ELK集群部署与优化 256
17．1．1ELK HA集群部署 256
17．1．2ElasticSearch优化 257
17．2如何开发自己的插件 259
17．3ELK在大数据运维系统中的应用 261
17．4ELK实战应用 262
17．4．1ELK监控Spark集群 262
17．4．2ELK监控系统资源状态 263
17．4．3ELK辅助日志管理和故障排查 263
17．5小结 264
第5篇数据分析技术前景展望
18 大数据处理的思考与展望 266
18．1大数据时代的思考 266
18．2大数据处理技术的发展趋势 267
18．3小结 270
内容简介:
　　本书覆盖了当前大数据处理领域的热门技术，包括Hadoop、Spark、Storm、Dremel、Drill等，详细分析了各种技术的应用场景和优缺点；同时阐述了大数据下的日志分析系统，重点讲解了ELK日志处理方案；最后分析了大数据处理技术的发展趋势。本书采用幽默的表述风格，使读者容易理解、轻松掌握；重点从各种技术的起源、设计思想、架构等方面阐述，以帮助读者从根源上悟出大数据处理之道。
目录:
0“疯狂”的大数据 1
0．1大数据时代 1
0．2数据就是“金库” 3
0．3让大数据“活”起来 4
第1篇Hadoop军营
1 Hadoop一石激起千层浪 7
1．1Hadoop诞生――不仅仅是玩具 7
1．2Hadoop发展――各路英雄集结 8
1．3Hadoop和它的小伙伴们 10
1．4Hadoop应用场景 12
1．5小结 13
2 MapReduce奠定基石 14
2．1MapReduce设计思想 14
2．2MapReduce运行机制 19
2．2．1MapReduce的组成 19
2．2．2MapReduce作业运行流程 20
2．2．3JobTracker解剖 26
2．2．4TaskTracker解剖 34
2．2．5失败场景分析 42
2．3MapReduce实例分析 43
2．3．1运行WordCount程序 44
2．3．2WordCount源码分析 45
2．4小结 48
3 分布式文件系统 49
3．1群雄并起的DFS 49
3．2HDFS文件系统 51
3．2．1HDFS 设计与架构 52
3．2．2HDFS 操作与API 56
3．2．3HDFS的优点及适用场景 60
3．2．4HDFS的缺点及改进策略 61
3．3小结 62
4 Hadoop体系的“四剑客” 63
4．1数据仓库工具Hive 63
4．1．1Hive缘起何处 63
4．1．2Hive和数据库的区别 65
4．1．3Hive设计思想与架构 66
4．1．4适用场景 74
4．2大数据仓库HBase 74
4．2．1HBase因何而生 74
4．2．2HBase的设计思想和架构 77
4．2．3HBase优化技巧 84
4．2．4HBase和Hive的区别 86
4．3Pig编程语言 87
4．3．1Pig的缘由 87
4．3．2Pig的基本架构 88
4．3．3Pig与Hive的对比 90
4．3．4Pig的执行模式 90
4．3．5Pig Latin语言及其应用 91
4．4协管员ZooKeeper 96
4．4．1ZooKeeper是什么 96
4．4．2ZooKeeper的作用 97
4．4．3ZooKeeper的架构 98
4．4．4ZooKeeper的数据模型 100
4．4．5ZooKeeper的常用接口及操作 102
4．4．6ZooKeeper的应用场景分析 105
4．5小结 108
5 Hadoop资源管理与调度 110
5．1Hadoop调度机制 110
5．1．1FIFO 111
5．1．2计算能力调度器 111
5．1．3公平调度器 113
5．2Hadoop YARN资源调度 114
5．2．1YARN产生的背景 114
5．2．2Hadoop YARN的架构 116
5．2．3YARN的运作流程 118
5．3Apache Mesos资源调度 120
5．3．1Apache Mesos的起因 120
5．3．2Apache Mesos的架构 121
5．3．3基于Mesos的Hadoop 123
5．4Mesos与YARN对比 127
5．5小结 128
6 Hadoop集群管理之道 129
6．1Hadoop 集群管理与维护 129
6．1．1Hadoop集群管理 129
6．1．2Hadoop集群维护 131
6．2Hadoop 集群调优 132
6．2．1Linux文件系统调优 132
6．2．2Hadoop通用参数调整 133
6．2．3HDFS相关配置 133
6．2．4MapReduce相关配置 134
6．2．5Map任务相关配置 136
6．2．6HBase搭建重要的HDFS参数 137
6．3Hadoop 集群监控 137
6．3．1Apache Ambari监控 137
6．3．2Ganglia监控Hadoop 138
6．4小结 138
第2篇Spark星火燎原
7 Spark宝刀出鞘 141
7．1Spark的历史渊源 141
7．1．1Spark的诞生 141
7．1．2Spark的发展 142
7．2Spark和Hadoop MapReduce对比 143
7．3Spark的适用场景 145
7．4Spark的硬件配置 146
7．5Spark架构 147
7．5．1Spark生态架构 147
7．5．2Spark运行架构 149
7．6小结 151
8 Spark核心RDD 153
8．1RDD简介 153
8．1．1什么是RDD 153
8．1．2为什么需要RDD 154
8．1．3RDD本体的设计 154
8．1．4RDD与分布式共享内存 155
8．2RDD的存储级别 155
8．3RDD依赖与容错 157
8．3．1RDD依赖关系 157
8．3．2RDD容错机制 160
8．4RDD操作与接口 161
8．4．1RDD Transformation操作与接口 162
8．4．2RDD Action操作与接口 164
8．5RDD编程示例 165
8．6小结 166
9 Spark运行模式和流程 167
9．1Spark运行模式 167
9．1．1Spark的运行模式列表 167
9．1．2Local模式 168
9．1．3Standalone模式 169
9．1．4Spark on Mesos模式 171
9．1．5Spark on YARN 模式 173
9．1．6Spark on EGO 模式 175
9．2Spark作业流程 177
9．2．1YARN-Client模式的作业流程 178
9．2．2YARN-Cluster模式的作业流程 179
9．3小结 181
10 Shark和Spark SQL 183
10．1从Shark到Spark SQL 183
10．1．1Shark的撤退是进攻 183
10．1．2Spark SQL接力 185
10．1．3Spark SQL与普通SQL的区别 186
10．2Spark SQL应用架构 187
10．3Spark SQL之DataFrame 188
10．3．1什么是DataFrame 188
10．3．2DataFrame的创建 188
10．3．3DataFrame的使用 190
10．4Spark SQL运行过程分析 190
10．5小结 192
11 Spark Streaming流数据处理新贵 193
11．1Spark Streaming是什么 193
11．2Spark Streaming的架构 194
11．3Spark Streaming的操作 195
11．3．1Spark Streaming的Transformation操作 196
11．3．2Spark Streaming的Window操作 197
11．3．3Spark Streaming的Output操作 198
11．4Spark Streaming性能调优 198
11．5小结 200
12 Spark GraphX图计算系统 201
12．1图计算系统 201
12．1．1图存储模式 202
12．1．2图计算模式 203
12．2Spark GraphX的框架 206
12．3Spark GraphX的存储模式 207
12．4Spark GraphX的图运算符 208
12．5小结 211
13 Spark Cluster管理 212
13．1Spark Cluster部署 212
13．2Spark Cluster管理与监控 213
13．2．1内存优化机制 213
13．2．2Spark日志系统 213
13．3Spark 高可用性 215
13．4小结 216
第3篇其他大数据处理技术
14 专为流数据而生的Storm 218
14．1Storm起因 218
14．2Storm的架构与组件 220
14．3Storm的设计思想 222
14．4Storm与Spark的区别 224
14．5Storm的适用场景 225
14．6Storm的应用 226
14．7小结 227
15 Dremel和Drill 228
15．1Dremel和Drill的历史背景 228
15．2Dremel的原理与应用 230
15．3Drill的架构与流程 232
15．4Dremel和Drill的适用场景与应用 234
15．5小结 234
第4篇大数据下的日志分析系统
16 日志分析解决方案 236
16．1百花齐放的日志处理技术 236
16．2日志处理方案ELK 238
16．2．1ELK的三大金刚 238
16．2．2ELK的架构 240
16．2．3ELK的组网形式 242
16．3Logstash日志收集解析 245
16．3．1Input Plugins及应用示例 246
16．3．2Filter Plugins及应用示例 248
16．3．3Output Plugins及应用示例 249
16．4ElasticSearch存储与搜索 250
16．4．1ElasticSearch的主要概念 251
16．4．2ElasticSearch Rest API 252
16．5Kibana展示 253
16．6小结 255
17 ELK集群部署与应用 256
17．1ELK集群部署与优化 256
17．1．1ELK HA集群部署 256
17．1．2ElasticSearch优化 257
17．2如何开发自己的插件 259
17．3ELK在大数据运维系统中的应用 261
17．4ELK实战应用 262
17．4．1ELK监控Spark集群 262
17．4．2ELK监控系统资源状态 263
17．4．3ELK辅助日志管理和故障排查 263
17．5小结 264
第5篇数据分析技术前景展望
18 大数据处理的思考与展望 266
18．1大数据时代的思考 266
18．2大数据处理技术的发展趋势 267
18．3小结 270

查看详情

相关分类

计算机理论编程与开发操作系统大数据与云计算图形图像/多媒体网站设计与网页开发网络与通讯硬件、嵌入式开发办公软件信息安全辅助设计与工程计算软件工程/开发项目管理

大数据处理之道正版现货，品相完好，套书默认发一本

九品

旧书香书城

北京市昌平区

平均发货23小时成功完成率86.41%

￥76.00

券

100减20

立即购买加入购物车
大数据处理之道

九品

沅陵县闻泰图书店

湖南省长沙市

平均发货14小时成功完成率95.24%

￥50.00

券

100减20

立即购买加入购物车
大数据处理之道

九五品

文林杏坊书屋

北京市昌平区

平均发货30小时成功完成率93.91%

￥68.00

券

100减20

立即购买加入购物车
大数据处理之道【标题与图片不一致时,请质询，正版有货可开发票】

全新

雅逸阁书店

海南省海口市

平均发货14小时成功完成率82.99%

￥310.00

券

100减20

立即购买加入购物车
大数据处理之道【标题与图片不一致时,请质询，正版有货可开发票】

全新

雅逸阁书店

海南省海口市

平均发货14小时成功完成率82.99%

￥336.00

券

100减20

立即购买加入购物车
大数据处理之道【标题与图片不一致时,请质询，正版有货可开发票】

全新

雅逸阁书店

海南省海口市

平均发货14小时成功完成率82.99%

￥333.00

券

100减20

立即购买加入购物车
大数据处理之道内页有书写划线原书拍摄细节如图

八五品

萬有阁

北京市东城区

平均发货16小时成功完成率97.56%

￥63.00

券

100减20

立即购买加入购物车
大数据处理之道

九品

阅读时刻书屋

河南省商丘市

平均发货13小时成功完成率96.4%

￥70.00

券

100减20

立即购买加入购物车
大数据处理之道

九品

一得书苑

河北省邯郸市

平均发货6小时成功完成率96.39%

￥255.00

券

100减20

立即购买加入购物车
大数据处理之道

九品

一得书苑

河北省邯郸市

平均发货6小时成功完成率96.39%

￥258.00

券

100减20

立即购买加入购物车
大数据处理之道

九品

一得书苑

河北省邯郸市

平均发货6小时成功完成率96.39%

￥240.00

券

100减20

立即购买加入购物车
大数据处理之道

九品

皖阳书斋

北京市丰台区

平均发货17小时成功完成率97.11%

￥75.00

券

100减20

立即购买加入购物车
大数据处理之道书籍批量上传，默认8成新左右、单本！单本！无光盘等附件（一定需要请联系客服确认），旧书保存完好，不影响学习和阅读。一般来说，①教材学习类书有或多或少的笔记；②考试做题的书，题目一般会有做过；③其他类书笔记一般很少或者没有（但要求一定没笔记的，要提前与客服沟通好再下单，否则本店不承担责任）。仓库发货之前还会再检查，确认没问题再发货的。多重检查，放心购买！

八五品

山野书斋

四川省成都市

平均发货11小时成功完成率96.65%

￥75.00

券

100减20

立即购买加入购物车
大数据处理之道包正版无字迹无划线无标注如需详细图片可联系

九品

留有墨香

江苏省南通市

平均发货7小时成功完成率97.22%

￥105.00

券

100减20

立即购买加入购物车
大数据处理之道（一版一印）正版现货内干净无写涂划实物拍图）有点折页

2016-10 印刷
印次: 1

九品

广博书坊

江苏省南京市

平均发货19小时成功完成率95.82%

￥80.00

券

100减20

立即购买加入购物车
大数据处理之道

2016年印刷

九品

康佳书社

北京市朝阳区

平均发货16小时成功完成率96.18%

￥80.00

券

100减20

立即购买加入购物车
大数据处理之道

八五品

芳书斋

河北省承德市

平均发货7小时成功完成率96.19%

￥129.00

券

100减20

立即购买加入购物车
大数据处理之道后页外壳有点水印

九品

星空书社

北京市通州区

平均发货18小时成功完成率96.19%

￥189.00

券

100减20

立即购买加入购物车
大数据处理之道

九品

金牛书社

湖北省武汉市

平均发货15小时成功完成率94.68%

￥242.00

券

100减20

立即购买加入购物车
大数据处理之道

九五品

一个行家

宁夏银川市

平均发货6小时成功完成率95.76%

￥68.00

券

100减20

立即购买加入购物车
大数据处理之道实拍图有几页写划，以照片为准

八五品

青梅人的书店

河北省沧州市

平均发货8小时成功完成率96.41%

￥80.00

券

100减20

立即购买加入购物车
大数据处理之道

八五品

畔山壹书屋

浙江省杭州市

平均发货11小时成功完成率94.88%

￥53.35

券

100减20

立即购买加入购物车
大数据处理之道正版品相好

九五品

王桃1的书摊

安徽省宣城市

平均发货17小时成功完成率75%

￥256.00

券

100减20

立即购买加入购物车
大数据处理之道正版书有划线

八五品

四季访书

江苏省南京市

平均发货11小时成功完成率95.09%

￥47.00

券

100减20

立即购买加入购物车
大数据处理之道书页有少量划线

九品

1980书店

北京市通州区

平均发货41小时成功完成率93.86%

￥200.00

券

100减20

立即购买加入购物车
大数据处理之道【标题与图片不一致时,请质询，正版有货可开发票】

全新

翰林阁书店

海南省海口市

平均发货13小时成功完成率77.91%

￥336.00

券

100减20

立即购买加入购物车
大数据处理之道【标题与图片不一致时,请质询，正版有货可开发票】

全新

翰林阁书店

海南省海口市

平均发货13小时成功完成率77.91%

￥333.00

券

100减20

立即购买加入购物车
大数据处理之道【标题与图片不一致时,请质询，正版有货可开发票】

全新

翰林阁书店

海南省海口市

平均发货13小时成功完成率77.91%

￥310.00

券

100减20

立即购买加入购物车
大数据处理之道

九品

等你书屋

吉林省长春市

平均发货4小时成功完成率88.14%

￥198.00

券

100减20

立即购买加入购物车
大数据处理之道后页外壳有点水印

九品

胭脂书局

北京市通州区

平均发货20小时成功完成率77.86%

￥264.00

券

100减20

立即购买加入购物车
大数据处理之道

八五品

敬礼书店

河北省邢台市

平均发货26小时成功完成率90.12%

￥220.00

券

100减20

立即购买加入购物车
大数据处理之道

九五品

云著书院

安徽省芜湖市

平均发货19小时成功完成率94.23%

￥80.00

券

100减20

立即购买加入购物车
大数据处理之道

八五品

天宇画廊的书店

北京市丰台区

平均发货20小时成功完成率84.42%

￥222.00

券

100减20

立即购买加入购物车
大数据处理之道

八五品

大伦子旧书摊的书店

北京市海淀区

平均发货19小时成功完成率81.48%

￥220.00

券

100减20

立即购买加入购物车
大数据处理之道

八五品

小元宝旧书摊的书店

北京市朝阳区

平均发货59小时成功完成率92.86%

￥220.00

券

100减20

立即购买加入购物车