Spark大数据处理：技术、应用与性能优化

作者: 高彦杰著

出版社: 机械工业出版社

出版时间: 2014-11

版次: 1

ISBN: 9787111483861

定价: 59.00

装帧: 平装

开本: 16开

纸张: 胶版纸

页数: 255页

丛书: 大数据技术丛书

分类: 计算机与互联网

2 张插图图片

110人买过

　　作为一个基于内存计算的大数据并行计算框架，Spark不仅很好地解决了数据的实时处理问题，而且保证了高容错性和高可伸缩性。具体来讲，它有如下优势：
　　打造全栈多计算范式的高效数据流水线
　　轻量级快速处理
　　易于使用，支持多语言
　　与HDFS等存储层兼容
　　社区活跃度高
　　……

　　Spark已经在全球范围内广泛使用，无论是Intel、Yahoo!、Twitter、阿里巴巴、百度、腾讯等国际互联网巨头，还是一些尚处于成长期的小公司，都在使用Spark。本书作者结合自己在微软和IBM实践Spark的经历和经验，编写了这本书。站着初学者的角度，不仅系统、全面地讲解了Spark的各项功能及其使用方法，而且较深入地探讨了Spark的工作机制、运行原理以及BDAS生态系统中的其他技术，同时还有一些可供操作的案例，能让没有经验的读者迅速掌握Spark。更为重要的是，本书还对Spark的性能优化进行了探讨。
　　高彦杰，毕业于中国人民大学，就职于IBM，精通Hadoop相关技术，较早接触并使用Spark，对Spark应用开发、Spark系统的运维和测试比较熟悉，深度阅读了Spark的源代码，了解Spark的运行机制，擅长Spark的查询优化。
前　言
第1章　Spark简介  1
1.1　Spark是什么  1
1.2　Spark生态系统BDAS  4
1.3　Spark架构  6
1.4　Spark分布式架构与单机多核
架构的异同  9
1.5　Spark的企业级应用  10
1.5.1　Spark在Amazon中的应用  11
1.5.2　Spark在Yahoo!的应用  15
1.5.3　Spark在西班牙电信的应用  17
1.5.4　Spark在淘宝的应用  18
1.6　本章小结  20
第2章　Spark集群的安装与部署  21
2.1　Spark的安装与部署  21
2.1.1　在Linux集群上安装与配置Spark  21
2.1.2　在Windows上安装与配置Spark  30
2.2　Spark集群初试  33
2.3　本章小结  35
第3章　Spark计算模型  36
3.1　Spark程序模型  36
3.2　弹性分布式数据集  37
3.2.1　RDD简介  38
3.2.2　RDD与分布式共享内存的异同  38
3.2.3　Spark的数据存储  39
3.3　Spark算子分类及功能  41
3.3.1　Value型Transformation算子  42
3.3.2　Key-Value型Transformation算子  49
3.3.3　Actions算子  53
3.4　本章小结  59
第4章　Spark工作机制详解  60
4.1　Spark应用执行机制  60
4.1.1　Spark执行机制总览  60
4.1.2　Spark应用的概念  62
4.1.3　应用提交与执行方式  63
4.2　Spark调度与任务分配模块  65
4.2.1　Spark应用程序之间的调度  66
4.2.2　Spark应用程序内Job的调度  67
4.2.3　Stage和TaskSetManager调度方式  72
4.2.4　Task调度  74
4.3　Spark I/O机制  77
4.3.1　序列化  77
4.3.2　压缩  78
4.3.3　Spark块管理  80
4.4　Spark通信模块  93
4.4.1　通信框架AKKA  94
4.4.2　Client、Master和Worker间的通信  95
4.5　容错机制  104
4.5.1　Lineage机制  104
4.5.2　Checkpoint机制  108
4.6　Shuffle机制  110
4.7　本章小结  119
第5章　Spark开发环境配置及流程  120
5.1　Spark应用开发环境配置  120
5.1.1　使用Intellij开发Spark程序  120
5.1.2　使用Eclipse开发Spark程序  125
5.1.3　使用SBT构建Spark程序  129
5.1.4　使用Spark Shell开发运行Spark程序  130
5.2　远程调试Spark程序  130
5.3　Spark编译  132
5.4　配置Spark源码阅读环境  135
5.5　本章小结  135
第6章　Spark编程实战  136
6.1　WordCount  136
6.2　Top K  138
6.3　中位数  140
6.4　倒排索引  141
6.5　CountOnce  143
6.6　倾斜连接  144
6.7　股票趋势预测  146
6.8　本章小结  153
第7章　Benchmark使用详解  154
7.1　Benchmark简介  154
7.1.1　Intel Hibench与Berkeley BigDataBench  155
7.1.2　Hadoop GridMix  157
7.1.3　Bigbench、BigDataBenchmark与TPC-DS  158
7.1.4　其他Benchmark  161
7.2　Benchmark的组成  162
7.2.1　数据集  162
7.2.2　工作负载  163
7.2.3　度量指标  167
7.3　Benchmark的使用  168
7.3.1　使用Hibench  168
7.3.2　使用TPC-DS  170
7.3.3　使用BigDataBench  172
7.4　本章小结  176
第8章　BDAS简介  177
8.1　SQL on Spark  177
8.1.1　使用Spark SQL的原因  178
8.1.2　Spark SQL架构分析  179
8.1.3　Shark简介  182
8.1.4　Hive on Spark  184
8.1.5　未来展望  185
8.2　Spark Streaming  185
8.2.1　Spark Streaming简介  186
8.2.2　Spark Streaming架构  188
8.2.3　Spark Streaming原理剖析  189
8.2.4　Spark Streaming调优  198
8.2.5　Spark Streaming 实例  198
8.3　GraphX  205
8.3.1　GraphX简介  205
8.3.2　GraphX的使用  206
8.3.3　GraphX架构  209
8.3.4　运行实例  211
8.4　MLlib  215
8.4.1　MLlib简介  217
8.4.2　MLlib的数据存储  219
8.4.3　数据转换为向量（向量空间模型VSM）  222
8.4.4　MLlib中的聚类和分类  223
8.4.5　算法应用实例  228
8.4.6　利用MLlib进行电影推荐  230
8.5　本章小结  237
第9章　Spark性能调优  238
9.1　配置参数  238
9.2　调优技巧  239
9.2.1　调度与分区优化  240
9.2.2　内存存储优化  243
9.2.3　网络传输优化  249
9.2.4　序列化与压缩  251
9.2.5　其他优化方法  253
9.3　本章小结  255
内容简介:
　　作为一个基于内存计算的大数据并行计算框架，Spark不仅很好地解决了数据的实时处理问题，而且保证了高容错性和高可伸缩性。具体来讲，它有如下优势：
　　打造全栈多计算范式的高效数据流水线
　　轻量级快速处理
　　易于使用，支持多语言
　　与HDFS等存储层兼容
　　社区活跃度高
　　……

　　Spark已经在全球范围内广泛使用，无论是Intel、Yahoo!、Twitter、阿里巴巴、百度、腾讯等国际互联网巨头，还是一些尚处于成长期的小公司，都在使用Spark。本书作者结合自己在微软和IBM实践Spark的经历和经验，编写了这本书。站着初学者的角度，不仅系统、全面地讲解了Spark的各项功能及其使用方法，而且较深入地探讨了Spark的工作机制、运行原理以及BDAS生态系统中的其他技术，同时还有一些可供操作的案例，能让没有经验的读者迅速掌握Spark。更为重要的是，本书还对Spark的性能优化进行了探讨。
作者简介:
　　高彦杰，毕业于中国人民大学，就职于IBM，精通Hadoop相关技术，较早接触并使用Spark，对Spark应用开发、Spark系统的运维和测试比较熟悉，深度阅读了Spark的源代码，了解Spark的运行机制，擅长Spark的查询优化。
目录:
前　言
第1章　Spark简介  1
1.1　Spark是什么  1
1.2　Spark生态系统BDAS  4
1.3　Spark架构  6
1.4　Spark分布式架构与单机多核
架构的异同  9
1.5　Spark的企业级应用  10
1.5.1　Spark在Amazon中的应用  11
1.5.2　Spark在Yahoo!的应用  15
1.5.3　Spark在西班牙电信的应用  17
1.5.4　Spark在淘宝的应用  18
1.6　本章小结  20
第2章　Spark集群的安装与部署  21
2.1　Spark的安装与部署  21
2.1.1　在Linux集群上安装与配置Spark  21
2.1.2　在Windows上安装与配置Spark  30
2.2　Spark集群初试  33
2.3　本章小结  35
第3章　Spark计算模型  36
3.1　Spark程序模型  36
3.2　弹性分布式数据集  37
3.2.1　RDD简介  38
3.2.2　RDD与分布式共享内存的异同  38
3.2.3　Spark的数据存储  39
3.3　Spark算子分类及功能  41
3.3.1　Value型Transformation算子  42
3.3.2　Key-Value型Transformation算子  49
3.3.3　Actions算子  53
3.4　本章小结  59
第4章　Spark工作机制详解  60
4.1　Spark应用执行机制  60
4.1.1　Spark执行机制总览  60
4.1.2　Spark应用的概念  62
4.1.3　应用提交与执行方式  63
4.2　Spark调度与任务分配模块  65
4.2.1　Spark应用程序之间的调度  66
4.2.2　Spark应用程序内Job的调度  67
4.2.3　Stage和TaskSetManager调度方式  72
4.2.4　Task调度  74
4.3　Spark I/O机制  77
4.3.1　序列化  77
4.3.2　压缩  78
4.3.3　Spark块管理  80
4.4　Spark通信模块  93
4.4.1　通信框架AKKA  94
4.4.2　Client、Master和Worker间的通信  95
4.5　容错机制  104
4.5.1　Lineage机制  104
4.5.2　Checkpoint机制  108
4.6　Shuffle机制  110
4.7　本章小结  119
第5章　Spark开发环境配置及流程  120
5.1　Spark应用开发环境配置  120
5.1.1　使用Intellij开发Spark程序  120
5.1.2　使用Eclipse开发Spark程序  125
5.1.3　使用SBT构建Spark程序  129
5.1.4　使用Spark Shell开发运行Spark程序  130
5.2　远程调试Spark程序  130
5.3　Spark编译  132
5.4　配置Spark源码阅读环境  135
5.5　本章小结  135
第6章　Spark编程实战  136
6.1　WordCount  136
6.2　Top K  138
6.3　中位数  140
6.4　倒排索引  141
6.5　CountOnce  143
6.6　倾斜连接  144
6.7　股票趋势预测  146
6.8　本章小结  153
第7章　Benchmark使用详解  154
7.1　Benchmark简介  154
7.1.1　Intel Hibench与Berkeley BigDataBench  155
7.1.2　Hadoop GridMix  157
7.1.3　Bigbench、BigDataBenchmark与TPC-DS  158
7.1.4　其他Benchmark  161
7.2　Benchmark的组成  162
7.2.1　数据集  162
7.2.2　工作负载  163
7.2.3　度量指标  167
7.3　Benchmark的使用  168
7.3.1　使用Hibench  168
7.3.2　使用TPC-DS  170
7.3.3　使用BigDataBench  172
7.4　本章小结  176
第8章　BDAS简介  177
8.1　SQL on Spark  177
8.1.1　使用Spark SQL的原因  178
8.1.2　Spark SQL架构分析  179
8.1.3　Shark简介  182
8.1.4　Hive on Spark  184
8.1.5　未来展望  185
8.2　Spark Streaming  185
8.2.1　Spark Streaming简介  186
8.2.2　Spark Streaming架构  188
8.2.3　Spark Streaming原理剖析  189
8.2.4　Spark Streaming调优  198
8.2.5　Spark Streaming 实例  198
8.3　GraphX  205
8.3.1　GraphX简介  205
8.3.2　GraphX的使用  206
8.3.3　GraphX架构  209
8.3.4　运行实例  211
8.4　MLlib  215
8.4.1　MLlib简介  217
8.4.2　MLlib的数据存储  219
8.4.3　数据转换为向量（向量空间模型VSM）  222
8.4.4　MLlib中的聚类和分类  223
8.4.5　算法应用实例  228
8.4.6　利用MLlib进行电影推荐  230
8.5　本章小结  237
第9章　Spark性能调优  238
9.1　配置参数  238
9.2　调优技巧  239
9.2.1　调度与分区优化  240
9.2.2　内存存储优化  243
9.2.3　网络传输优化  249
9.2.4　序列化与压缩  251
9.2.5　其他优化方法  253
9.3　本章小结  255

查看详情

相关分类

计算机理论编程与开发操作系统大数据与云计算图形图像/多媒体网站设计与网页开发网络与通讯硬件、嵌入式开发办公软件信息安全辅助设计与工程计算软件工程/开发项目管理

Spark大数据处理：技术、应用与性能优化正版二手，均有笔记不影响使用，无赠品、光盘、MP3等。如需购买套装书，请联系客服核实，批量上传数据有误差，套装书售后运费自理，还请见谅！

八五品

必过书城

山东省枣庄市

平均发货8小时成功完成率88.93%

￥20.20

券

100减20

立即购买加入购物车
Spark大数据处理

全新

爱生活三新书店

北京市房山区

平均发货27小时成功完成率83.32%

￥21.68

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理

全新

北京九州书店

北京市朝阳区

平均发货23小时成功完成率83.1%

￥18.59

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化

全新

尚贤文化保定分店的书店

河北省保定市

平均发货31小时成功完成率88.53%

￥23.10

券

100减20

立即购买加入购物车
4

Spark大数据处理：技术、应用与性能优化

八五品

屹源书社

河南省许昌市

平均发货4小时成功完成率98.27%

￥5.00

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化正版二手书，图片套装的图书是其中一本，购买前请联系客服

八五品

古籍旧书院

山东省济南市

平均发货8小时成功完成率94.22%

￥25.55

券

100减20

立即购买加入购物车
Spark大数据处理技术，应用与性能优化

全新

拓荒者的小书店

北京市东城区

平均发货24小时成功完成率82.74%

￥21.36

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

旧书香书城

北京市昌平区

平均发货23小时成功完成率88.6%

￥11.89

券

100减20

立即购买加入购物车
4

Spark大数据处理：技术、应用与性能优化

九品

再来一本书店

北京市朝阳区

平均发货9小时成功完成率97.62%

￥2.00

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化正版二手闪电发货

九品

洋洋洋图书城

北京市朝阳区

平均发货13小时成功完成率86.83%

￥5.31

券

100减20

立即购买加入购物车
Spark大数据处理:技术、应用与性能优化高彦杰机械工业出版社 9787111483861 正版旧书正版旧书里面部分笔记内容完好可正常使用旧书不附带光盘

九五品

辉煌二手教材专营店

江西省南昌市

平均发货10小时成功完成率94.58%

￥2.61

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化正版闪电发货

全新

北京雨洋图书文化

北京市朝阳区

平均发货17小时成功完成率83.46%

￥20.65

券

100减20

立即购买加入购物车
Spark大数据处理技术，应用与性能优化

全新

武汉灿润文化传播

河北省保定市

平均发货28小时成功完成率85.25%

￥22.42

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化塑封消毒正版书当天发货

九品

福宝书店

广东省深圳市

平均发货14小时成功完成率92.79%

￥10.80

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化

九五品

捞书怪

四川省成都市

平均发货10小时成功完成率94.17%

￥4.90

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化下午5点前订单，当日发货！超时赔付

八五品

才华有限

四川省成都市

平均发货10小时成功完成率94.5%

￥4.71

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化下午5点前订单，当日发货！超时赔付

九五品

才华有限

四川省成都市

平均发货10小时成功完成率94.5%

￥4.95

券

100减20

立即购买加入购物车
Spark大数据处理:技术、应用与性能优化高彦杰机械工业出版社 9787111483861 正版旧书里面部分笔记内容完好可正常使用旧书不附带光盘

九品

有路官方旗舰店

江西省南昌市

平均发货10小时成功完成率93.4%

￥7.61

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理

全新

拓荒者的小书店

北京市东城区

平均发货24小时成功完成率82.74%

￥21.68

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理(技术应用与性能优化)/大数据技术丛书

九五品

第一家的书店

福建省福州市

平均发货5小时成功完成率94.07%

￥13.05

券

100减20

立即购买加入购物车不属于本条目
5

Spark大数据处理：技术、应用与性能优化。

九品

浚县同舟书店网店

河南省鹤壁市

平均发货5小时成功完成率97.52%

￥4.20

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化正版二手书，图片套装请联系客服再下单，均有笔记不影响使用，无赠品、光盘、MP164575等

八五品

诚信旧书社

山东省枣庄市

平均发货9小时成功完成率88.03%

￥21.55

券

100减20

立即购买加入购物车
5

Spark大数据处理：技术、应用与性能优化

九品

哥俩书屋

河南省濮阳市

平均发货7小时成功完成率97.78%

￥5.00

券

100减20

立即购买加入购物车
【正版图书】Spark大数据处理(技术应用与性能优化)/大数据技术丛书高彦杰9787111483861机械工业2014-11-01 批量上传，套装书可能不全，下单前咨询在线客服！图书都是8-9成新，少量笔记，不影响阅读使用！光盘、学习卡、附件等默认不带，有特殊要求，下单前请咨询客服！

全新

百叶图书

四川省成都市

平均发货12小时成功完成率82.48%

￥31.57

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化 13-07-03

八五品

万丈图书

广东省东莞市

平均发货7小时成功完成率96.52%

￥2.00

券

100减20

立即购买加入购物车
3

Spark大数据处理：技术、应用与性能优化. 9787111483861

八五品

香竹书苑

河北省衡水市

平均发货5小时成功完成率97.69%

￥5.00

券

100减20

立即购买加入购物车不属于本条目
3

Spark大数据处理：技术、应用与性能优化

八五品

云夕书屋

河北省衡水市

平均发货5小时成功完成率96.86%

￥5.00

券

100减20

立即购买加入购物车不属于本条目
4

Spark大数据处理：技术、应用与性能优化 .

九品

宏洋书店

河北省衡水市

平均发货12小时成功完成率93.2%

￥5.00

券

100减20

立即购买加入购物车不属于本条目
4

Spark大数据处理：技术、应用与性能优化 .

九品

网约书屋

河北省衡水市

平均发货14小时成功完成率87.09%

￥6.00

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化

八五品

重庆沙坪坝区星月书店

重庆市沙坪坝区

平均发货9小时成功完成率87.72%

￥19.00

券

100减20

立即购买加入购物车
Spark大数据处理技术应用与性能优化高彦杰机械工业出版社 9787111483861

八五品

旧书云旗舰店

四川省成都市

平均发货8小时成功完成率93.65%

￥10.24

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化【正版有货可开发票】

全新

雅逸阁书店

海南省海口市

平均发货23小时成功完成率81.65%

￥45.00

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化批量上传，套装书可能不全，下单前咨询在线客服！图书都是8-9成新，少量笔记，不影响阅读使用！光盘、学习卡、附件等默认不带，有特殊要求，下单前请咨询客服！

九品

暖冬图书专营店

北京市通州区

平均发货7小时成功完成率90.22%

￥9.80

券

100减20

立即购买加入购物车
2

Spark大数据处理：技术、应用与性能优化

九品

梦羽轩

河南省新乡市

平均发货4小时成功完成率95.05%

￥8.80

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化批量上传，套装书可能不全，下单前咨询在线客服！图书都是8-9成新，少量笔记，不影响阅读使用！光盘、学习卡、附件等默认不带，有特殊要求，下单前请咨询客服！

九品

京城图书城

广东省佛山市

平均发货7小时成功完成率92.94%

￥9.80

券

100减20

立即购买加入购物车
9

Spark大数据处理技术应用与性能优化高彦杰机械工业9787111483861

八五品

一亩田书院

重庆市沙坪坝区

平均发货8小时成功完成率84.16%

￥16.63

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化

九品

巷子书屋

北京市通州区

平均发货8小时成功完成率92.94%

￥5.50

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化

九品

巷子书屋

北京市通州区

平均发货8小时成功完成率92.94%

￥5.40

券

100减20

立即购买加入购物车
3

Spark大数据处理：技术、应用与性能优化 9787111483861

八五品

香竹书苑

河北省衡水市

平均发货5小时成功完成率97.69%

￥18.00

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化开学大优惠，我们以更好的服务和质量迎接新的挑战！春季开学优惠活动进行中！

九品

东方国际书店

北京市通州区

平均发货8小时成功完成率93.58%

￥20.85

券

100减20

立即购买加入购物车
6

Spark大数据处理：技术、应用与性能优化

八五品

好再来书苑

北京市昌平区

平均发货5小时成功完成率97.9%

￥3.00

券

100减20

立即购买加入购物车不属于本条目
Spark大数据处理：技术、应用与性能优化

八五品

三锦书院

山东省枣庄市

平均发货11小时成功完成率94.55%

￥0.29

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化 Spark大数据处理：技术、应用与性能优化

九品

翰博苑优选

北京市通州区

平均发货14小时成功完成率88.11%

￥1.20

券

100减20

立即购买加入购物车
3

Spark大数据处理：技术、应用与性能优化

九五品

李熊书斋

云南省昆明市

平均发货13小时成功完成率94.93%

￥14.00

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化

九品

书有路书店的书店

河北省廊坊市

平均发货14小时成功完成率94.58%

￥1.20

券

100减20

立即购买加入购物车
Spark大数据处理：技术、应用与性能优化买书，就上二手书海官方企业店，清仓处理，真实库存，特价正版，收藏店铺，优先发货! ps：下午三点之前的订单当天发货，之后明天发货，特殊情况除外。

八五品

二手书海官方企业店

河南省鹤壁市

平均发货10小时成功完成率96.31%

￥7.66

券

100减20

立即购买加入购物车
特价现货！Spark大数据处理：技术、应用与性能优化高彦杰9787111483861机械工业出版社买书，就上二手书海旗舰店，清仓处理，真实库存，特价正版，收藏店铺，优先发货! ps：下午三点之前的订单当天发货，之后明天发货，特殊情况除外。

八五品

书嗨图书旗舰店

河南省鹤壁市

平均发货9小时成功完成率96.43%

￥2.79

券

100减20

立即购买加入购物车不属于本条目
【全新】 Spark大数据处理(技术应用与性能优化)/大数据技术丛书部分是库存书（库存书指的是未使用过，没塑封的，外观95成新的书，介意勿下单）可开发票，支持7天无理由

全新

果然是好书店

天津市西青区

平均发货15小时成功完成率91.08%

￥19.12

券

100减20

立即购买加入购物车不属于本条目
8

Spark大数据处理：技术、应用与性能优化

九品

金诚书店

北京市昌平区

平均发货9小时成功完成率97.85%

￥3.00

券

100减20

立即购买加入购物车不属于本条目
3

Spark大数据处理：技术、应用与性能优化T1413

九品

湖城百年旧书店

河北省衡水市

平均发货12小时成功完成率95.13%

￥6.88

券

100减20

立即购买加入购物车不属于本条目

Spark大数据处理：技术、应用与性能优化

内容简介:

作者简介:

目录: