Spark大数据处理技术
出版时间:
2015-01
版次:
1
ISBN:
9787121250811
定价:
65.00
装帧:
平装
开本:
16开
纸张:
胶版纸
页数:
336页
字数:
346千字
正文语种:
简体中文
122人买过
-
《Spark大数据处理技术》是一本全面介绍Spark及Spark生态圈相关技术的书籍,是国内首本深入介绍Spark原理和架构的技术书籍。主要内容有Spark基础功能介绍及内部重要模块分析,包括部署模式、调度框架、存储管理以及应用监控;同时也详细介绍了Spark生态圈中其他的软件和模块,包括SQL处理引擎Shark和SparkSQL、流式处理引擎SparkStreaming、图计算框架Graphx以及分布式内存文件系统Tachyon。《Spark大数据处理技术》从概念和原理上对Spark核心框架和生态圈做了详细的解读,并对Spark的应用现状和未来发展做了一定的介绍,旨在为大数据从业人员和Spark爱好者提供一个更深入学习的平台。
《Spark大数据处理技术》适合任何大数据、Spark领域的从业人员阅读,同时也为架构师、软件开发工程师和大数据爱好者展现了一个现代大数据框架的架构原理和实现细节。相信通过学习《Spark大数据处理技术》,读者能够熟悉和掌握Spark这一当前流行的大数据框架,并将其投入到生产实践中去。 夏俊鸾,现任阿里巴巴数据平台部高级技术专家,ApacheSpark项目Committer,曾就职于英特尔亚太研发中心,微博账号@Andrew-Xia。
刘旭晖,现任蘑菇街数据平台资深架构师(花名天火),曾就职于英特尔亚太研发中心大数据软件部,Spark/Hadoop/Hbase/Phoenix等众多大数据相关开源项目的积极贡献者。乐于分享,著有CSDN博客blog.csdn.net/colorant。
邵赛赛,英特尔亚太研发有限公司开发工程师,专注于大数据领域,开源爱好者,现从事Spark相关工作,Spark代码贡献者。
程浩,英特尔大数据技术团队软件工程师,Shark和SparkSQL活跃开发者,致力于SQLonBigData的性能调优与优化。
史鸣飞,英特尔亚太研发有限公司大数据软件部工程师,专注于大数据领域,主要从事Spark及相关项目的开发及应用,Spark及Shark代码贡献者,现在主要投身于Tachyon项目的开发。
黄洁,目前就职于英特尔亚太研发中心大数据技术中心,担任高级软件工程师,致力于大数据技术的性能优化及开发工作,涉及Hadoop、Spark、HBase等开源项目。在多年的工作过程中,积累了一定的分布式大数据框架性能调优经验,并且是ApacheChukwa项目的PMC成员和Committer。在此之前,毕业于上海交通大学并获硕士及学士学位。 第1章Spark系统概述
1.1大数据处理框架
1.2Spark大数据处理框架
1.2.1RDD表达能力
1.2.2Spark子系统
1.3小结
第2章SparkRDD及编程接口
2.1Spark程序“HelloWorld”
2.2SparkRDD
2.2.1RDD分区(partitions)
2.2.2RDD优先位置(preferredLocations)
2.2.3RDD依赖关系(dependencies)
2.2.4RDD分区计算(compute)
2.2.5RDD分区函数(partitioner)
2.3创建操作
2.3.1集合创建操作
2.3.2存储创建操作
2.4转换操作
2.4.1RDD基本转换操作
2.4.2键值RDD转换操作
2.4.3再论RDD依赖关系
2.5控制操作(controloperation)
2.6行动操作(actionoperation)
2.6.1集合标量行动操作
2.6.2存储行动操作
2.7小结
第3章Spark运行模式及原理
3.1Spark运行模式概述
3.1.1Spark运行模式列表
3.1.2Spark基本工作流程
3.1.3相关基本类
3.2Local模式
3.2.1部署及程序运行
3.2.2内部实现原理
3.3Standalone模式
3.3.1部署及程序运行
3.3.2内部实现原理
3.4Localcluster模式
3.4.1部署及程序运行
……
第4章Spark调度管理原理
第5章Spark的存储管理
第6章Spark监控管理
第7章Spark架构与安装配置
第8章SQL程序扩展
第9章SparkSQL
第10章SparkStreaming流数据处理框架
第11章GraphX计算框架
第12章Tachyon存储系统
-
内容简介:
《Spark大数据处理技术》是一本全面介绍Spark及Spark生态圈相关技术的书籍,是国内首本深入介绍Spark原理和架构的技术书籍。主要内容有Spark基础功能介绍及内部重要模块分析,包括部署模式、调度框架、存储管理以及应用监控;同时也详细介绍了Spark生态圈中其他的软件和模块,包括SQL处理引擎Shark和SparkSQL、流式处理引擎SparkStreaming、图计算框架Graphx以及分布式内存文件系统Tachyon。《Spark大数据处理技术》从概念和原理上对Spark核心框架和生态圈做了详细的解读,并对Spark的应用现状和未来发展做了一定的介绍,旨在为大数据从业人员和Spark爱好者提供一个更深入学习的平台。
《Spark大数据处理技术》适合任何大数据、Spark领域的从业人员阅读,同时也为架构师、软件开发工程师和大数据爱好者展现了一个现代大数据框架的架构原理和实现细节。相信通过学习《Spark大数据处理技术》,读者能够熟悉和掌握Spark这一当前流行的大数据框架,并将其投入到生产实践中去。
-
作者简介:
夏俊鸾,现任阿里巴巴数据平台部高级技术专家,ApacheSpark项目Committer,曾就职于英特尔亚太研发中心,微博账号@Andrew-Xia。
刘旭晖,现任蘑菇街数据平台资深架构师(花名天火),曾就职于英特尔亚太研发中心大数据软件部,Spark/Hadoop/Hbase/Phoenix等众多大数据相关开源项目的积极贡献者。乐于分享,著有CSDN博客blog.csdn.net/colorant。
邵赛赛,英特尔亚太研发有限公司开发工程师,专注于大数据领域,开源爱好者,现从事Spark相关工作,Spark代码贡献者。
程浩,英特尔大数据技术团队软件工程师,Shark和SparkSQL活跃开发者,致力于SQLonBigData的性能调优与优化。
史鸣飞,英特尔亚太研发有限公司大数据软件部工程师,专注于大数据领域,主要从事Spark及相关项目的开发及应用,Spark及Shark代码贡献者,现在主要投身于Tachyon项目的开发。
黄洁,目前就职于英特尔亚太研发中心大数据技术中心,担任高级软件工程师,致力于大数据技术的性能优化及开发工作,涉及Hadoop、Spark、HBase等开源项目。在多年的工作过程中,积累了一定的分布式大数据框架性能调优经验,并且是ApacheChukwa项目的PMC成员和Committer。在此之前,毕业于上海交通大学并获硕士及学士学位。
-
目录:
第1章Spark系统概述
1.1大数据处理框架
1.2Spark大数据处理框架
1.2.1RDD表达能力
1.2.2Spark子系统
1.3小结
第2章SparkRDD及编程接口
2.1Spark程序“HelloWorld”
2.2SparkRDD
2.2.1RDD分区(partitions)
2.2.2RDD优先位置(preferredLocations)
2.2.3RDD依赖关系(dependencies)
2.2.4RDD分区计算(compute)
2.2.5RDD分区函数(partitioner)
2.3创建操作
2.3.1集合创建操作
2.3.2存储创建操作
2.4转换操作
2.4.1RDD基本转换操作
2.4.2键值RDD转换操作
2.4.3再论RDD依赖关系
2.5控制操作(controloperation)
2.6行动操作(actionoperation)
2.6.1集合标量行动操作
2.6.2存储行动操作
2.7小结
第3章Spark运行模式及原理
3.1Spark运行模式概述
3.1.1Spark运行模式列表
3.1.2Spark基本工作流程
3.1.3相关基本类
3.2Local模式
3.2.1部署及程序运行
3.2.2内部实现原理
3.3Standalone模式
3.3.1部署及程序运行
3.3.2内部实现原理
3.4Localcluster模式
3.4.1部署及程序运行
……
第4章Spark调度管理原理
第5章Spark的存储管理
第6章Spark监控管理
第7章Spark架构与安装配置
第8章SQL程序扩展
第9章SparkSQL
第10章SparkStreaming流数据处理框架
第11章GraphX计算框架
第12章Tachyon存储系统
查看详情
-
九五品
浙江省杭州市
平均发货17小时
成功完成率96.88%
-
全新
天津市东丽区
平均发货19小时
成功完成率91.15%
-
九品
北京市东城区
平均发货25小时
成功完成率88.52%
-
Spark大数据处理技术
批量上传,套装书可能不全,下单前咨询在线客服!图书都是8-9成新,少量笔记,不影响阅读使用!光盘、学习卡、附件等默认不带,有特殊要求,下单前请咨询客服!
九品
北京市通州区
平均发货8小时
成功完成率90.44%
-
九品
山东省枣庄市
平均发货16小时
成功完成率94.82%
-
八五品
山东省枣庄市
平均发货16小时
成功完成率94.82%
-
全新
河北省保定市
平均发货27小时
成功完成率91.42%
-
九五品
河北省保定市
平均发货19小时
成功完成率84.02%
-
全新
北京市朝阳区
平均发货17小时
成功完成率87.02%
-
九品
天津市宝坻区
平均发货14小时
成功完成率95.85%
-
Spark大数据处理技术
批量上传,套装书可能不全,下单前咨询在线客服!图书都是8-9成新,少量笔记,不影响阅读使用!光盘、学习卡、附件等默认不带,有特殊要求,下单前请咨询客服!
九品
广东省佛山市
平均发货7小时
成功完成率94.02%
-
八五品
四川省成都市
平均发货11小时
成功完成率85.92%
-
八五品
山东省枣庄市
平均发货9小时
成功完成率88.49%
-
八五品
山东省济南市
平均发货8小时
成功完成率92.89%
-
九品
北京市通州区
平均发货10小时
成功完成率94.64%
-
九品
北京市昌平区
平均发货11小时
成功完成率97.69%
-
全新
河北省保定市
平均发货27小时
成功完成率91.42%
-
九品
河北省保定市
平均发货16小时
成功完成率95.34%
-
全新
河北省保定市
平均发货28小时
成功完成率92.13%
-
全新
河北省保定市
平均发货26小时
成功完成率81.13%
-
八五品
四川省成都市
平均发货8小时
成功完成率93.27%
-
九五品
上海市徐汇区
平均发货14小时
成功完成率92.07%
-
Spark大数据处理技术
买书,就上二手书海官方企业店,清仓处理,真实库存,特价正版,收藏店铺,优先发货! ps:下午三点之前的订单当天发货,之后明天发货,特殊情况除外。
八五品
河南省鹤壁市
平均发货10小时
成功完成率96.07%
-
八五品
河南省鹤壁市
平均发货9小时
成功完成率96.19%
-
八五品
北京市通州区
平均发货10小时
成功完成率94.64%
-
九品
安徽省合肥市
平均发货13小时
成功完成率93.28%
-
Spark大数据处理技术
正版二手,均有笔记不影响使用,无赠品、光盘、MP157等。如需购买套装书,请联系客服核实,批量上传数据有误差,套装书售后运费自理,还请见谅!
八五品
山东省枣庄市
平均发货7小时
成功完成率90.37%
-
八五品
-
八五品
重庆市沙坪坝区
平均发货8小时
成功完成率82.13%
-
八五品
河北省衡水市
平均发货6小时
成功完成率97.29%
-
八五品
天津市武清区
平均发货12小时
成功完成率94.83%
-
全新
河北省保定市
平均发货21小时
成功完成率88.04%
-
Spark大数据处理技术
批量上传,套装书可能不全,下单前咨询在线客服!图书都是8-9成新,少量笔记,不影响阅读使用!光盘、学习卡、附件等默认不带,有特殊要求,下单前请咨询客服!
九品
河北省廊坊市
平均发货7小时
成功完成率94.18%
-
九五品
四川省成都市
平均发货10小时
成功完成率94.09%
-
八五品
四川省成都市
平均发货10小时
成功完成率94.09%
-
九五品
四川省成都市
平均发货10小时
成功完成率93.88%
-
八五品
广东省东莞市
平均发货8小时
成功完成率96.27%
-
八五品
广东省东莞市
平均发货8小时
成功完成率93.14%
-
九品
河北省衡水市
平均发货12小时
成功完成率95.51%
-
八五品
江苏省苏州市
平均发货13小时
成功完成率96.6%
-
八五品
广东省东莞市
平均发货8小时
成功完成率94.16%
-
八五品
湖南省长沙市
平均发货10小时
成功完成率93.59%
-
八五品
重庆市沙坪坝区
平均发货8小时
成功完成率92.06%
-
八五品
广东省东莞市
平均发货8小时
成功完成率93.14%
-
九品
北京市通州区
平均发货7小时
成功完成率93.73%
-
九品
北京市昌平区
平均发货8小时
成功完成率96.74%
-
八五品
北京市海淀区
平均发货9小时
成功完成率76.72%
-
九品
北京市海淀区
平均发货9小时
成功完成率76.72%
-
九品
北京市海淀区
平均发货9小时
成功完成率91.67%
-
八五品
北京市海淀区
平均发货9小时
成功完成率91.67%