数据馆员的Hadoop简明手册
出版时间:
2017-10
版次:
1
ISBN:
9787518930135
定价:
28.00
装帧:
平装
开本:
32开
纸张:
胶版纸
页数:
82页
正文语种:
简体中文
-
《数据馆员的Hadoop简明手册》旨在协助初级数据馆员们能够迅速了解Hadoop的知识、用途及整体概貌,作为进一步实践操作之前的入门基础读物。
本手册力求简单、通俗、易懂,既不泛泛之谈,也不过早深入细节,而是力求把握重点。事实上,唯有实践才能真正理解Hadoop的有趣之处和局限之处,但在实践之前,或者考虑选择架构之前,如果有这么一本手册,会容易理解、沟通及评估。
《数据馆员的Hadoop简明手册》包括5个部分。第1章概述分布式大数据的基本概念,以及开源软件Hadoop的历史、生态体系及主要版本的变化。第2章概述核心架构中的计算资源分配、列式计算的工具及索引。第3章概述分布式计算的MapReduce方案,这也是*为通用的一种方案,能满足海量数据的处理。第4章概述如何优化Hadoop的案例。*后,附录介绍Hado叩家族产品。 顾立平(Alan Ku),博士、教授。在中国科学院文献情报中心从事开放获取、著作权、数据权益的政策研究与建议;在中国科学院大学经济与管理学院讲授信息用户与服务研究。学术理念和工作信念是:好做事(态度)、做好事(方向)、做事好(目标)。 第1章 Hadoop概念
1.1 Hadoop简介
1.1.1 Hadoop是什么
1.1.2 Hadoop形成的历史
1.1.3 Hadoop在云计算和大数据中的地位
1.1.4 Hadoop与Google FS的关系
1.1.5 小结
1.2 Hadoop生态系统
1.2.1 Hadoop组成
1.2.2 HDFS
1.2.3 MapReduce
1.3 Hadoop不同版本的变化
1.3.1 Hadoop版本的变化
1.3.2 HDFS→HDFS2
1.3.3 MapReduce 1.0→MapReduce 2.0
第2章 Hadoop的YARN、HBase、Hive组件
2.1 YARN
2.1.1 YARN的基本组成结构
2.1.2 YARN的工作流程
2.2 HBase
2.2.1 NoSQL数据库
2.2.2 HBase分布式数据库
2.3 Hive数据仓库系统
2.3.1 Hive的定义
2.3.2 Hive和数据库的异同
2.3.3 部分查询逻辑实现举例
第3章 MapReduce入门
3.1 MapReduce初析
3.2 MapReduce运行机制
3.3 Map函数和Reduce函数
3.4 Mapper和Reducer抽象类
3.5 Maplkeduce的最小驱动类
3.6 MapReduce的输入与输出
3.6.1 MapReduce的输入InputFormat
3.6.2 MapReduce的输出OutputFormat
3.7 自定义Writable和WritableComparable
3.8 技术详解
3.8.1 Combiner详解
3.8.2 Partitioner详解
3.8.3 Distributed FileSystem详解
3.9 Hadoop工具介绍
3.10 Counter-计数器和自定义Counter计数器
第4章 基于Hadoop二次开发实战
4.1 MapReduce的优化
4.2 Hadoop小文件优化
4.3 任务调度
附录 Hadoop家族产品
-
内容简介:
《数据馆员的Hadoop简明手册》旨在协助初级数据馆员们能够迅速了解Hadoop的知识、用途及整体概貌,作为进一步实践操作之前的入门基础读物。
本手册力求简单、通俗、易懂,既不泛泛之谈,也不过早深入细节,而是力求把握重点。事实上,唯有实践才能真正理解Hadoop的有趣之处和局限之处,但在实践之前,或者考虑选择架构之前,如果有这么一本手册,会容易理解、沟通及评估。
《数据馆员的Hadoop简明手册》包括5个部分。第1章概述分布式大数据的基本概念,以及开源软件Hadoop的历史、生态体系及主要版本的变化。第2章概述核心架构中的计算资源分配、列式计算的工具及索引。第3章概述分布式计算的MapReduce方案,这也是*为通用的一种方案,能满足海量数据的处理。第4章概述如何优化Hadoop的案例。*后,附录介绍Hado叩家族产品。
-
作者简介:
顾立平(Alan Ku),博士、教授。在中国科学院文献情报中心从事开放获取、著作权、数据权益的政策研究与建议;在中国科学院大学经济与管理学院讲授信息用户与服务研究。学术理念和工作信念是:好做事(态度)、做好事(方向)、做事好(目标)。
-
目录:
第1章 Hadoop概念
1.1 Hadoop简介
1.1.1 Hadoop是什么
1.1.2 Hadoop形成的历史
1.1.3 Hadoop在云计算和大数据中的地位
1.1.4 Hadoop与Google FS的关系
1.1.5 小结
1.2 Hadoop生态系统
1.2.1 Hadoop组成
1.2.2 HDFS
1.2.3 MapReduce
1.3 Hadoop不同版本的变化
1.3.1 Hadoop版本的变化
1.3.2 HDFS→HDFS2
1.3.3 MapReduce 1.0→MapReduce 2.0
第2章 Hadoop的YARN、HBase、Hive组件
2.1 YARN
2.1.1 YARN的基本组成结构
2.1.2 YARN的工作流程
2.2 HBase
2.2.1 NoSQL数据库
2.2.2 HBase分布式数据库
2.3 Hive数据仓库系统
2.3.1 Hive的定义
2.3.2 Hive和数据库的异同
2.3.3 部分查询逻辑实现举例
第3章 MapReduce入门
3.1 MapReduce初析
3.2 MapReduce运行机制
3.3 Map函数和Reduce函数
3.4 Mapper和Reducer抽象类
3.5 Maplkeduce的最小驱动类
3.6 MapReduce的输入与输出
3.6.1 MapReduce的输入InputFormat
3.6.2 MapReduce的输出OutputFormat
3.7 自定义Writable和WritableComparable
3.8 技术详解
3.8.1 Combiner详解
3.8.2 Partitioner详解
3.8.3 Distributed FileSystem详解
3.9 Hadoop工具介绍
3.10 Counter-计数器和自定义Counter计数器
第4章 基于Hadoop二次开发实战
4.1 MapReduce的优化
4.2 Hadoop小文件优化
4.3 任务调度
附录 Hadoop家族产品
查看详情
-
全新
北京市丰台区
平均发货28小时
成功完成率86.77%
-
全新
河北省保定市
平均发货23小时
成功完成率86.15%
-
全新
北京市朝阳区
平均发货24小时
成功完成率83.25%
-
全新
江苏省南京市
平均发货5小时
成功完成率98.61%
-
全新
山东省泰安市
平均发货26小时
成功完成率90.41%
-
九品
河北省衡水市
平均发货11小时
成功完成率97.14%
-
全新
北京市丰台区
平均发货26小时
成功完成率84.63%
-
全新
北京市海淀区
平均发货16小时
成功完成率88.86%
-
全新
北京市海淀区
平均发货9小时
成功完成率97.83%
-
全新
广东省广州市
平均发货10小时
成功完成率95.1%
-
全新
江苏省无锡市
平均发货8小时
成功完成率96.57%
-
全新
北京市通州区
平均发货10小时
成功完成率91.96%
-
全新
天津市西青区
平均发货14小时
成功完成率90.86%
-
全新
河北省保定市
平均发货23小时
成功完成率84.25%
-
九五品
北京市东城区
平均发货8小时
成功完成率90.32%
-
九五品
北京市房山区
平均发货9小时
成功完成率92.32%
-
全新
北京市东城区
平均发货21小时
成功完成率88.53%
-
全新
北京市通州区
平均发货9小时
成功完成率89.35%
-
全新
江苏省南京市
平均发货12小时
成功完成率85.73%
-
八品
内蒙古包头市
平均发货18小时
成功完成率95.83%
-
全新
山东省潍坊市
平均发货17小时
成功完成率82.79%
-
全新
江苏省无锡市
平均发货9小时
成功完成率96.6%
-
全新
北京市通州区
平均发货9小时
成功完成率94.68%
-
全新
四川省成都市
平均发货10小时
成功完成率96.09%
-
全新
北京市西城区
平均发货12小时
成功完成率94.16%
-
全新
四川省成都市
平均发货21小时
成功完成率90.03%
-
全新
山东省潍坊市
平均发货17小时
成功完成率82.79%
-
全新
上海市浦东新区
平均发货17小时
成功完成率85.32%
-
八五品
上海市宝山区
平均发货11小时
成功完成率96.17%
-
九五品
北京市丰台区
平均发货8小时
成功完成率96.95%
-
全新
广东省广州市
平均发货7小时
成功完成率90.43%
-
全新
北京市朝阳区
平均发货12小时
成功完成率94.3%
-
全新
广东省广州市
平均发货9小时
成功完成率88.54%
-
数据馆员的Hadoop简明手册
正版图书。概不议价!请勿催单!急单勿拍!!!套装书请咨询后再拍。小本生意,经营不易,喜欢申请违约金和退款的同行与书友请绕行
全新
湖南省邵阳市
平均发货3小时
成功完成率85.11%
-
九五品
河南省信阳市
平均发货8小时
成功完成率94.5%
-
2018年 印刷
全新
北京市海淀区
平均发货53小时
成功完成率44.44%
-
全新
河北省保定市
平均发货24小时
成功完成率80.81%
-
全新
河北省保定市
平均发货22小时
成功完成率80.52%
-
全新
河北省保定市
平均发货18小时
成功完成率84.56%