Hadoop技术详解/“十二五”国家重点图书出版规划项目

Hadoop技术详解/“十二五”国家重点图书出版规划项目
7.6
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美]
出版社: 人民邮电出版社
2013-12
版次: 1
ISBN: 9787115333322
定价: 59.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 248页
字数: 334千字
正文语种: 简体中文
原版书名: Hadoop Operations
  •   Hadoop正在成为数据中心进行大型数据处理的实际标准,但市场中却一直缺少关于它的详细操作说明书Hadoop技术详解/“十二五”国家重点图书出版规划项目》作者EricSammer系Cloudera公司的首席架构师,全书将从计划、安装、配置Hadoop系统开始讲起,一直深入到系统调试、维护等方面的知识,向读者展示了Hadoop生产运行环境的详细情况。同时,《Hadoop技术详解/“十二五”国家重点图书出版规划项目》并不只是简述所有的操作工序,而是突出示范了关键部署中的关键操作。  Hadoop技术详解/“十二五”国家重点图书出版规划项目》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。 Eric Sammer:Cloudera公司首席架构师,主要工作是协助客户做Hadoop及相关大型项目的规划、部署、使用和开发。他在开发和运营分布式、高并发的数据摄取和处理系统方面拥有丰富的经验。 第1章简介第2章HDFS2.1目标和动机2.2设计2.3守护进程2.4读写数据2.4.1数据读取流程2.4.2数据写操作流程2.5管理文件系统元数据2.6NameNode的高可用性2.7NameNode联盟2.8访问与集成2.8.1命令行工具2.8.2用户空间文件系统(FUSE)2.8.3表示状态传输(REST)的支持第3章MapReduce3.1MapReduce的若干阶段3.2HadoopMapReduce简介3.2.1后台程序3.2.2出错处理3.3YARN第4章规划一个Hadoop集群4.1挑选Hadoop的发行版本4.1.1ApacheHadoop4.1.2Cloudera的ApacheHadoop发行版本4.1.3版本和功能4.1.4我应该使用哪个版本4.2硬件选型4.2.1主节点硬件的选择4.2.2工作节点的硬件选择4.2.3集群的大小4.2.4刀片服务器、存储区域网络(SAN)和虚拟化4.3操作系统的选择和准备4.3.1部署规划4.3.2软件4.3.3主机名、DNS和标识4.3.4用户、组和特权4.4内核调整4.4.1vm.swappiness4.4.2vm.overcommit_memory4.5磁盘配置4.5.1选择文件系统4.5.2挂载选项4.6网络设计4.6.1Hadoop中的网络使用:回顾4.6.21Gb与10Gb网络4.6.3典型的网络拓扑第5章安装和配置5.1安装Hadoop5.1.1ApacheHadoop5.1.2CDH5.2配置概述5.3环境变量和Shell脚本5.4日志配置5.5HDFS5.5.1识别和定位5.5.2优化与调整5.5.3格式化NameNode5.5.4创建/tmp目录5.6NameNode的高可靠性5.6.1隔离(Fencing)选项5.6.2基本配置5.6.3自动失效备援配置5.6.4格式化和引导NameNode启动5.7NameNode联盟(Federation)5.8MapReduce5.8.1识别和定位5.8.2优化和调整5.9机架拓扑5.10安全第6章用户标识、身份验证和授权6.1用户标识6.2Kerberos和Hadoop6.2.1Kerberos6.2.2Hadoop上的Kerberos支持6.3授权6.3.1HDFS6.3.2MapReduce6.3.3其他工具和系统6.4集成试试第7章资源管理7.1何谓资源管理7.2HDFS配额7.3MapReduce调度器7.3.1先进先出(FIFO)调度器7.3.2公平调度器7.3.3计算能力调度器(CapacityScheduler)7.3.4未来发展第8章集群维护8.1Hadoop流程管理8.1.1用初始化脚本管理进程8.1.2手动管理进程8.2HDFS维护任务8.2.1添加一个DataNode8.2.2卸载DataNode8.2.3用fsck来检查文件系统的一致性8.2.4HDFS块数据均衡8.2.5处理坏磁盘8.3MapReduce维护任务8.3.1添加tasktracker8.3.2卸载tasktracker8.3.3终结MapReduce作业8.3.4终结MapReduce任务8.3.5处理列入黑名单的tasktracker第9章故障分析与排查9.1鉴别诊断(DifferentialDiagnosis)9.2故障和问题9.2.1人类(自己)9.2.2配置错误9.2.3硬件故障9.2.4资源枯竭9.2.5主机标识和命名9.2.6网络分区9.3“计算机插好了么?”9.4治疗和护理9.5实战案例9.5.1神秘的瓶颈9.5.2127.0.0.1这个地址不存在第10章监控10.1概览10.2Hadoop度量(Metrics)10.2.1ApacheHadoop0.20.0和CDH3(metrics1)10.2.2ApacheHadoop0.20.203及之后的版本、CDH4(metrics2)10.2.3SNMP10.3健康监控10.3.1主机级别的检查10.3.2所有Hadoop进程10.3.3HDFS检查10.3.4MapReduce检查第11章备份与恢复11.1数据备份11.1.1分布式拷贝(distcp)11.1.2并行提取数据11.2NameNode元数据附录弃用的配置属性
  • 内容简介:
      Hadoop正在成为数据中心进行大型数据处理的实际标准,但市场中却一直缺少关于它的详细操作说明书Hadoop技术详解/“十二五”国家重点图书出版规划项目》作者EricSammer系Cloudera公司的首席架构师,全书将从计划、安装、配置Hadoop系统开始讲起,一直深入到系统调试、维护等方面的知识,向读者展示了Hadoop生产运行环境的详细情况。同时,《Hadoop技术详解/“十二五”国家重点图书出版规划项目》并不只是简述所有的操作工序,而是突出示范了关键部署中的关键操作。  Hadoop技术详解/“十二五”国家重点图书出版规划项目》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
  • 作者简介:
    Eric Sammer:Cloudera公司首席架构师,主要工作是协助客户做Hadoop及相关大型项目的规划、部署、使用和开发。他在开发和运营分布式、高并发的数据摄取和处理系统方面拥有丰富的经验。
  • 目录:
    第1章简介第2章HDFS2.1目标和动机2.2设计2.3守护进程2.4读写数据2.4.1数据读取流程2.4.2数据写操作流程2.5管理文件系统元数据2.6NameNode的高可用性2.7NameNode联盟2.8访问与集成2.8.1命令行工具2.8.2用户空间文件系统(FUSE)2.8.3表示状态传输(REST)的支持第3章MapReduce3.1MapReduce的若干阶段3.2HadoopMapReduce简介3.2.1后台程序3.2.2出错处理3.3YARN第4章规划一个Hadoop集群4.1挑选Hadoop的发行版本4.1.1ApacheHadoop4.1.2Cloudera的ApacheHadoop发行版本4.1.3版本和功能4.1.4我应该使用哪个版本4.2硬件选型4.2.1主节点硬件的选择4.2.2工作节点的硬件选择4.2.3集群的大小4.2.4刀片服务器、存储区域网络(SAN)和虚拟化4.3操作系统的选择和准备4.3.1部署规划4.3.2软件4.3.3主机名、DNS和标识4.3.4用户、组和特权4.4内核调整4.4.1vm.swappiness4.4.2vm.overcommit_memory4.5磁盘配置4.5.1选择文件系统4.5.2挂载选项4.6网络设计4.6.1Hadoop中的网络使用:回顾4.6.21Gb与10Gb网络4.6.3典型的网络拓扑第5章安装和配置5.1安装Hadoop5.1.1ApacheHadoop5.1.2CDH5.2配置概述5.3环境变量和Shell脚本5.4日志配置5.5HDFS5.5.1识别和定位5.5.2优化与调整5.5.3格式化NameNode5.5.4创建/tmp目录5.6NameNode的高可靠性5.6.1隔离(Fencing)选项5.6.2基本配置5.6.3自动失效备援配置5.6.4格式化和引导NameNode启动5.7NameNode联盟(Federation)5.8MapReduce5.8.1识别和定位5.8.2优化和调整5.9机架拓扑5.10安全第6章用户标识、身份验证和授权6.1用户标识6.2Kerberos和Hadoop6.2.1Kerberos6.2.2Hadoop上的Kerberos支持6.3授权6.3.1HDFS6.3.2MapReduce6.3.3其他工具和系统6.4集成试试第7章资源管理7.1何谓资源管理7.2HDFS配额7.3MapReduce调度器7.3.1先进先出(FIFO)调度器7.3.2公平调度器7.3.3计算能力调度器(CapacityScheduler)7.3.4未来发展第8章集群维护8.1Hadoop流程管理8.1.1用初始化脚本管理进程8.1.2手动管理进程8.2HDFS维护任务8.2.1添加一个DataNode8.2.2卸载DataNode8.2.3用fsck来检查文件系统的一致性8.2.4HDFS块数据均衡8.2.5处理坏磁盘8.3MapReduce维护任务8.3.1添加tasktracker8.3.2卸载tasktracker8.3.3终结MapReduce作业8.3.4终结MapReduce任务8.3.5处理列入黑名单的tasktracker第9章故障分析与排查9.1鉴别诊断(DifferentialDiagnosis)9.2故障和问题9.2.1人类(自己)9.2.2配置错误9.2.3硬件故障9.2.4资源枯竭9.2.5主机标识和命名9.2.6网络分区9.3“计算机插好了么?”9.4治疗和护理9.5实战案例9.5.1神秘的瓶颈9.5.2127.0.0.1这个地址不存在第10章监控10.1概览10.2Hadoop度量(Metrics)10.2.1ApacheHadoop0.20.0和CDH3(metrics1)10.2.2ApacheHadoop0.20.203及之后的版本、CDH4(metrics2)10.2.3SNMP10.3健康监控10.3.1主机级别的检查10.3.2所有Hadoop进程10.3.3HDFS检查10.3.4MapReduce检查第11章备份与恢复11.1数据备份11.1.1分布式拷贝(distcp)11.1.2并行提取数据11.2NameNode元数据附录弃用的配置属性
查看详情
好书推荐 / 更多
Hadoop技术详解/“十二五”国家重点图书出版规划项目
西北雨
童伟格
Hadoop技术详解/“十二五”国家重点图书出版规划项目
菲利普·迪克的电子梦
[美]菲利普·迪克 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
不成问题的问题:从老舍小说到梅峰电影
梅峰 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
消失的微生物:滥用抗生素引发的健康危机
[美]马丁·布莱泽 著;傅贺 译;严青 校
Hadoop技术详解/“十二五”国家重点图书出版规划项目
不平等的童年 阶级、种族与家庭生活(第2版)
[美]安妮特·拉鲁 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
威权式法治:新加坡的立法、话语与正当性世界法治理论前沿
约西·拉贾(Jothie Rajah) 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
南宋盐榷——食盐产销与政府控制
梁庚尧 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
梦醒子:一位华北乡居者的人生
[英]沈艾娣(Henrietta Harrison) 著;赵妍杰 译
Hadoop技术详解/“十二五”国家重点图书出版规划项目
悠悠哉哉
[日]千叶万希子 后浪 译者;[日]谷口治郎
Hadoop技术详解/“十二五”国家重点图书出版规划项目
清酒之魂
农口尚彦、盐野米松 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
史记的读法
杨照 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
掌中花园
张辰亮 著