Hadoop技术详解/“十二五”国家重点图书出版规划项目

Hadoop技术详解/“十二五”国家重点图书出版规划项目
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , , ,
2013-12
版次: 1
ISBN: 9787115333322
定价: 59.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 248页
字数: 334千字
正文语种: 简体中文
原版书名: Hadoop Operations
19人买过
  •   Hadoop正在成为数据中心进行大型数据处理的实际标准,但市场中却一直缺少关于它的详细操作说明书Hadoop技术详解/“十二五”国家重点图书出版规划项目》作者EricSammer系Cloudera公司的首席架构师,全书将从计划、安装、配置Hadoop系统开始讲起,一直深入到系统调试、维护等方面的知识,向读者展示了Hadoop生产运行环境的详细情况。同时,《Hadoop技术详解/“十二五”国家重点图书出版规划项目》并不只是简述所有的操作工序,而是突出示范了关键部署中的关键操作。
      Hadoop技术详解/“十二五”国家重点图书出版规划项目》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。 Eric Sammer:Cloudera公司首席架构师,主要工作是协助客户做Hadoop及相关大型项目的规划、部署、使用和开发。他在开发和运营分布式、高并发的数据摄取和处理系统方面拥有丰富的经验。 第1章简介
    第2章HDFS
    2.1目标和动机
    2.2设计
    2.3守护进程
    2.4读写数据
    2.4.1数据读取流程
    2.4.2数据写操作流程
    2.5管理文件系统元数据
    2.6NameNode的高可用性
    2.7NameNode联盟
    2.8访问与集成
    2.8.1命令行工具
    2.8.2用户空间文件系统(FUSE)
    2.8.3表示状态传输(REST)的支持

    第3章MapReduce
    3.1MapReduce的若干阶段
    3.2HadoopMapReduce简介
    3.2.1后台程序
    3.2.2出错处理
    3.3YARN

    第4章规划一个Hadoop集群
    4.1挑选Hadoop的发行版本
    4.1.1ApacheHadoop
    4.1.2Cloudera的ApacheHadoop发行版本
    4.1.3版本和功能
    4.1.4我应该使用哪个版本
    4.2硬件选型
    4.2.1主节点硬件的选择
    4.2.2工作节点的硬件选择
    4.2.3集群的大小
    4.2.4刀片服务器、存储区域网络(SAN)和虚拟化
    4.3操作系统的选择和准备
    4.3.1部署规划
    4.3.2软件
    4.3.3主机名、DNS和标识
    4.3.4用户、组和特权
    4.4内核调整
    4.4.1vm.swappiness
    4.4.2vm.overcommit_memory
    4.5磁盘配置
    4.5.1选择文件系统
    4.5.2挂载选项
    4.6网络设计
    4.6.1Hadoop中的网络使用:回顾
    4.6.21Gb与10Gb网络
    4.6.3典型的网络拓扑

    第5章安装和配置
    5.1安装Hadoop
    5.1.1ApacheHadoop
    5.1.2CDH
    5.2配置概述
    5.3环境变量和Shell脚本
    5.4日志配置
    5.5HDFS
    5.5.1识别和定位
    5.5.2优化与调整
    5.5.3格式化NameNode
    5.5.4创建/tmp目录
    5.6NameNode的高可靠性
    5.6.1隔离(Fencing)选项
    5.6.2基本配置
    5.6.3自动失效备援配置
    5.6.4格式化和引导NameNode启动
    5.7NameNode联盟(Federation)
    5.8MapReduce
    5.8.1识别和定位
    5.8.2优化和调整
    5.9机架拓扑
    5.10安全

    第6章用户标识、身份验证和授权
    6.1用户标识
    6.2Kerberos和Hadoop
    6.2.1Kerberos
    6.2.2Hadoop上的Kerberos支持
    6.3授权
    6.3.1HDFS
    6.3.2MapReduce
    6.3.3其他工具和系统
    6.4集成试试

    第7章资源管理
    7.1何谓资源管理
    7.2HDFS配额
    7.3MapReduce调度器
    7.3.1先进先出(FIFO)调度器
    7.3.2公平调度器
    7.3.3计算能力调度器(CapacityScheduler)
    7.3.4未来发展

    第8章集群维护
    8.1Hadoop流程管理
    8.1.1用初始化脚本管理进程
    8.1.2手动管理进程
    8.2HDFS维护任务
    8.2.1添加一个DataNode
    8.2.2卸载DataNode
    8.2.3用fsck来检查文件系统的一致性
    8.2.4HDFS块数据均衡
    8.2.5处理坏磁盘
    8.3MapReduce维护任务
    8.3.1添加tasktracker
    8.3.2卸载tasktracker
    8.3.3终结MapReduce作业
    8.3.4终结MapReduce任务
    8.3.5处理列入黑名单的tasktracker

    第9章故障分析与排查
    9.1鉴别诊断(DifferentialDiagnosis)
    9.2故障和问题
    9.2.1人类(自己)
    9.2.2配置错误
    9.2.3硬件故障
    9.2.4资源枯竭
    9.2.5主机标识和命名
    9.2.6网络分区
    9.3“计算机插好了么?”
    9.4治疗和护理
    9.5实战案例
    9.5.1神秘的瓶颈
    9.5.2127.0.0.1这个地址不存在

    第10章监控
    10.1概览
    10.2Hadoop度量(Metrics)
    10.2.1ApacheHadoop0.20.0和CDH3(metrics1)
    10.2.2ApacheHadoop0.20.203及之后的版本、CDH4(metrics2)
    10.2.3SNMP
    10.3健康监控
    10.3.1主机级别的检查
    10.3.2所有Hadoop进程
    10.3.3HDFS检查
    10.3.4MapReduce检查

    第11章备份与恢复
    11.1数据备份
    11.1.1分布式拷贝(distcp)
    11.1.2并行提取数据
    11.2NameNode元数据
    附录弃用的配置属性
  • 内容简介:
      Hadoop正在成为数据中心进行大型数据处理的实际标准,但市场中却一直缺少关于它的详细操作说明书Hadoop技术详解/“十二五”国家重点图书出版规划项目》作者EricSammer系Cloudera公司的首席架构师,全书将从计划、安装、配置Hadoop系统开始讲起,一直深入到系统调试、维护等方面的知识,向读者展示了Hadoop生产运行环境的详细情况。同时,《Hadoop技术详解/“十二五”国家重点图书出版规划项目》并不只是简述所有的操作工序,而是突出示范了关键部署中的关键操作。
      Hadoop技术详解/“十二五”国家重点图书出版规划项目》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
  • 作者简介:
    Eric Sammer:Cloudera公司首席架构师,主要工作是协助客户做Hadoop及相关大型项目的规划、部署、使用和开发。他在开发和运营分布式、高并发的数据摄取和处理系统方面拥有丰富的经验。
  • 目录:
    第1章简介
    第2章HDFS
    2.1目标和动机
    2.2设计
    2.3守护进程
    2.4读写数据
    2.4.1数据读取流程
    2.4.2数据写操作流程
    2.5管理文件系统元数据
    2.6NameNode的高可用性
    2.7NameNode联盟
    2.8访问与集成
    2.8.1命令行工具
    2.8.2用户空间文件系统(FUSE)
    2.8.3表示状态传输(REST)的支持

    第3章MapReduce
    3.1MapReduce的若干阶段
    3.2HadoopMapReduce简介
    3.2.1后台程序
    3.2.2出错处理
    3.3YARN

    第4章规划一个Hadoop集群
    4.1挑选Hadoop的发行版本
    4.1.1ApacheHadoop
    4.1.2Cloudera的ApacheHadoop发行版本
    4.1.3版本和功能
    4.1.4我应该使用哪个版本
    4.2硬件选型
    4.2.1主节点硬件的选择
    4.2.2工作节点的硬件选择
    4.2.3集群的大小
    4.2.4刀片服务器、存储区域网络(SAN)和虚拟化
    4.3操作系统的选择和准备
    4.3.1部署规划
    4.3.2软件
    4.3.3主机名、DNS和标识
    4.3.4用户、组和特权
    4.4内核调整
    4.4.1vm.swappiness
    4.4.2vm.overcommit_memory
    4.5磁盘配置
    4.5.1选择文件系统
    4.5.2挂载选项
    4.6网络设计
    4.6.1Hadoop中的网络使用:回顾
    4.6.21Gb与10Gb网络
    4.6.3典型的网络拓扑

    第5章安装和配置
    5.1安装Hadoop
    5.1.1ApacheHadoop
    5.1.2CDH
    5.2配置概述
    5.3环境变量和Shell脚本
    5.4日志配置
    5.5HDFS
    5.5.1识别和定位
    5.5.2优化与调整
    5.5.3格式化NameNode
    5.5.4创建/tmp目录
    5.6NameNode的高可靠性
    5.6.1隔离(Fencing)选项
    5.6.2基本配置
    5.6.3自动失效备援配置
    5.6.4格式化和引导NameNode启动
    5.7NameNode联盟(Federation)
    5.8MapReduce
    5.8.1识别和定位
    5.8.2优化和调整
    5.9机架拓扑
    5.10安全

    第6章用户标识、身份验证和授权
    6.1用户标识
    6.2Kerberos和Hadoop
    6.2.1Kerberos
    6.2.2Hadoop上的Kerberos支持
    6.3授权
    6.3.1HDFS
    6.3.2MapReduce
    6.3.3其他工具和系统
    6.4集成试试

    第7章资源管理
    7.1何谓资源管理
    7.2HDFS配额
    7.3MapReduce调度器
    7.3.1先进先出(FIFO)调度器
    7.3.2公平调度器
    7.3.3计算能力调度器(CapacityScheduler)
    7.3.4未来发展

    第8章集群维护
    8.1Hadoop流程管理
    8.1.1用初始化脚本管理进程
    8.1.2手动管理进程
    8.2HDFS维护任务
    8.2.1添加一个DataNode
    8.2.2卸载DataNode
    8.2.3用fsck来检查文件系统的一致性
    8.2.4HDFS块数据均衡
    8.2.5处理坏磁盘
    8.3MapReduce维护任务
    8.3.1添加tasktracker
    8.3.2卸载tasktracker
    8.3.3终结MapReduce作业
    8.3.4终结MapReduce任务
    8.3.5处理列入黑名单的tasktracker

    第9章故障分析与排查
    9.1鉴别诊断(DifferentialDiagnosis)
    9.2故障和问题
    9.2.1人类(自己)
    9.2.2配置错误
    9.2.3硬件故障
    9.2.4资源枯竭
    9.2.5主机标识和命名
    9.2.6网络分区
    9.3“计算机插好了么?”
    9.4治疗和护理
    9.5实战案例
    9.5.1神秘的瓶颈
    9.5.2127.0.0.1这个地址不存在

    第10章监控
    10.1概览
    10.2Hadoop度量(Metrics)
    10.2.1ApacheHadoop0.20.0和CDH3(metrics1)
    10.2.2ApacheHadoop0.20.203及之后的版本、CDH4(metrics2)
    10.2.3SNMP
    10.3健康监控
    10.3.1主机级别的检查
    10.3.2所有Hadoop进程
    10.3.3HDFS检查
    10.3.4MapReduce检查

    第11章备份与恢复
    11.1数据备份
    11.1.1分布式拷贝(distcp)
    11.1.2并行提取数据
    11.2NameNode元数据
    附录弃用的配置属性
查看详情
系列丛书 / 更多
Hadoop技术详解/“十二五”国家重点图书出版规划项目
HBase权威指南
[美]Lars George 著;代志远、刘佳、蒋杰 译
Hadoop技术详解/“十二五”国家重点图书出版规划项目
大数据日知录:架构与算法
张俊林 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
现代麻醉学(第4版全2册)
邓小明、姚尚龙、于布为 编
Hadoop技术详解/“十二五”国家重点图书出版规划项目
中国机械史 图志卷
中国机械工程学会 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
工程博弈论基础及电力系统应用
梅生伟、刘锋 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
房地产法学
李东方 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
面向应急管理的人工社会构建与计算实验
邱晓刚、陈彬、张鹏 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
土木工程材料/“十二五”国家重点图书出版规划项目
迟培云、葛宏翔、王大成 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
中国老年保障体系研究/“十二五”国家重点图书出版规划项目
王延中 著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
大数据分析:点"数"成金
[美]Frank J. Ohlhorst 著;王伟军、刘凯、杨光 译;Jenny Sun 校
Hadoop技术详解/“十二五”国家重点图书出版规划项目
危险化学品安全技术大典(第V卷)
中国石油化工股份有限公司青岛安全工程研究院、国家安全生产监督管理总局化学品登记中心、组织 编
Hadoop技术详解/“十二五”国家重点图书出版规划项目
全国水产养殖主推技术/“十二五”国家重点图书出版规划项目
钱银龙 编
相关图书 / 更多
Hadoop技术详解/“十二五”国家重点图书出版规划项目
Hadoop技术与应用()
徐鲁辉
Hadoop技术详解/“十二五”国家重点图书出版规划项目
Hadoop生态案例详解与项目实战
王盟 王新强
Hadoop技术详解/“十二五”国家重点图书出版规划项目
HarmonyOS移动应用开发(ArkTS版)
刘安战;余雨萍;陈争艳
Hadoop技术详解/“十二五”国家重点图书出版规划项目
Hadoop大数据分布式计算框架--原理与应用
杨成伟;祝翠玲;刘位龙
Hadoop技术详解/“十二五”国家重点图书出版规划项目
Hadoop大数据平台搭建与应用(工作手册式)(微课版)
时东晓
Hadoop技术详解/“十二五”国家重点图书出版规划项目
Hadoop大数据平台构建与应用(第2版)
米洪 陈永
Hadoop技术详解/“十二五”国家重点图书出版规划项目
Hadoop大数据技术与项目实战
王小洁
Hadoop技术详解/“十二五”国家重点图书出版规划项目
HarmonyOS应用程序开发与实战(Java版)
姚信威
Hadoop技术详解/“十二五”国家重点图书出版规划项目
Hadoop简明教程
刘科峰
Hadoop技术详解/“十二五”国家重点图书出版规划项目
Harper儿童皮肤病学(上下卷),第4版(翻译版)
马琳;王华;姚志荣;徐子刚
Hadoop技术详解/“十二五”国家重点图书出版规划项目
Hadoop大数据技术原理与应用(第2版)
黑马程序员
Hadoop技术详解/“十二五”国家重点图书出版规划项目
Hadoop生态系统及开发
深圳市讯方技术股份有限公司
您可能感兴趣 / 更多
Hadoop技术详解/“十二五”国家重点图书出版规划项目
亚拉山大的读心术(数学大师的逻辑课) 伦理学、逻辑学 [美]雷蒙德·m.斯穆里安(raymondm.smullyan)
[美]雷蒙德·m.斯穆里安(raymondm.smullyan)
Hadoop技术详解/“十二五”国家重点图书出版规划项目
纳博科夫精选集第五辑
[美]弗拉基米尔·纳博科夫著
Hadoop技术详解/“十二五”国家重点图书出版规划项目
九桃盘(美国二十世纪重要女诗人玛丽安·摩尔诗歌精选集,由知名女诗人和女性诗学研究者倪志娟倾情翻译)
[美]玛丽安•摩尔
Hadoop技术详解/“十二五”国家重点图书出版规划项目
全新正版图书 制造德·戴维尼浙江教育出版社9787572276880
[美]理查德·戴维尼
Hadoop技术详解/“十二五”国家重点图书出版规划项目
血泪之泣
[美]希瑟·丘·麦克亚当
Hadoop技术详解/“十二五”国家重点图书出版规划项目
(当代学术棱镜译丛)艺术批评入门:历史、策略与声音
[美]克尔·休斯顿
Hadoop技术详解/“十二五”国家重点图书出版规划项目
金钱游戏(划时代增订版):深层透析金融游戏表象之下的规则与黑箱 长达60年盘踞金融畅销榜的现象级作品
[美]亚当·史密斯(Adam Smith) 著;刘寅龙 译
Hadoop技术详解/“十二五”国家重点图书出版规划项目
波西·杰克逊阿波罗的试炼系列第3册:烈焰迷宫
[美]雷克·莱尔顿 著;火皮豆 译
Hadoop技术详解/“十二五”国家重点图书出版规划项目
矿王谷的黎明:塞拉俱乐部诉莫顿案与美国环境法的转变(精装典藏版)
[美]丹尼尔·P.塞尔米,(Daniel,P.Selmi)
Hadoop技术详解/“十二五”国家重点图书出版规划项目
体式神话:瑜伽传统故事精粹(第二版) (从30个体式古老起源中汲取灵感与力量,内附精美插图)
[美]阿兰娜·凯瓦娅(Alanna Kaivalya)[荷]阿诸那·范德·库伊(Arjuna van der Kooij)
Hadoop技术详解/“十二五”国家重点图书出版规划项目
诺奖作家给孩子的阅读课·生命教育(3-9年级,莫言余华的文学启蒙,垫高阅读起点,提升作文能力)
[美]海明威等
Hadoop技术详解/“十二五”国家重点图书出版规划项目
蚯蚓的日记(全4册)【平装版】
[美]朵琳·克罗宁