大数据计算系统:原理、技术与应用

大数据计算系统:原理、技术与应用
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
2023-10
版次: 1
ISBN: 9787111733072
定价: 79.00
装帧: 其他
开本: 16开
纸张: 胶版纸
页数: 332页
字数: 472千字
1人买过
  • 本书兼顾广度和深度、应用和原理、研发和运维,对于各类大数据计算系统进行了深入的介绍,包括大数据计算系统的基本概念、各种大数据计算系统的配置与程序设计方法、大数据计算系统的运行原理、大数据计算机系统的监控、运维和调优方法等。本书适用于作为数据科学与大数据、计算机等专业本科生和研究生相关课程的教材,还可供大数据领域从业人员参考。 目  录

    前言

    第一部分 基础

    第1章 大数据计算系统概述2

    1.1 大数据计算系统的定义2

    1.1.1 大数据2

    1.1.2 大数据计算4

    1.1.3 大数据计算系统4

    1.2 常见的大数据计算系统6

    1.2.1 批处理计算框架Hadoop6

    1.2.2 分布式计算框架Spark6

    1.2.3 流计算系统Storm7

    1.2.4 分布式图计算框架GraphX7

    1.2.5 大数据计算系统的对比7

    1.3 大数据计算系统的监控与

       运维概述7

    1.3.1 概述7

    1.3.2 监控与运维的范围8

    1.3.3 大数据计算系统的监控与

          运维方法8

    1.3.4 大数据计算系统的运维目标9

    1.4 大数据计算系统的性能优化10

    1.4.1 提升大数据计算系统

          性能的途径10

    1.4.2 提升大数据计算系统

          性能的难度11

    1.4.3 运维与性能优化的关系12

    习题112

    第二部分 应用实现

    第2章 Hadoop的配置与编程14

    2.1 批处理计算框架概述14

    2.1.1 计算框架14

    2.1.2 批处理15

    2.2 Hadoop环境的配置与搭建15

    2.2.1 环境配置前的准备15

    2.2.2 Hadoop安装的预备知识16

    2.2.3 本地/独立模式的配置17

    2.2.4 伪分布式模式的配置18

    2.2.5 全分布式模式的配置20

    2.3 一个简单示例22

    2.3.1 环境与数据的准备22

    2.3.2 在IDEA下建立基于Maven

          的Hadoop项目23

    2.3.3 编写WordCount程序26

    2.3.4 Hadoop程序的运行过程与

          结果查看29

    2.4 MapReduce编程30

    2.4.1 MapReduce计算模型30

    2.4.2 MapReduce程序的运行过程32

    2.4.3 去重38

    习题241

    第3章 HDFS及其应用42

    3.1 HDFS概述42

    3.2 HDFS Shell43

    3.2.1 概述43

    3.2.2 帮助的使用方法44

    3.2.3 通用命令行操作45

    3.3 HDFS目录与数据的浏览47

    3.4 HDFS API48

    3.4.1 概述48

    3.4.2 读文件操作48

    3.4.3 写文件操作48

    3.4.4 FileUtil文件处理49

    3.4.5 HDFS API应用示例51

    习题357

    第4章 Spark的配置与编程58

    4.1 Spark环境的安装与部署59

    4.1.1 Spark的安装59

    4.1.2 Scala的安装60

    4.1.3 Spark的源码编译61

    4.1.4 搭建Spark单机版环境64

    4.1.5 搭建Spark独立运行环境66

    4.1.6 搭建Spark on YARN环境68

    4.1.7 Spark的高可用性部署70

    4.2 Spark的运行72

    4.2.1 Spark程序运行概述72

    4.2.2 Spark的本地运行过程73

    4.2.3 独立运行模式74

    4.2.4 Spark on YARN的运行过程75

    4.2.5 独立运行模式与YARN

          模式的比较76

    4.3 Spark Scala编程76

    4.3.1 Scala的语法76

    4.3.2 Scala编程入门82

    4.3.3 Spark API的使用86

    4.3.4 用Scala开发Spark应用

          程序的案例88

    4.3.5 程序运行过程的分析93

    习题495

    第5章 Storm的配置与编程96

    5.1 流计算概述96

    5.2 Storm概述98

    5.2.1 什么是Storm98

    5.2.2 Storm的特征98

    5.3 Storm开发环境的搭建99

    5.3.1 Storm环境的配置99

    5.3.2 命令行客户端102

    5.3.3 IDEA下建立Storm的

          Maven项目107

    5.4 Storm编程109

    5.4.1 可以与Storm集成的系统109

    5.4.2 计算模型109

    5.4.3 可以使用任何语言110

    5.4.4 简单的API110

    5.5 Storm编程示例—单词计数110

    5.5.1 实现目标110

    5.5.2 建立编写程序的包名111

    5.5.3 编写spouts文件Word-

          Reader112

    5.5.4 编写bolts文件Word-

          Normalizer114

    5.5.5 编写bolts文件WordCounter115

    5.5.6 编写主函数文件Topologoy-

           Main116

    5.5.7 通过主函数文件Topologoy-

          Main运行程序117

    习题5117

    第6章 GraphX及其应用118

    6.1 图计算概述118

    6.1.1 图118

    6.1.2 属性图119

    6.1.3 图计算119

    6.1.4 支持图计算的GraphX120

    6.2 GraphX编程120

    6.2.1 GraphX项目的导入120

    6.2.2 GraphX中属性图的表达120

    6.2.3 图操作符121

    6.3 GraphX编程示例126

    6.3.1 一个简单的GraphX示例126

    6.3.2 GraphX应用编程—

       子图发现129

    6.3.3 GraphX应用编程—

       PageRank130

    习题6132

    第三部分 原理

    第7章 Hadoop的原理134

    7.1 Hadoop的体系结构134

    7.2 MapReduce的工作机制135

    7.2.1 背景135

    7.2.2 计算的执行流程137

    7.2.3 计算的本地性138

    7.3 MapReduce作业的运行机制139

    7.3.1 经典的MapReduce139

    7.3.2 YARN145

    7.4 作业的调
  • 内容简介:
    本书兼顾广度和深度、应用和原理、研发和运维,对于各类大数据计算系统进行了深入的介绍,包括大数据计算系统的基本概念、各种大数据计算系统的配置与程序设计方法、大数据计算系统的运行原理、大数据计算机系统的监控、运维和调优方法等。本书适用于作为数据科学与大数据、计算机等专业本科生和研究生相关课程的教材,还可供大数据领域从业人员参考。
  • 目录:
    目  录

    前言

    第一部分 基础

    第1章 大数据计算系统概述2

    1.1 大数据计算系统的定义2

    1.1.1 大数据2

    1.1.2 大数据计算4

    1.1.3 大数据计算系统4

    1.2 常见的大数据计算系统6

    1.2.1 批处理计算框架Hadoop6

    1.2.2 分布式计算框架Spark6

    1.2.3 流计算系统Storm7

    1.2.4 分布式图计算框架GraphX7

    1.2.5 大数据计算系统的对比7

    1.3 大数据计算系统的监控与

       运维概述7

    1.3.1 概述7

    1.3.2 监控与运维的范围8

    1.3.3 大数据计算系统的监控与

          运维方法8

    1.3.4 大数据计算系统的运维目标9

    1.4 大数据计算系统的性能优化10

    1.4.1 提升大数据计算系统

          性能的途径10

    1.4.2 提升大数据计算系统

          性能的难度11

    1.4.3 运维与性能优化的关系12

    习题112

    第二部分 应用实现

    第2章 Hadoop的配置与编程14

    2.1 批处理计算框架概述14

    2.1.1 计算框架14

    2.1.2 批处理15

    2.2 Hadoop环境的配置与搭建15

    2.2.1 环境配置前的准备15

    2.2.2 Hadoop安装的预备知识16

    2.2.3 本地/独立模式的配置17

    2.2.4 伪分布式模式的配置18

    2.2.5 全分布式模式的配置20

    2.3 一个简单示例22

    2.3.1 环境与数据的准备22

    2.3.2 在IDEA下建立基于Maven

          的Hadoop项目23

    2.3.3 编写WordCount程序26

    2.3.4 Hadoop程序的运行过程与

          结果查看29

    2.4 MapReduce编程30

    2.4.1 MapReduce计算模型30

    2.4.2 MapReduce程序的运行过程32

    2.4.3 去重38

    习题241

    第3章 HDFS及其应用42

    3.1 HDFS概述42

    3.2 HDFS Shell43

    3.2.1 概述43

    3.2.2 帮助的使用方法44

    3.2.3 通用命令行操作45

    3.3 HDFS目录与数据的浏览47

    3.4 HDFS API48

    3.4.1 概述48

    3.4.2 读文件操作48

    3.4.3 写文件操作48

    3.4.4 FileUtil文件处理49

    3.4.5 HDFS API应用示例51

    习题357

    第4章 Spark的配置与编程58

    4.1 Spark环境的安装与部署59

    4.1.1 Spark的安装59

    4.1.2 Scala的安装60

    4.1.3 Spark的源码编译61

    4.1.4 搭建Spark单机版环境64

    4.1.5 搭建Spark独立运行环境66

    4.1.6 搭建Spark on YARN环境68

    4.1.7 Spark的高可用性部署70

    4.2 Spark的运行72

    4.2.1 Spark程序运行概述72

    4.2.2 Spark的本地运行过程73

    4.2.3 独立运行模式74

    4.2.4 Spark on YARN的运行过程75

    4.2.5 独立运行模式与YARN

          模式的比较76

    4.3 Spark Scala编程76

    4.3.1 Scala的语法76

    4.3.2 Scala编程入门82

    4.3.3 Spark API的使用86

    4.3.4 用Scala开发Spark应用

          程序的案例88

    4.3.5 程序运行过程的分析93

    习题495

    第5章 Storm的配置与编程96

    5.1 流计算概述96

    5.2 Storm概述98

    5.2.1 什么是Storm98

    5.2.2 Storm的特征98

    5.3 Storm开发环境的搭建99

    5.3.1 Storm环境的配置99

    5.3.2 命令行客户端102

    5.3.3 IDEA下建立Storm的

          Maven项目107

    5.4 Storm编程109

    5.4.1 可以与Storm集成的系统109

    5.4.2 计算模型109

    5.4.3 可以使用任何语言110

    5.4.4 简单的API110

    5.5 Storm编程示例—单词计数110

    5.5.1 实现目标110

    5.5.2 建立编写程序的包名111

    5.5.3 编写spouts文件Word-

          Reader112

    5.5.4 编写bolts文件Word-

          Normalizer114

    5.5.5 编写bolts文件WordCounter115

    5.5.6 编写主函数文件Topologoy-

           Main116

    5.5.7 通过主函数文件Topologoy-

          Main运行程序117

    习题5117

    第6章 GraphX及其应用118

    6.1 图计算概述118

    6.1.1 图118

    6.1.2 属性图119

    6.1.3 图计算119

    6.1.4 支持图计算的GraphX120

    6.2 GraphX编程120

    6.2.1 GraphX项目的导入120

    6.2.2 GraphX中属性图的表达120

    6.2.3 图操作符121

    6.3 GraphX编程示例126

    6.3.1 一个简单的GraphX示例126

    6.3.2 GraphX应用编程—

       子图发现129

    6.3.3 GraphX应用编程—

       PageRank130

    习题6132

    第三部分 原理

    第7章 Hadoop的原理134

    7.1 Hadoop的体系结构134

    7.2 MapReduce的工作机制135

    7.2.1 背景135

    7.2.2 计算的执行流程137

    7.2.3 计算的本地性138

    7.3 MapReduce作业的运行机制139

    7.3.1 经典的MapReduce139

    7.3.2 YARN145

    7.4 作业的调
查看详情
12
相关图书 / 更多
大数据计算系统:原理、技术与应用
大数学家讲故事:李毓佩数学童话-数学小子杜鲁克
李毓佩
大数据计算系统:原理、技术与应用
大数据驱动的突发事件情报感知及快速响应研究
唐明伟,庄玉良
大数据计算系统:原理、技术与应用
大数据处理技术基础与应用(Hadoop+Spark)
许桂秋 孙海民 胡贵恒
大数据计算系统:原理、技术与应用
大数据警务的崛起
(美)安德鲁.格思里.弗格森
大数据计算系统:原理、技术与应用
大数据时代图书馆服务体系的创新与发展
程结晶
大数据计算系统:原理、技术与应用
大数据观下的国家情报工作制度研究
马海群 等
大数据计算系统:原理、技术与应用
大数据时代政府治理转型研究-(数字政府建设的江苏实践)
范炜烽等著
大数据计算系统:原理、技术与应用
大数据环境下数字图书馆创新发展
金济
大数据计算系统:原理、技术与应用
大数据背景下公众参与环境治理的程度评估与作用机制研究
史亚东
大数据计算系统:原理、技术与应用
大数据医疗:从即时检测设备进行解析
(英)波利亚·阿梅里安,(英)特鲁迪·朗,(英)弗朗索瓦·范·洛格伦伯格
大数据计算系统:原理、技术与应用
大数据可视化编程和应用
倪振松 胡煜华 朱家全 主编 谢岳富 陈建平 副主编
大数据计算系统:原理、技术与应用
大数据思想政治教育模式构建研究(国家社科基金丛书—其他)
林晶 著
您可能感兴趣 / 更多
大数据计算系统:原理、技术与应用
龙与狮的对话: 翻译与马戛尔尼访华使团
王宏志
大数据计算系统:原理、技术与应用
大数据治理:理论与方法
王宏志
大数据计算系统:原理、技术与应用
翻译史研究(2018)
王宏志
大数据计算系统:原理、技术与应用
大数据管理系统原理与技术
王宏志、何震瀛、王鹏、李春静 著
大数据计算系统:原理、技术与应用
国之重器出版工程大数据清洗技术
王宏志 著
大数据计算系统:原理、技术与应用
翻译史研究(2017)
王宏志 著
大数据计算系统:原理、技术与应用
Hadoop集群程序设计与开发
王宏志、李春静 著
大数据计算系统:原理、技术与应用
大数据分析原理与实践
王宏志 著
大数据计算系统:原理、技术与应用
翻译史研究(2016)
王宏志 编
大数据计算系统:原理、技术与应用
新中国中小学教材建设史1949-2000研究丛书:历史卷
王宏志 著
大数据计算系统:原理、技术与应用
C语言程序设计
王宏志、韩志明 主编
大数据计算系统:原理、技术与应用
鲁迅与“左联”
王宏志