大数据技术基础教程
出版时间:
2024-03
版次:
1
ISBN:
9787121475078
定价:
49.80
装帧:
其他
开本:
16开
页数:
272页
字数:
272千字
-
本书系统介绍大数据技术的与应用,主要内容包括基本概念、分布式计算编程基础、hadoop系统、分布式文件系统hdf、分布式数据库hbae、分布式计算框架mapreduce、数据仓库hive、流计算park treaming、数据可视化、大数据的电商营销案例、好友案例等章节,涵盖了海量数据的高效存储、非结构化数据存储和访问、分布式并行编程、数据仓库、实时计算、数据可视化、电商营销、好友等各个方面的内容。本书以简单易懂的语言、生动有趣的实例和图形展示知识点,将概念、与应用融会贯通,并对大数据工具软件进行了细致的梳理。
章 绪论1
1.1 大数据的发展历程1
1.2 大数据的概念4
1.3 大数据的特征5
1.4 大数据的应用6
1.5 大数据分析方法10
1.6 大数据面临的挑战11
题12
第2章 分布式计算编程基础13
2.1 分布式系统13
2.2 分布式计算架构15
2.3 分布式文件系统16
2.4 cap 定理18
题21
第3章 大数据处理框架 hadoop22
3.1 hadoop简介22
3.2 hadoop 生态系统24
3.3 hadoop 的安装与使用31
题40
第4章 hadoop 分布式文件系统42
4.1 hdfs 简介42
4.2 hdfs的设计原则43
4.3 hdfs 的核心概念44
4.4 hdfs 的体系结构45
4.5 hdfs 的存储47
4.6 hdfs 的数据读写流程49
4.7 hdfs 的编程实现53
题57
第5章 分布式数据库 hbase59
5.1 hbase 简介59
5.2 hbase 数据模型60
5.3 hbase 的系统架构64
5.4 hbase 表结构设计67
5.5 hbase 的数据读写流程69
5.6 hbase 编程实践72
题76
第6章 分布式计算框架 mapreduce77
6.1 mapreduce 简介77
6.2 mapreduce 的计算模型77
6.3 mapreduce 的工作78
6.4 mapreduce 编程实践81
题89
第7章 数据仓库 hive91
7.1 hive 简介91
7.2 hive 的架构93
7.3 hive 的数据类型及应用95
7.4 hive 的数据模型97
7.5 ddl 的应用98
7.6 dml 的应用101
7.7 bc 访问103
题104
第8章 spark streaming105
8.1 流计算概述105
8.2 流计算的概念106
8.3 spark 概述107
8.4 spark standalone 模式的架构108
8.5 spark streaming简介110
8.6 编写 spark streaming 程序的基本步骤111
8.7 创建 streamingcontext 对象111
8.8 spark streaming 数据源112
8.9 spark streaming 程序示例113
题116
第9章 数据可视化117
9.1 可视化概述117
9.2 可视化的作用118
9.3 可视化工具119
9.4 可视化典型案例125
题126
0章 基于大数据的电商营销128
10.1 数据预处理概述128
10.2 数据探索与可视化132
1章 好友案例分析140
11.1 任务需求140
11.2 准备工作140
11.3 创建 maven 项目143
11.4 friendremend 程序的实现148
11.5 运行程序与结果验证157
参文献161
-
内容简介:
本书系统介绍大数据技术的与应用,主要内容包括基本概念、分布式计算编程基础、hadoop系统、分布式文件系统hdf、分布式数据库hbae、分布式计算框架mapreduce、数据仓库hive、流计算park treaming、数据可视化、大数据的电商营销案例、好友案例等章节,涵盖了海量数据的高效存储、非结构化数据存储和访问、分布式并行编程、数据仓库、实时计算、数据可视化、电商营销、好友等各个方面的内容。本书以简单易懂的语言、生动有趣的实例和图形展示知识点,将概念、与应用融会贯通,并对大数据工具软件进行了细致的梳理。
-
目录:
章 绪论1
1.1 大数据的发展历程1
1.2 大数据的概念4
1.3 大数据的特征5
1.4 大数据的应用6
1.5 大数据分析方法10
1.6 大数据面临的挑战11
题12
第2章 分布式计算编程基础13
2.1 分布式系统13
2.2 分布式计算架构15
2.3 分布式文件系统16
2.4 cap 定理18
题21
第3章 大数据处理框架 hadoop22
3.1 hadoop简介22
3.2 hadoop 生态系统24
3.3 hadoop 的安装与使用31
题40
第4章 hadoop 分布式文件系统42
4.1 hdfs 简介42
4.2 hdfs的设计原则43
4.3 hdfs 的核心概念44
4.4 hdfs 的体系结构45
4.5 hdfs 的存储47
4.6 hdfs 的数据读写流程49
4.7 hdfs 的编程实现53
题57
第5章 分布式数据库 hbase59
5.1 hbase 简介59
5.2 hbase 数据模型60
5.3 hbase 的系统架构64
5.4 hbase 表结构设计67
5.5 hbase 的数据读写流程69
5.6 hbase 编程实践72
题76
第6章 分布式计算框架 mapreduce77
6.1 mapreduce 简介77
6.2 mapreduce 的计算模型77
6.3 mapreduce 的工作78
6.4 mapreduce 编程实践81
题89
第7章 数据仓库 hive91
7.1 hive 简介91
7.2 hive 的架构93
7.3 hive 的数据类型及应用95
7.4 hive 的数据模型97
7.5 ddl 的应用98
7.6 dml 的应用101
7.7 bc 访问103
题104
第8章 spark streaming105
8.1 流计算概述105
8.2 流计算的概念106
8.3 spark 概述107
8.4 spark standalone 模式的架构108
8.5 spark streaming简介110
8.6 编写 spark streaming 程序的基本步骤111
8.7 创建 streamingcontext 对象111
8.8 spark streaming 数据源112
8.9 spark streaming 程序示例113
题116
第9章 数据可视化117
9.1 可视化概述117
9.2 可视化的作用118
9.3 可视化工具119
9.4 可视化典型案例125
题126
0章 基于大数据的电商营销128
10.1 数据预处理概述128
10.2 数据探索与可视化132
1章 好友案例分析140
11.1 任务需求140
11.2 准备工作140
11.3 创建 maven 项目143
11.4 friendremend 程序的实现148
11.5 运行程序与结果验证157
参文献161
查看详情
-
全新
湖北省武汉市
平均发货16小时
成功完成率91.24%
-
全新
河北省保定市
平均发货31小时
成功完成率79.44%
-
全新
-
全新
四川省成都市
平均发货56小时
成功完成率78.55%
-
全新
-
全新
四川省成都市
平均发货14小时
成功完成率75.46%
-
全新
河北省保定市
平均发货25小时
成功完成率85.84%
-
全新
江苏省无锡市
平均发货9小时
成功完成率93.73%
-
全新
山东省泰安市
平均发货9小时
成功完成率96.19%
-
全新
-
全新
江苏省无锡市
平均发货11小时
成功完成率94.12%
-
全新
江苏省无锡市
平均发货9小时
成功完成率88.33%
-
全新
河北省保定市
平均发货27小时
成功完成率83.22%
-
全新
河北省保定市
平均发货28小时
成功完成率84.87%
-
全新
河北省保定市
平均发货30小时
成功完成率83.17%
-
全新
天津市河北区
平均发货27小时
成功完成率81.4%
-
全新
河北省保定市
平均发货15小时
成功完成率93.97%
-
全新
河北省保定市
平均发货23小时
成功完成率92.27%
-
九五品
湖北省武汉市
平均发货25小时
成功完成率71.5%
-
全新
-
全新
江西省南昌市
平均发货19小时
成功完成率86.1%
-
全新
湖北省武汉市
平均发货15小时
成功完成率85.48%
-
全新
北京市丰台区
平均发货4小时
成功完成率33.33%
-
全新
-
大数据技术基础教程
正版书籍,电脑自动采集,无法识别套书和分册,套书请咨询客服后下单!或致电18986128452
全新
湖北省武汉市
平均发货14小时
成功完成率86.28%
-
全新
北京市海淀区
平均发货8小时
成功完成率95.59%
-
全新
山东省泰安市
平均发货10小时
成功完成率83.33%