R语言大数据技术应用实践

R语言大数据技术应用实践
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
2020-01
版次: 1
ISBN: 9787303247639
装帧: 其他
开本: 16开
纸张: 胶版纸
页数: 352页
字数: 1千字
分类: 语言文字
2人买过
  • 本书详细介绍 R 语言实际应用所需的基本知识,包括 R 语言的基本开发环境、核心概念和数据处理 等,并结合实际案例由潜入深,*后通过较大数据案例全面介绍 R 语言大数据的处理、分析与展示。 该书从零起步,从读者处理大数据业务场景出发,基于实际案例组织内容,对于大数据学习者,该 书覆盖了从零起步使用 R 语言对大数据分析所需要的全部核心内容。 方志军,男,教授,博导,上海交通大学工学博士,美国华盛顿大学访问学者。中国计算机学会/中国人工智能学会/IEEE/ACM高级会员,中国计算机学会多媒体技术专业委员会委员,中国人工智能学会智能服务专业委员会委员,中国管理科学与工程学会常务理事。现任上海工程技术大学电子电气工程学院院长,先后兼任江西省数字媒体重点实验室主任、江西省电子商务工程技术研究中心常务副主任、江西省公共安全视频技术研究中心常务副主任、江西数字智能公共安全产业技术创新战略联盟副理事长、上海长三角科技合作交流促进中心副理事长。 内 容 简 介 2

    前  言 3

    序 4

    目  录 5

    第1章  R语言基础简介 11

    1.1  R语言概述 11

    1.2  为何学习R语言 11

    1.2.1  R语言特点 11

    1.2.2  R在大数据中的优势 12

    1.3  R语言主要应用领域 13

    1.4  R语言开发环境搭建 14

    1.4.1  Windows系统中安装R 14

    1.4.2  Linux系统中安装R 14

    1.4.3  RStudio工具安装与使用 15

    本章习题 16

    第2章  R语言语法基础 18

    2.1  R语言数据类型 18

    2.1.1  R的4种数据类型 18

    2.1.2  字符型的高级技巧 20

    2.1.3  NA和NULL 21

    2.2  R语言数据结构 22

    2.2.1  Array数组 22

    2.2.2  Factor因子 23

    2.2.3  List列表 25

    2.2.4  DataFrame数据框 26

    2.3  R语言程序结构 28

    2.3.1  三种基本结构 28

    2.3.2  for循环 28

    2.3.4  while循环 30

    2.3.5  repeat循环 31

    2.4  R语言向量化计算 32

    2.4.1  向量化计算的概念 32

    2.4.2  冒号运算符 32

    2.4.3  序列生成函数seq和rep 32

    2.4.4  数组之间的运算规则 33

    2.5  强大的apply函数族 34

    2.5.1  apply 34

    2.5.2  lapply 35

    2.5.3  sapply 35

    2.5.4  vapply 36

    2.5.5  mapply 37

    2.5.6  tapply 37

    本章习题 38

    第3章  R语言数据预处理 40

    3.1  数据导入导出 40

    3.1.1  R语言数据导入 40

    3.1.2  导入函数参数匹配 47

    3.1.3  R语言数据导出 48

    3.2  R语言数据处理方法 49

    3.2.1  重复值处理 50

    3.2.2  缺失值处理 50

    3.2.3  空格值处理 52

    3.2.4  字段抽取 53

    3.2.5  记录抽取 54

    3.2.6  随机抽样 54

    3.2.7  记录合并 55

    3.2.8  字段匹配 57

    3.2.9  生成新的字段 58

    3.2.10  数据标准化 59

    3.2.11  数据分组 60

    3.2.12  日期格式处理 62

    3.2.13  日期抽取 63

    3.2.14  变量重命名 63

    本章习题 64

    第4章  R语言数据分析 66

    4.1  基本统计分析 66

    4.1.1  基本概念 66

    4.1.2  基本统计的应用 66

    4.2  对比分析 67

    4.2.1  基本概念 67

    4.2.2  对比分析的应用 68

    4.3  分组分析 71

    4.3.1  基本概念 71

    4.3.2  分组分析的应用 72

    4.4  分布分析 72

    4.4.1  基本概念 72

    4.4.2  分布分析的应用 73

    4.5  交叉分析 75

    4.5.1  基本概念 75

    4.5.2  交叉分析的应用 75

    4.6  结构分析 76

    4.6.1  基本概念 76

    4.6.2  结构分析的应用 76

    4.7  相关分析 79

    4.7.1  基本概念 79

    4.7.2  相关分析的应用 80

    4.8  简单线性回归分析 81

    4.8.1  基本概念 81

    4.8.2  简单线性回归分析的应用 82

    4.9  多重线性回归分析 84

    4.9.1  基本概念 84

    4.9.2  多重线性回归分析的应用 85

    4.10  RFM分析 87

    4.10.1  基本概念 87

    4.10.2  RFM分析的应用 87

    本章习题 90

    第5章  R语言数据可视化 92

    5.1  R语言可视化概述 92

    5.2  饼图 92

    5.2.1  饼图的概念 92

    5.2.2  饼图的使用 93

    5.3  散点图 95

    5.3.1  散点图的概念 95

    5.3.2  散点图的使用 96

    5.4  折线图 100

    5.4.1  折线图的概念 100

    5.4.2  折线图的使用 102

    5.5  柱形图 107

    5.5.1  柱形图的概念 107

    5.5.2  柱形图的使用 107

    5.6  直方图 112

    5.6.1  直方图的概念 112

    5.6.2  直方图的使用 113

    5.7  箱线图 115

    5.7.1  箱线图的概念 115

    5.7.2  箱线图的使用 116

    5.8  树图 118

    5.8.1  树图的概念 118

    5.8.2  树图的使用 118

    5.9  地图 121

    5.9.1  地图的概念 121

    5.9.2  地图的使用 122

    5.10  热力地图 125

    5.10.1  热力地图的概念 125

    5.10.2  热力地图的使用 126

    本章习题 127

    第6章  网页数据抓取 129

    6.1  HTML数据抓取 129

    6.1.1  查看HTML文件 129

    6.1.2  解析hHTML文件内容 130

    6.2  JSON数据抓取 131

    6.2.1  查看JSON文件 131

    6.2.2  获取JSON文件内容 133

    6.3  使用Google开发者工具分析网页结构 134

    6.3.1  Google开发者工具的功能介绍 134

    6.3.2  利用Network标签抓取数 135

    本章习题 136

    第7章  R语言统计与建模 137

    7.1  R语言常用概率分布和渐进性 137

    7.1.1  伯努利分布 137

    7.1.2  二项分布 138

    7.1.3  正态分布 141

    7.1.4  泊松分布 145

    7.1.5  渐进性 147

    7.2  R语言置信区间和假设检验 149

    7.2.1  置信区间和假设检验的概念 149

    7.2.2  置信区间和假设检验的应用 155

    7.3  R语言一元线性回归建模 159

    7.3.1  一元线性回归分析的基本概念 159

    7.3.2  一元线性回归模型 160

    7.3.3  一元残差分析 161

    7.3.4  一元线性回归应用 161

    7.4  R语言多元线性回归建模 168

    7.4.1  多元线性回归模型的概念 168

    7.4.2  多元线性回归模型的结构 168

    7.4.3  单元残差分析 168

    7.4.4  变量选择和逐步回归 170

    7.4.5  多元线性回归应用 170

    7.5  R语言广义线性回归建模 176

    7.5.1  广义线性回归模型 176

    7.5.2  广义线性回归应用 177

    本章习题 181

    第8章  R语言数据挖掘 183

    8.1   数据挖掘简介 183

    8.1.1  数据挖掘的基本概念 183

    8.1.2  数据挖掘的算法 184

    8.1.3  数据挖掘的工具 187

    8.1.4  R在数据挖掘中的优势 189

    8.2  数据挖掘的四大应用场景 189

    8.2.1  数据预测 190

    8.2.2  发现数据的内在结构 191

    8.2.3  发现关联性 192

    8.2.4  模式甄别 194

    8.3  数据挖掘流程 195

    8.3.1  数据挖掘的三个主要阶段 195

    8.3.2  数据挖掘解决问题的思想 197

    8.4  分类预测基本流程 199

    8.4.1  分类预测的基本流程和要素 199

    8.4.2  分类预测错误和模型评价指标 200

    8.4.3  分类预测模型案例 201

    8.5  数据挖掘中的数据预处理 209

    8.5.1  数据清洗 209

    8.5.2  数据集成 213

    8.5.3  数据变换 217

    8.5.4  数据规约 226

    8.6  R语言决策树分类方法 231

    8.6.1  决策树算法介绍 232

    8.6.2  随机森林算法介绍 234

    8.6.3  决策树分类方法的应用 234

    8.7  R语言高级分类方法 243

    8.7.1  基于模型的分类算法 243

    8.7.2  线性判别分析 243

    8.7.3  朴素贝叶斯 244

    8.7.4  bagging算法 245

    8.7.5  boosting算法 245

    8.7.6  高级分类方法的应用 245

    8.8  R语言聚类分析与关联分析 252

    8.8.1  K-Means聚类概念 252

    8.8.2  分层聚类概念 253

    8.8.3  聚类分析的应用 253

    8.8.4  关联规则基本概念 256

    8.8.5  关联分析的应用 257

    8.9  智能推荐 263

    8.9.1  智能推荐模型构建 263

    8.9.2  智能推荐模型评价 269

    8.10  时间序列挖掘 273

    8.10.1  ARIMA模型 273

    8.10.2  其他时间序列模型 279

    8.11  离群点检测 286

    8.11.1  离群点及其检测方法 286

    8.11.2  离群点检验应用 293

    本章习题 297

    第9章  R语言数据分析综合应用 299

    9.1  建立营销响应的模型 299

    9.1.1  实验介绍 299

    9.1.2  相关工具包 299

    9.1.3  探索性数据分析和预处理 301

    9.1.4  建立分类模型 305

    9.2  预测销售额 307

    9.2.1  实验介绍 307

    9.2.2  相关工具包 308

    9.2.3  探索性数据分析和预处理 309

    9.2.4  查看竞争门店的各种信息 321

    9.2.5  建立回归模型 328

    9.3  水质评估 331

    9.3.1  实验介绍 331

    9.3.2  数据预处理 332

    9.3.3  模型构建 333

    9.3.4  水质评价 336

    9.4  财政收入分析预测模型 337

    9.4.1  实验介绍 337

    9.4.2  数据探索分析 338

    9.4.3  模型构建 341

    9.4.4  财政收入预测模型 342

    本章习题 353

    参考文献 355

    附录 356

    二.  习题参考答案 356

     
  • 内容简介:
    本书详细介绍 R 语言实际应用所需的基本知识,包括 R 语言的基本开发环境、核心概念和数据处理 等,并结合实际案例由潜入深,*后通过较大数据案例全面介绍 R 语言大数据的处理、分析与展示。 该书从零起步,从读者处理大数据业务场景出发,基于实际案例组织内容,对于大数据学习者,该 书覆盖了从零起步使用 R 语言对大数据分析所需要的全部核心内容。
  • 作者简介:
    方志军,男,教授,博导,上海交通大学工学博士,美国华盛顿大学访问学者。中国计算机学会/中国人工智能学会/IEEE/ACM高级会员,中国计算机学会多媒体技术专业委员会委员,中国人工智能学会智能服务专业委员会委员,中国管理科学与工程学会常务理事。现任上海工程技术大学电子电气工程学院院长,先后兼任江西省数字媒体重点实验室主任、江西省电子商务工程技术研究中心常务副主任、江西省公共安全视频技术研究中心常务副主任、江西数字智能公共安全产业技术创新战略联盟副理事长、上海长三角科技合作交流促进中心副理事长。
  • 目录:
    内 容 简 介 2

    前  言 3

    序 4

    目  录 5

    第1章  R语言基础简介 11

    1.1  R语言概述 11

    1.2  为何学习R语言 11

    1.2.1  R语言特点 11

    1.2.2  R在大数据中的优势 12

    1.3  R语言主要应用领域 13

    1.4  R语言开发环境搭建 14

    1.4.1  Windows系统中安装R 14

    1.4.2  Linux系统中安装R 14

    1.4.3  RStudio工具安装与使用 15

    本章习题 16

    第2章  R语言语法基础 18

    2.1  R语言数据类型 18

    2.1.1  R的4种数据类型 18

    2.1.2  字符型的高级技巧 20

    2.1.3  NA和NULL 21

    2.2  R语言数据结构 22

    2.2.1  Array数组 22

    2.2.2  Factor因子 23

    2.2.3  List列表 25

    2.2.4  DataFrame数据框 26

    2.3  R语言程序结构 28

    2.3.1  三种基本结构 28

    2.3.2  for循环 28

    2.3.4  while循环 30

    2.3.5  repeat循环 31

    2.4  R语言向量化计算 32

    2.4.1  向量化计算的概念 32

    2.4.2  冒号运算符 32

    2.4.3  序列生成函数seq和rep 32

    2.4.4  数组之间的运算规则 33

    2.5  强大的apply函数族 34

    2.5.1  apply 34

    2.5.2  lapply 35

    2.5.3  sapply 35

    2.5.4  vapply 36

    2.5.5  mapply 37

    2.5.6  tapply 37

    本章习题 38

    第3章  R语言数据预处理 40

    3.1  数据导入导出 40

    3.1.1  R语言数据导入 40

    3.1.2  导入函数参数匹配 47

    3.1.3  R语言数据导出 48

    3.2  R语言数据处理方法 49

    3.2.1  重复值处理 50

    3.2.2  缺失值处理 50

    3.2.3  空格值处理 52

    3.2.4  字段抽取 53

    3.2.5  记录抽取 54

    3.2.6  随机抽样 54

    3.2.7  记录合并 55

    3.2.8  字段匹配 57

    3.2.9  生成新的字段 58

    3.2.10  数据标准化 59

    3.2.11  数据分组 60

    3.2.12  日期格式处理 62

    3.2.13  日期抽取 63

    3.2.14  变量重命名 63

    本章习题 64

    第4章  R语言数据分析 66

    4.1  基本统计分析 66

    4.1.1  基本概念 66

    4.1.2  基本统计的应用 66

    4.2  对比分析 67

    4.2.1  基本概念 67

    4.2.2  对比分析的应用 68

    4.3  分组分析 71

    4.3.1  基本概念 71

    4.3.2  分组分析的应用 72

    4.4  分布分析 72

    4.4.1  基本概念 72

    4.4.2  分布分析的应用 73

    4.5  交叉分析 75

    4.5.1  基本概念 75

    4.5.2  交叉分析的应用 75

    4.6  结构分析 76

    4.6.1  基本概念 76

    4.6.2  结构分析的应用 76

    4.7  相关分析 79

    4.7.1  基本概念 79

    4.7.2  相关分析的应用 80

    4.8  简单线性回归分析 81

    4.8.1  基本概念 81

    4.8.2  简单线性回归分析的应用 82

    4.9  多重线性回归分析 84

    4.9.1  基本概念 84

    4.9.2  多重线性回归分析的应用 85

    4.10  RFM分析 87

    4.10.1  基本概念 87

    4.10.2  RFM分析的应用 87

    本章习题 90

    第5章  R语言数据可视化 92

    5.1  R语言可视化概述 92

    5.2  饼图 92

    5.2.1  饼图的概念 92

    5.2.2  饼图的使用 93

    5.3  散点图 95

    5.3.1  散点图的概念 95

    5.3.2  散点图的使用 96

    5.4  折线图 100

    5.4.1  折线图的概念 100

    5.4.2  折线图的使用 102

    5.5  柱形图 107

    5.5.1  柱形图的概念 107

    5.5.2  柱形图的使用 107

    5.6  直方图 112

    5.6.1  直方图的概念 112

    5.6.2  直方图的使用 113

    5.7  箱线图 115

    5.7.1  箱线图的概念 115

    5.7.2  箱线图的使用 116

    5.8  树图 118

    5.8.1  树图的概念 118

    5.8.2  树图的使用 118

    5.9  地图 121

    5.9.1  地图的概念 121

    5.9.2  地图的使用 122

    5.10  热力地图 125

    5.10.1  热力地图的概念 125

    5.10.2  热力地图的使用 126

    本章习题 127

    第6章  网页数据抓取 129

    6.1  HTML数据抓取 129

    6.1.1  查看HTML文件 129

    6.1.2  解析hHTML文件内容 130

    6.2  JSON数据抓取 131

    6.2.1  查看JSON文件 131

    6.2.2  获取JSON文件内容 133

    6.3  使用Google开发者工具分析网页结构 134

    6.3.1  Google开发者工具的功能介绍 134

    6.3.2  利用Network标签抓取数 135

    本章习题 136

    第7章  R语言统计与建模 137

    7.1  R语言常用概率分布和渐进性 137

    7.1.1  伯努利分布 137

    7.1.2  二项分布 138

    7.1.3  正态分布 141

    7.1.4  泊松分布 145

    7.1.5  渐进性 147

    7.2  R语言置信区间和假设检验 149

    7.2.1  置信区间和假设检验的概念 149

    7.2.2  置信区间和假设检验的应用 155

    7.3  R语言一元线性回归建模 159

    7.3.1  一元线性回归分析的基本概念 159

    7.3.2  一元线性回归模型 160

    7.3.3  一元残差分析 161

    7.3.4  一元线性回归应用 161

    7.4  R语言多元线性回归建模 168

    7.4.1  多元线性回归模型的概念 168

    7.4.2  多元线性回归模型的结构 168

    7.4.3  单元残差分析 168

    7.4.4  变量选择和逐步回归 170

    7.4.5  多元线性回归应用 170

    7.5  R语言广义线性回归建模 176

    7.5.1  广义线性回归模型 176

    7.5.2  广义线性回归应用 177

    本章习题 181

    第8章  R语言数据挖掘 183

    8.1   数据挖掘简介 183

    8.1.1  数据挖掘的基本概念 183

    8.1.2  数据挖掘的算法 184

    8.1.3  数据挖掘的工具 187

    8.1.4  R在数据挖掘中的优势 189

    8.2  数据挖掘的四大应用场景 189

    8.2.1  数据预测 190

    8.2.2  发现数据的内在结构 191

    8.2.3  发现关联性 192

    8.2.4  模式甄别 194

    8.3  数据挖掘流程 195

    8.3.1  数据挖掘的三个主要阶段 195

    8.3.2  数据挖掘解决问题的思想 197

    8.4  分类预测基本流程 199

    8.4.1  分类预测的基本流程和要素 199

    8.4.2  分类预测错误和模型评价指标 200

    8.4.3  分类预测模型案例 201

    8.5  数据挖掘中的数据预处理 209

    8.5.1  数据清洗 209

    8.5.2  数据集成 213

    8.5.3  数据变换 217

    8.5.4  数据规约 226

    8.6  R语言决策树分类方法 231

    8.6.1  决策树算法介绍 232

    8.6.2  随机森林算法介绍 234

    8.6.3  决策树分类方法的应用 234

    8.7  R语言高级分类方法 243

    8.7.1  基于模型的分类算法 243

    8.7.2  线性判别分析 243

    8.7.3  朴素贝叶斯 244

    8.7.4  bagging算法 245

    8.7.5  boosting算法 245

    8.7.6  高级分类方法的应用 245

    8.8  R语言聚类分析与关联分析 252

    8.8.1  K-Means聚类概念 252

    8.8.2  分层聚类概念 253

    8.8.3  聚类分析的应用 253

    8.8.4  关联规则基本概念 256

    8.8.5  关联分析的应用 257

    8.9  智能推荐 263

    8.9.1  智能推荐模型构建 263

    8.9.2  智能推荐模型评价 269

    8.10  时间序列挖掘 273

    8.10.1  ARIMA模型 273

    8.10.2  其他时间序列模型 279

    8.11  离群点检测 286

    8.11.1  离群点及其检测方法 286

    8.11.2  离群点检验应用 293

    本章习题 297

    第9章  R语言数据分析综合应用 299

    9.1  建立营销响应的模型 299

    9.1.1  实验介绍 299

    9.1.2  相关工具包 299

    9.1.3  探索性数据分析和预处理 301

    9.1.4  建立分类模型 305

    9.2  预测销售额 307

    9.2.1  实验介绍 307

    9.2.2  相关工具包 308

    9.2.3  探索性数据分析和预处理 309

    9.2.4  查看竞争门店的各种信息 321

    9.2.5  建立回归模型 328

    9.3  水质评估 331

    9.3.1  实验介绍 331

    9.3.2  数据预处理 332

    9.3.3  模型构建 333

    9.3.4  水质评价 336

    9.4  财政收入分析预测模型 337

    9.4.1  实验介绍 337

    9.4.2  数据探索分析 338

    9.4.3  模型构建 341

    9.4.4  财政收入预测模型 342

    本章习题 353

    参考文献 355

    附录 356

    二.  习题参考答案 356

     
查看详情
相关图书 / 更多
R语言大数据技术应用实践
R语言科研绘图与学术图表绘制从入门到精通 科研绘图与数据可视化专业教程
关东升 编著
R语言大数据技术应用实践
R语言与金融数据分析
方霞
R语言大数据技术应用实践
R语言数据可视化:科技图表绘制
芯智;龙胜
R语言大数据技术应用实践
R语言数据分析与可视化(微课版)
沈刚
R语言大数据技术应用实践
R语言简洁建模(Tidy Modcling with R 影印版)
[美]马克斯·库恩
R语言大数据技术应用实践
R语言数据分析:基础、算法与实战
孙玉林 编著
R语言大数据技术应用实践
R语言编程:基于tidyverse
张敬信
R语言大数据技术应用实践
R语言实战(第3版)
[美]罗伯特 · I. 卡巴科弗(Robert I. Kabacoff)
R语言大数据技术应用实践
R语言数据分析从入门到精通
明日科技
R语言大数据技术应用实践
R语言数据处理及可视化分析
杨德春
R语言大数据技术应用实践
R语言及其在统计分析中的应用
熊刚强 著
R语言大数据技术应用实践
R语言在公共卫生中的应用
高启胜
您可能感兴趣 / 更多
R语言大数据技术应用实践
TensorFlow应用案例教程
方志军、高永彬、吴晨谋 著
R语言大数据技术应用实践
数据科学与大数据技术导论
方志军 著
R语言大数据技术应用实践
计算机导论(第三版)
方志军 著
R语言大数据技术应用实践
现代健身健美教程
方志军、付春明 编
R语言大数据技术应用实践
校园体育:刀术剑术
方志军、田云平 编
R语言大数据技术应用实践
足球
方志军 编
R语言大数据技术应用实践
剑术
方志军 编
R语言大数据技术应用实践
刀术
方志军 编