机器学习与R语言

机器学习与R语言
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , , ,
2015-04
版次: 1
ISBN: 9787111491576
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 259页
98人买过
  •   R本身是一款十分优秀的数据分析和数据可视化软件。《机器学习与R语言》通过将实践案例与核心的理论知识相结合,提供了你开始将机器学习应用到你自己项目中所需要的知识。《机器学习与R语言》主要内容:机器学习的基本概念和理论,用于机器学习的R软件环境;如何应用R来管理数据,进行数据的探索分析和数据可视化;典型的机器学习算法和案例,并给出了详细的分析步骤;模型性能评价的原理和方法;提高模型性能的几种常用方法;其他机器学习主题。《机器学习与R语言》适用于任何希望使用数据来采取行动的人。读者只需要具有R的一些基本知识,不需要具备机器学习的深厚基础。不管是R初学者,还是熟练的R用户都能从书中找到对自己有用的内容。 推荐序
    译者序
    前言
    致谢
    关于技术评审人
    第1章 机器学习简介1
    1.1 机器学习的起源2
    1.2 机器学习的使用与滥用3
    1.3 机器如何学习5
    1.3.1 抽象化和知识表达6
    1.3.2 一般化7
    1.3.3 评估学习的成功性9
    1.4 将机器学习应用于数据中的步骤9
    1.5 选择机器学习算法10
    1.5.1 考虑输入的数据10
    1.5.2 考虑机器学习算法的类型11
    1.5.3 为数据匹配合适的算法13
    1.6 使用R进行机器学习13
    1.7 总结17
    第2章 数据的管理和理解18
    2.1 R数据结构18
    2.2 向量19
    2.3 因子20
    2.3.1 列表21
    2.3.2 数据框22
    2.3.3 矩阵和数组24
    2.4 用R管理数据25
    2.4.1 保存和加载R数据结构25
    2.4.2 用CSV文件导入和保存数据26
    2.4.3 从SQL数据库导入数据27
    2.5 探索和理解数据28
    2.5.1 探索数据的结构 29
    2.5.2 探索数值型变量29
    2.5.3 探索分类变量37
    2.5.4 探索变量之间的关系39
    2.6 总结42
    第3章 懒惰学习——使用近邻分类44
    3.1 理解使用近邻进行分类45
    3.1.1 kNN算法45
    3.1.2 为什么kNN算法是懒惰的51
    3.2 用kNN算法诊断乳腺癌51
    3.2.1 第1步——收集数据51
    3.2.2 第2步——探索和准备数据52
    3.2.3 第3步——基于数据训练模型55
    3.2.4 第4步——评估模型的性能57
    3.2.5 第5步——提高模型的性能58
    3.3 总结60
    第4章 概率学习——朴素贝叶斯分类61
    4.1 理解朴素贝叶斯61
    4.1.1 贝叶斯方法的基本概念62
    4.1.2 朴素贝叶斯算法65
    4.2 例子——基于贝叶斯算法的手机垃圾短信过滤70
    4.2.1 第1步——收集数据70
    4.2.2 第2步——探索和准备数据71
    4.2.3 数据准备——处理和分析文本数据72
    4.2.4 第3步——基于数据训练模型78
    4.2.5 第4步——评估模型的性能79
    4.2.6 第5步——提升模型的性能80
    4.3 总结81
    第5章 分而治之——应用决策树和规则进行分类82
    5.1 理解决策树82
    5.1.1 分而治之83
    5.1.2 C5.0决策树算法86
    5.2 例子——使用C5.0决策树识别高风险银行贷款89
    5.2.1 第1步——收集数据89
    5.2.2 第2步——探索和准备数据89
    5.2.3 第3步——基于数据训练模型92
    5.2.4 第4步——评估模型的性能95
    5.2.5 第5步——提高模型的性能95
    5.3 理解分类规则98
    5.3.1 独立而治之99
    5.3.2 单规则(1R)算法101
    5.3.3 RIPPER算法103
    5.3.4 来自决策树的规则105
    5.4 例子——应用规则学习识别有毒的蘑菇105
    5.4.1 第1步——收集数据106
    5.4.2 第2步——探索和准备数据106
    5.4.3 第3步——基于数据训练模型107
    5.4.4 第4步——评估模型的性能109
    5.4.5 第5步——提高模型的性能109
    5.5 总结111
    第6章 预测数值型数据——回归方法113
    6.1 理解回归113
    6.1.1 简单线性回归115
    6.1.2 普通最小二乘估计117
    6.1.3 相关系数118
    6.1.4 多元线性回归120
    6.2 例子——应用线性回归预测医疗费用122
    6.2.1 第1步——收集数据122
    6.2.2 第2步——探索和准备数据123
    6.2.3 第3步——基于数据训练模型127
    6.2.4 第4步——评估模型的性能129
    6.2.5 第5步——提高模型的性能130
    6.3 理解回归树和模型树133
    6.4 例子——用回归树和模型树估计葡萄酒的质量135
    6.4.1 第1步——收集数据135
    6.4.2 第2步——探索和准备数据136
    6.4.3 第3步——基于数据训练模型137
    6.4.4 第4步——评估模型的性能140
    6.4.5 第5步——提高模型的性能142
    6.5 总结144
    第7章 黑箱方法——神经网络和支持向量机146
    7.1 理解神经网络146
    7.1.1 从生物神经元到人工神经元148
    7.1.2 激活函数148
    7.1.3 网络拓扑151
    7.1.4 用后向传播训练神经网络153
    7.2 用人工神经网络对混凝土的强度进行建模154
    7.2.1 第1步——收集数据154
    7.2.2 第2步——探索和准备数据155
    7.2.3 第3步——基于数据训练模型156
    7.2.4 第4步——评估模型的性能158
    7.2.5 第5步——提高模型的性能159
    7.3 理解支持向量机160
    7.3.1 用超平面分类161
    7.3.2 寻找最大间隔161
    7.3.3 对非线性空间使用核函数164
    7.4 用支持向量机进行光学字符识别165
    7.4.1 第1步——收集数据166
    7.4.2 第2步——探索和准备数据166
    7.4.3 第3步——基于数据训练模型167
    7.4.4 第4步——评估模型的性能169
    7.4.5 第5步——提高模型的性能170
    7.5 总结171
    第8章 探寻模式——基于关联规则的购物篮分析172
    8.1 理解关联规则172
    8.2 例子——用关联规则确定经常一起购买的食品杂货176
    8.2.1 第1步——收集数据176
    8.2.2 第2步——探索和准备数据177
    8.2.3 第3步——基于数据训练模型183
    8.2.4 第4步——评估模型的性能184
    8.2.5 第5步——提高模型的性能187
    8.3 总结189
    第9章 寻找数据的分组——k均值聚类191
    9.1 理解聚类191
    9.1.1 聚类——一种机器学习任务192
    9.1.2 k均值聚类算法193
    9.1.3 用k均值聚类探寻青少年市场细分198
    9.1.4 第1步——收集数据198
    9.1.5 第2步——探索和准备数据199
    9.1.6 第3步——基于数据训练模型202
    9.1.7 第4步——评估模型的性能204
    9.1.8 第5步——提高模型的性能206
    9.2 总结207
    第10章 模型性能的评价208
    10.1 度量分类方法的性能208
    10.1.1 在R中处理分类预测数据209
    10.1.2 深入探讨混淆矩阵211
    10.1.3 使用混淆矩阵度量性能212
    10.1.4 准确度之外的其他性能评价指标214
    10.1.5 性能权衡的可视化221
    10.2 评估未来的性能224
    10.2.1 保持法225
    10.2.2 交叉验证226
    10.2.3 自助法抽样229
    10.3 总结229
    第11章 提高模型的性能231
    11.1 调整多个模型来提高性能231
    11.2 使用元学习来提高模型的性能239
    11.2.1 理解集成学习239
    11.2.2 bagging241
    11.2.3 boosting243
    11.2.4 随机森林244
    11.3 总结248
    第12章 其他机器学习主题249
    12.1 分析专用数据250
    12.1.1 用RCurl添加包从网上获取数据250
    12.1.2 用XML添加包读/写XML格式数据250
    12.1.3 用rjson添加包读/写JSON251
    12.1.4 用xlsx添加包读/写MicrosoftExcel电子表格251
    12.1.5 生物信息学数据251
    12.1.6 社交网络数据和图数据252
    12.2 提高R语言的性能252
    12.2.1 处理非常大的数据集253
    12.2.2 使用并行处理来加快学习过程254
    12.2.3 GPU计算257
    12.2.4 部署最优的学习算法257
    12.3 总结258
  • 内容简介:
      R本身是一款十分优秀的数据分析和数据可视化软件。《机器学习与R语言》通过将实践案例与核心的理论知识相结合,提供了你开始将机器学习应用到你自己项目中所需要的知识。《机器学习与R语言》主要内容:机器学习的基本概念和理论,用于机器学习的R软件环境;如何应用R来管理数据,进行数据的探索分析和数据可视化;典型的机器学习算法和案例,并给出了详细的分析步骤;模型性能评价的原理和方法;提高模型性能的几种常用方法;其他机器学习主题。《机器学习与R语言》适用于任何希望使用数据来采取行动的人。读者只需要具有R的一些基本知识,不需要具备机器学习的深厚基础。不管是R初学者,还是熟练的R用户都能从书中找到对自己有用的内容。
  • 目录:
    推荐序
    译者序
    前言
    致谢
    关于技术评审人
    第1章 机器学习简介1
    1.1 机器学习的起源2
    1.2 机器学习的使用与滥用3
    1.3 机器如何学习5
    1.3.1 抽象化和知识表达6
    1.3.2 一般化7
    1.3.3 评估学习的成功性9
    1.4 将机器学习应用于数据中的步骤9
    1.5 选择机器学习算法10
    1.5.1 考虑输入的数据10
    1.5.2 考虑机器学习算法的类型11
    1.5.3 为数据匹配合适的算法13
    1.6 使用R进行机器学习13
    1.7 总结17
    第2章 数据的管理和理解18
    2.1 R数据结构18
    2.2 向量19
    2.3 因子20
    2.3.1 列表21
    2.3.2 数据框22
    2.3.3 矩阵和数组24
    2.4 用R管理数据25
    2.4.1 保存和加载R数据结构25
    2.4.2 用CSV文件导入和保存数据26
    2.4.3 从SQL数据库导入数据27
    2.5 探索和理解数据28
    2.5.1 探索数据的结构 29
    2.5.2 探索数值型变量29
    2.5.3 探索分类变量37
    2.5.4 探索变量之间的关系39
    2.6 总结42
    第3章 懒惰学习——使用近邻分类44
    3.1 理解使用近邻进行分类45
    3.1.1 kNN算法45
    3.1.2 为什么kNN算法是懒惰的51
    3.2 用kNN算法诊断乳腺癌51
    3.2.1 第1步——收集数据51
    3.2.2 第2步——探索和准备数据52
    3.2.3 第3步——基于数据训练模型55
    3.2.4 第4步——评估模型的性能57
    3.2.5 第5步——提高模型的性能58
    3.3 总结60
    第4章 概率学习——朴素贝叶斯分类61
    4.1 理解朴素贝叶斯61
    4.1.1 贝叶斯方法的基本概念62
    4.1.2 朴素贝叶斯算法65
    4.2 例子——基于贝叶斯算法的手机垃圾短信过滤70
    4.2.1 第1步——收集数据70
    4.2.2 第2步——探索和准备数据71
    4.2.3 数据准备——处理和分析文本数据72
    4.2.4 第3步——基于数据训练模型78
    4.2.5 第4步——评估模型的性能79
    4.2.6 第5步——提升模型的性能80
    4.3 总结81
    第5章 分而治之——应用决策树和规则进行分类82
    5.1 理解决策树82
    5.1.1 分而治之83
    5.1.2 C5.0决策树算法86
    5.2 例子——使用C5.0决策树识别高风险银行贷款89
    5.2.1 第1步——收集数据89
    5.2.2 第2步——探索和准备数据89
    5.2.3 第3步——基于数据训练模型92
    5.2.4 第4步——评估模型的性能95
    5.2.5 第5步——提高模型的性能95
    5.3 理解分类规则98
    5.3.1 独立而治之99
    5.3.2 单规则(1R)算法101
    5.3.3 RIPPER算法103
    5.3.4 来自决策树的规则105
    5.4 例子——应用规则学习识别有毒的蘑菇105
    5.4.1 第1步——收集数据106
    5.4.2 第2步——探索和准备数据106
    5.4.3 第3步——基于数据训练模型107
    5.4.4 第4步——评估模型的性能109
    5.4.5 第5步——提高模型的性能109
    5.5 总结111
    第6章 预测数值型数据——回归方法113
    6.1 理解回归113
    6.1.1 简单线性回归115
    6.1.2 普通最小二乘估计117
    6.1.3 相关系数118
    6.1.4 多元线性回归120
    6.2 例子——应用线性回归预测医疗费用122
    6.2.1 第1步——收集数据122
    6.2.2 第2步——探索和准备数据123
    6.2.3 第3步——基于数据训练模型127
    6.2.4 第4步——评估模型的性能129
    6.2.5 第5步——提高模型的性能130
    6.3 理解回归树和模型树133
    6.4 例子——用回归树和模型树估计葡萄酒的质量135
    6.4.1 第1步——收集数据135
    6.4.2 第2步——探索和准备数据136
    6.4.3 第3步——基于数据训练模型137
    6.4.4 第4步——评估模型的性能140
    6.4.5 第5步——提高模型的性能142
    6.5 总结144
    第7章 黑箱方法——神经网络和支持向量机146
    7.1 理解神经网络146
    7.1.1 从生物神经元到人工神经元148
    7.1.2 激活函数148
    7.1.3 网络拓扑151
    7.1.4 用后向传播训练神经网络153
    7.2 用人工神经网络对混凝土的强度进行建模154
    7.2.1 第1步——收集数据154
    7.2.2 第2步——探索和准备数据155
    7.2.3 第3步——基于数据训练模型156
    7.2.4 第4步——评估模型的性能158
    7.2.5 第5步——提高模型的性能159
    7.3 理解支持向量机160
    7.3.1 用超平面分类161
    7.3.2 寻找最大间隔161
    7.3.3 对非线性空间使用核函数164
    7.4 用支持向量机进行光学字符识别165
    7.4.1 第1步——收集数据166
    7.4.2 第2步——探索和准备数据166
    7.4.3 第3步——基于数据训练模型167
    7.4.4 第4步——评估模型的性能169
    7.4.5 第5步——提高模型的性能170
    7.5 总结171
    第8章 探寻模式——基于关联规则的购物篮分析172
    8.1 理解关联规则172
    8.2 例子——用关联规则确定经常一起购买的食品杂货176
    8.2.1 第1步——收集数据176
    8.2.2 第2步——探索和准备数据177
    8.2.3 第3步——基于数据训练模型183
    8.2.4 第4步——评估模型的性能184
    8.2.5 第5步——提高模型的性能187
    8.3 总结189
    第9章 寻找数据的分组——k均值聚类191
    9.1 理解聚类191
    9.1.1 聚类——一种机器学习任务192
    9.1.2 k均值聚类算法193
    9.1.3 用k均值聚类探寻青少年市场细分198
    9.1.4 第1步——收集数据198
    9.1.5 第2步——探索和准备数据199
    9.1.6 第3步——基于数据训练模型202
    9.1.7 第4步——评估模型的性能204
    9.1.8 第5步——提高模型的性能206
    9.2 总结207
    第10章 模型性能的评价208
    10.1 度量分类方法的性能208
    10.1.1 在R中处理分类预测数据209
    10.1.2 深入探讨混淆矩阵211
    10.1.3 使用混淆矩阵度量性能212
    10.1.4 准确度之外的其他性能评价指标214
    10.1.5 性能权衡的可视化221
    10.2 评估未来的性能224
    10.2.1 保持法225
    10.2.2 交叉验证226
    10.2.3 自助法抽样229
    10.3 总结229
    第11章 提高模型的性能231
    11.1 调整多个模型来提高性能231
    11.2 使用元学习来提高模型的性能239
    11.2.1 理解集成学习239
    11.2.2 bagging241
    11.2.3 boosting243
    11.2.4 随机森林244
    11.3 总结248
    第12章 其他机器学习主题249
    12.1 分析专用数据250
    12.1.1 用RCurl添加包从网上获取数据250
    12.1.2 用XML添加包读/写XML格式数据250
    12.1.3 用rjson添加包读/写JSON251
    12.1.4 用xlsx添加包读/写MicrosoftExcel电子表格251
    12.1.5 生物信息学数据251
    12.1.6 社交网络数据和图数据252
    12.2 提高R语言的性能252
    12.2.1 处理非常大的数据集253
    12.2.2 使用并行处理来加快学习过程254
    12.2.3 GPU计算257
    12.2.4 部署最优的学习算法257
    12.3 总结258
查看详情
12
系列丛书 / 更多
机器学习与R语言
大数据导论
彭智勇 译
机器学习与R语言
统计学习导论 基于R应用
[美]加雷斯·詹姆斯、丹妮拉·威滕、特雷弗·哈斯帖 著;王星 译
机器学习与R语言
大数据分析原理与实践
王宏志 著
机器学习与R语言
Python机器学习
高明、徐莹、陶虎成 译
机器学习与R语言
机器学习与R语言(原书第2版)
李洪成、许金炜、李舰 译
机器学习与R语言
Python机器学习(原书第2版)
瓦希德·米 著;塞巴斯蒂安·拉施卡(Sebastian Raschka)、陈斌 译
机器学习与R语言
基于R语言的自动数据收集:网络抓取和文本挖掘实用指南
[德]西蒙·蒙策尔特 著;吴今朝 译
机器学习与R语言
Python金融数据分析
Weiming 著;杰姆斯·马伟明(James、Ma、高明 译
机器学习与R语言
基于MPI的大数据高性能计算导论
弗兰克·尼尔森(Frank Nielsen) 著;张伟哲 译
机器学习与R语言
统计机器学习导论
[日]杉山将 著;谢宁 译
机器学习与R语言
Python文本分析
[印度]迪潘简·撒卡尔 著;闫龙川 高德荃 李君婷 译
机器学习与R语言
社交媒体数据挖掘与分析
[美]加博尔·萨博(Gabor Szabo) 著;李凯、吕天阳 译
相关图书 / 更多
机器学习与R语言
机器岛
(法)儒勒·凡尔纳著 许崇山 钟燕萍译
机器学习与R语言
机器视觉与人工智能应用开发技术
廖建尚
机器学习与R语言
机器人基础
杨勇、谢广明 主编 张国英、黄福、简月 副主编
机器学习与R语言
机器学习及深度学习算法在医学图像中的应用
朱付保 著
机器学习与R语言
机器如人:通往人类智慧之路
(美)罗纳德·J.,布拉赫曼(Ronald,J.,Brachman),(加)赫克托·J.,莱韦斯克(Hector,J.,Levesque)
机器学习与R语言
机器学习实战(视频教学版)
迟殿委 王培进 王兴平
机器学习与R语言
机器人SLAM技术及其ROS系统应用 第2版 徐本连 鲁明丽
徐本连 鲁明丽
机器学习与R语言
机器学习及其应用2023
黄圣君、张利军、钱超
机器学习与R语言
机器学习实战营:从理论到实战的探索之旅
谢雪葵
机器学习与R语言
机器学习与经济大数据分析:基于Python实现 数字中国·数字经济创新规划教材 刘征驰
刘征驰 编著
机器学习与R语言
机器学习系统设计
(越南)奇普 胡岩(Chip Huyen)
机器学习与R语言
机器人驱动与运动控制
史岳鹏
您可能感兴趣 / 更多
机器学习与R语言
归属感:如何通过社群获得商业竞争优势
[美]大卫·斯平克斯(David Spinks) 著;颉腾文化 出品
机器学习与R语言
雪花的故事(用照片展示雪花的秘密,为你揭开冬日奇景的奥秘)
[美]马克·卡西诺[美]乔恩·尼尔森
机器学习与R语言
进阶书系-国际史的技艺
[美] 马克·特拉亨伯格
机器学习与R语言
杜甫传
[美]弗洛伦斯.艾思柯
机器学习与R语言
神奇的数字零:从数字0开始的极简数学史和人类发展史
[美]查尔斯·塞弗(Charles Seife)著 杨杨立汝 译
机器学习与R语言
爵士乐史(精装本)
[美]泰德·乔亚 著
机器学习与R语言
环境的科学 (平装版)
[美]威廉·坎宁安 后浪
机器学习与R语言
美利坚在燃烧:20世纪60年代以来的警察暴力与黑人反抗
[美]伊丽莎白·欣顿 著 胡位钧 译
机器学习与R语言
数学侦探 游乐园里的古怪笑脸
[美]丹尼尔·肯尼 艾米丽·博艾尔 著 刘玙婧、王婧 译;小博集出品
机器学习与R语言
读懂经济学:提升“财商”、塑造价值观念的经济学读本,一本书参破瞬息万变的经济世界底层逻辑!
[美]霍华德·亚鲁斯 著;赵善江 译;斯坦威 出品
机器学习与R语言
儒教中国及其现代命运(三部曲)
[美]列文森 作者;[中]季剑青 译者
机器学习与R语言
逃家小兔成长绘本系列
[美]玛格丽特.怀兹.布朗