机器学习与R语言(原书第2版)

机器学习与R语言(原书第2版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: , ,
2017-03
版次: 1
ISBN: 9787111553281
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 278页
分类: 教育
59人买过
  •   本书共12章:第1章介绍机器学习的基本概念和理论,并介绍用于机器学习的R软件环境的准备;第2章介绍如何应用R来管理数据,进行数据的探索分析和数据可视化;第3~9章介绍典型的机器学习算法,包括k近邻分类算法、朴素贝叶斯算法、决策树和规则树、回归预测、黑盒算法——神经网络和支持向量机、关联分析、k均值聚类,并给出大量的实际案例和详细的分析步骤,例如乳腺癌的判断、垃圾短信的过滤、贷款违约的预测、毒蘑菇的判别、医疗费用的预测、建筑用混凝土强度的预测、光学字符的识别、超市购物篮关联分析以及市场细分等;第10章介绍模型性能评价的原理和方法;第11章给出提高模型性能的几种常用方法;第12章讨论用R进行机器学习时可能遇到的一些高级专题,如特殊形式的数据、大数据集的处理、并行计算和GPU计算等技术。


    布雷特·兰茨(BrettLantz)在应用创新的数据方法来理解人类的行为方面有10余年经验。他最初是一名社会学家,在学习一个青少年社交网站分布的大型数据库时,他就开始陶醉于机器学习。从那时起,他致力于移动电话、医疗账单数据和公益活动等交叉学科的研究,并维护dataspelunking.com这个网站,该网站致力于分享有关探寻数据中所蕴含的洞察的知识。
    李洪成,统计学博士,现为上海金融学院副教授,是SPSS统计分析软件和R语言专家。他的研究方向为金融统计和数据挖掘。他曾出版多本著作,并在专业杂志发表多篇论文,代表著作有《SPSSl8数据分析基础与实践》、《SPSS数据分析教程》、《时间序列预测实践教程》,译著有《R语言经典实例》、《数据挖掘与R语言》、《金融数据分析导论:基于R语言》等。

    推荐序
    译者序
    前言
    关于审稿人
    第1章 机器学习简介1
    1.1 机器学习的起源1
    1.2 机器学习的使用与滥用3
    1.2.1 机器学习的成功使用3
    1.2.2 机器学习的限制4
    1.2.3 机器学习的伦理方面5
    1.3 机器如何学习6
    1.3.1 数据存储7
    1.3.2 抽象化7
    1.3.3 一般化9
    1.3.4 评估10
    1.4 实践中的机器学习11
    1.4.1 输入数据的类型11
    1.4.2 机器学习算法的类型12
    1.4.3 为输入数据匹配算法14
    1.5 使用R进行机器学习15
    1.5.1 安装R添加包15
    1.5.2 载入和卸载R添加包16
    1.6 总结16
    第2章 数据的管理和理解18
    2.1 R数据结构18
    2.1.1 向量18
    2.1.2 因子20
    2.1.3 列表21
    2.1.4 数据框23
    2.1.5 矩阵和数组25
    2.2 用R管理数据27
    2.2.1 保存、载入和移除R数据结构27
    2.2.2 用CSV文件导入和保存数据28
    2.3 探索和理解数据29
    2.3.1 探索数据的结构29
    2.3.2 探索数值变量30
    2.3.3 探索分类变量38
    2.3.4 探索变量之间的关系40
    2.4 总结43
    第3章 懒惰学习—使用近邻分类44
    3.1 理解近邻分类44
    3.1.1 kNN算法45
    3.1.2 为什么kNN算法是懒惰的50
    3.2 例子—用kNN算法诊断乳腺癌51
    3.2.1 第1步—收集数据51
    3.2.2 第2步—探索和准备数据52
    3.2.3 第3步—基于数据训练模型55
    3.2.4 第4步—评估模型的性能56
    3.2.5 第5步—提高模型的性能57
    3.3 总结59
    第4章 概率学习—朴素贝叶斯分类60
    4.1 理解朴素贝叶斯60
    4.1.1 贝叶斯方法的基本概念61
    4.1.2 朴素贝叶斯算法65
    4.2 例子—基于贝叶斯算法的手机垃圾短信过滤69
    4.2.1 第1步—收集数据69
    4.2.2 第2步—探索和准备数据70
    4.2.3 第3步—基于数据训练模型81
    4.2.4 第4步—评估模型的性能82
    4.2.5 第5步—提高模型的性能83
    4.3 总结84
    第5章 分而治之—应用决策树和规则进行分类85
    5.1 理解决策树85
    5.1.1 分而治之86
    5.1.2 C5.0决策树算法89
    5.2 例子—使用C5.0决策树识别高风险银行贷款91
    5.2.1 第1步—收集数据92
    5.2.2 第2步—探索和准备数据92
    5.2.3 第3步—基于数据训练模型94
    5.2.4 第4步—评估模型的性能97
    5.2.5 第5步—提高模型的性能97
    5.3 理解分类规则101
    5.3.1 独立而治之101
    5.3.2 1R算法103
    5.3.3 RIPPER算法104
    5.3.4 来自决策树的规则105
    5.3.5 什么使决策树和规则贪婪106
    5.4 例子—应用规则学习算法识别有毒的蘑菇108
    5.4.1 第1步—收集数据108
    5.4.2 第2步—探索和准备数据108
    5.4.3 第3步—基于数据训练模型109
    5.4.4 第4步—评估模型的性能111
    5.4.5 第5步—提高模型的性能112
    5.5 总结114
    第6章 预测数值型数据—回归方法115
    6.1 理解回归115
    6.1.1 简单线性回归117
    6.1.2 普通最小二乘估计119
    6.1.3 相关性120
    6.1.4 多元线性回归121
    6.2 例子—应用线性回归预测医疗费用124
    6.2.1 第1步—收集数据124
    6.2.2 第2步—探索和准备数据125
    6.2.3 第3步—基于数据训练模型129
    6.2.4 第4步—评估模型的性能131
    6.2.5 第5步—提高模型的性能132
    6.3 理解回归树和模型树134
    6.4 例子—用回归树和模型树估计葡萄酒的质量136
    6.4.1 第1步—收集数据137
    6.4.2 第2步—探索和准备数据137
    6.4.3 第3步—基于数据训练模型139
    6.4.4 第4步—评估模型的性能142
    6.4.5 第5步—提高模型的性能143
    6.5 总结145
    第7章 黑箱方法—神经网络和支持向量机147
    7.1理解神经网络147
    7.1.1从生物神经元到人工神经元148
    7.1.2激活函数149
    7.1.3网络拓扑151
    7.1.4用后向传播训练神经网络154
    7.2例子—用人工神经网络对混凝土的强度进行建模155
    7.2.1第1步—收集数据155
    7.2.2第2步—探索和准备数据156
    7.2.3第3步—基于数据训练模型157
    7.2.4第4步—评估模型的性能159
    7.2.5第5步—提高模型的性能159
    7.3理解支持向量机161
    7.3.1用超平面分类161
    7.3.2对非线性空间使用核函数164
    7.4例子—用支持向量机进行光学字符识别166
    7.4.1第1步—收集数据166
    7.4.2第2步—探索和准备数据167
    7.4.3第3步—基于数据训练模型168
    7.4.4第4步—评估模型的性能170
    7.4.5第5步—提高模型的性能171
    7.5总结172
    第8章 探寻模式—基于关联规则的购物篮分析173
    8.1理解关联规则173
    8.1.1用于关联规则学习的Apriori算法174
    8.1.2度量规则兴趣度—支持度和置信度175
    8.1.3用Apriori原则建立规则176
    8.2例子—用关联规则确定经常一起购买的食品杂货177
    8.2.1第1步—收集数据177
    8.2.2第2步—探索和准备数据178
    8.2.3第3步—基于数据训练模型183
    8.2.4第4步—评估模型的性能185
    8.2.5第5步—提高模型的性能187
    8.3总结190
    第9章 寻找数据的分组—k均值聚类191
    9.1理解聚类191
    9.1.1聚类—一种机器学习任务192
    9.1.2k均值聚类算法193
    9.2例子—用k均值聚类探寻青少年市场细分198
    9.2.1第1步—收集数据199
    9.2.2第2步—探索和准备数据199
    9.2.3第3步—基于数据训练模型203
    9.2.4第4步—评估模型的性能205
    9.2.5第5步—提高模型的性能207
    9.3总结208

  • 内容简介:
      本书共12章:第1章介绍机器学习的基本概念和理论,并介绍用于机器学习的R软件环境的准备;第2章介绍如何应用R来管理数据,进行数据的探索分析和数据可视化;第3~9章介绍典型的机器学习算法,包括k近邻分类算法、朴素贝叶斯算法、决策树和规则树、回归预测、黑盒算法——神经网络和支持向量机、关联分析、k均值聚类,并给出大量的实际案例和详细的分析步骤,例如乳腺癌的判断、垃圾短信的过滤、贷款违约的预测、毒蘑菇的判别、医疗费用的预测、建筑用混凝土强度的预测、光学字符的识别、超市购物篮关联分析以及市场细分等;第10章介绍模型性能评价的原理和方法;第11章给出提高模型性能的几种常用方法;第12章讨论用R进行机器学习时可能遇到的一些高级专题,如特殊形式的数据、大数据集的处理、并行计算和GPU计算等技术。
  • 作者简介:


    布雷特·兰茨(BrettLantz)在应用创新的数据方法来理解人类的行为方面有10余年经验。他最初是一名社会学家,在学习一个青少年社交网站分布的大型数据库时,他就开始陶醉于机器学习。从那时起,他致力于移动电话、医疗账单数据和公益活动等交叉学科的研究,并维护dataspelunking.com这个网站,该网站致力于分享有关探寻数据中所蕴含的洞察的知识。
    李洪成,统计学博士,现为上海金融学院副教授,是SPSS统计分析软件和R语言专家。他的研究方向为金融统计和数据挖掘。他曾出版多本著作,并在专业杂志发表多篇论文,代表著作有《SPSSl8数据分析基础与实践》、《SPSS数据分析教程》、《时间序列预测实践教程》,译著有《R语言经典实例》、《数据挖掘与R语言》、《金融数据分析导论:基于R语言》等。

  • 目录:
    推荐序
    译者序
    前言
    关于审稿人
    第1章 机器学习简介1
    1.1 机器学习的起源1
    1.2 机器学习的使用与滥用3
    1.2.1 机器学习的成功使用3
    1.2.2 机器学习的限制4
    1.2.3 机器学习的伦理方面5
    1.3 机器如何学习6
    1.3.1 数据存储7
    1.3.2 抽象化7
    1.3.3 一般化9
    1.3.4 评估10
    1.4 实践中的机器学习11
    1.4.1 输入数据的类型11
    1.4.2 机器学习算法的类型12
    1.4.3 为输入数据匹配算法14
    1.5 使用R进行机器学习15
    1.5.1 安装R添加包15
    1.5.2 载入和卸载R添加包16
    1.6 总结16
    第2章 数据的管理和理解18
    2.1 R数据结构18
    2.1.1 向量18
    2.1.2 因子20
    2.1.3 列表21
    2.1.4 数据框23
    2.1.5 矩阵和数组25
    2.2 用R管理数据27
    2.2.1 保存、载入和移除R数据结构27
    2.2.2 用CSV文件导入和保存数据28
    2.3 探索和理解数据29
    2.3.1 探索数据的结构29
    2.3.2 探索数值变量30
    2.3.3 探索分类变量38
    2.3.4 探索变量之间的关系40
    2.4 总结43
    第3章 懒惰学习—使用近邻分类44
    3.1 理解近邻分类44
    3.1.1 kNN算法45
    3.1.2 为什么kNN算法是懒惰的50
    3.2 例子—用kNN算法诊断乳腺癌51
    3.2.1 第1步—收集数据51
    3.2.2 第2步—探索和准备数据52
    3.2.3 第3步—基于数据训练模型55
    3.2.4 第4步—评估模型的性能56
    3.2.5 第5步—提高模型的性能57
    3.3 总结59
    第4章 概率学习—朴素贝叶斯分类60
    4.1 理解朴素贝叶斯60
    4.1.1 贝叶斯方法的基本概念61
    4.1.2 朴素贝叶斯算法65
    4.2 例子—基于贝叶斯算法的手机垃圾短信过滤69
    4.2.1 第1步—收集数据69
    4.2.2 第2步—探索和准备数据70
    4.2.3 第3步—基于数据训练模型81
    4.2.4 第4步—评估模型的性能82
    4.2.5 第5步—提高模型的性能83
    4.3 总结84
    第5章 分而治之—应用决策树和规则进行分类85
    5.1 理解决策树85
    5.1.1 分而治之86
    5.1.2 C5.0决策树算法89
    5.2 例子—使用C5.0决策树识别高风险银行贷款91
    5.2.1 第1步—收集数据92
    5.2.2 第2步—探索和准备数据92
    5.2.3 第3步—基于数据训练模型94
    5.2.4 第4步—评估模型的性能97
    5.2.5 第5步—提高模型的性能97
    5.3 理解分类规则101
    5.3.1 独立而治之101
    5.3.2 1R算法103
    5.3.3 RIPPER算法104
    5.3.4 来自决策树的规则105
    5.3.5 什么使决策树和规则贪婪106
    5.4 例子—应用规则学习算法识别有毒的蘑菇108
    5.4.1 第1步—收集数据108
    5.4.2 第2步—探索和准备数据108
    5.4.3 第3步—基于数据训练模型109
    5.4.4 第4步—评估模型的性能111
    5.4.5 第5步—提高模型的性能112
    5.5 总结114
    第6章 预测数值型数据—回归方法115
    6.1 理解回归115
    6.1.1 简单线性回归117
    6.1.2 普通最小二乘估计119
    6.1.3 相关性120
    6.1.4 多元线性回归121
    6.2 例子—应用线性回归预测医疗费用124
    6.2.1 第1步—收集数据124
    6.2.2 第2步—探索和准备数据125
    6.2.3 第3步—基于数据训练模型129
    6.2.4 第4步—评估模型的性能131
    6.2.5 第5步—提高模型的性能132
    6.3 理解回归树和模型树134
    6.4 例子—用回归树和模型树估计葡萄酒的质量136
    6.4.1 第1步—收集数据137
    6.4.2 第2步—探索和准备数据137
    6.4.3 第3步—基于数据训练模型139
    6.4.4 第4步—评估模型的性能142
    6.4.5 第5步—提高模型的性能143
    6.5 总结145
    第7章 黑箱方法—神经网络和支持向量机147
    7.1理解神经网络147
    7.1.1从生物神经元到人工神经元148
    7.1.2激活函数149
    7.1.3网络拓扑151
    7.1.4用后向传播训练神经网络154
    7.2例子—用人工神经网络对混凝土的强度进行建模155
    7.2.1第1步—收集数据155
    7.2.2第2步—探索和准备数据156
    7.2.3第3步—基于数据训练模型157
    7.2.4第4步—评估模型的性能159
    7.2.5第5步—提高模型的性能159
    7.3理解支持向量机161
    7.3.1用超平面分类161
    7.3.2对非线性空间使用核函数164
    7.4例子—用支持向量机进行光学字符识别166
    7.4.1第1步—收集数据166
    7.4.2第2步—探索和准备数据167
    7.4.3第3步—基于数据训练模型168
    7.4.4第4步—评估模型的性能170
    7.4.5第5步—提高模型的性能171
    7.5总结172
    第8章 探寻模式—基于关联规则的购物篮分析173
    8.1理解关联规则173
    8.1.1用于关联规则学习的Apriori算法174
    8.1.2度量规则兴趣度—支持度和置信度175
    8.1.3用Apriori原则建立规则176
    8.2例子—用关联规则确定经常一起购买的食品杂货177
    8.2.1第1步—收集数据177
    8.2.2第2步—探索和准备数据178
    8.2.3第3步—基于数据训练模型183
    8.2.4第4步—评估模型的性能185
    8.2.5第5步—提高模型的性能187
    8.3总结190
    第9章 寻找数据的分组—k均值聚类191
    9.1理解聚类191
    9.1.1聚类—一种机器学习任务192
    9.1.2k均值聚类算法193
    9.2例子—用k均值聚类探寻青少年市场细分198
    9.2.1第1步—收集数据199
    9.2.2第2步—探索和准备数据199
    9.2.3第3步—基于数据训练模型203
    9.2.4第4步—评估模型的性能205
    9.2.5第5步—提高模型的性能207
    9.3总结208

查看详情
系列丛书 / 更多
机器学习与R语言(原书第2版)
统计学习导论 基于R应用
[美]加雷斯·詹姆斯、丹妮拉·威滕、特雷弗·哈斯帖 著;王星 译
机器学习与R语言(原书第2版)
大数据导论
彭智勇 译
机器学习与R语言(原书第2版)
大数据分析原理与实践
王宏志 著
机器学习与R语言(原书第2版)
Python机器学习
高明、徐莹、陶虎成 译
机器学习与R语言(原书第2版)
基于R语言的自动数据收集:网络抓取和文本挖掘实用指南
[德]西蒙·蒙策尔特 著;吴今朝 译
机器学习与R语言(原书第2版)
Python文本分析
[印度]迪潘简·撒卡尔 著;闫龙川 高德荃 李君婷 译
机器学习与R语言(原书第2版)
机器学习与R语言
[美]Brett Lantz 著;李洪成、许金炜、李舰 译
机器学习与R语言(原书第2版)
Python机器学习(原书第2版)
瓦希德·米 著;塞巴斯蒂安·拉施卡(Sebastian Raschka)、陈斌 译
机器学习与R语言(原书第2版)
基于MPI的大数据高性能计算导论
弗兰克·尼尔森(Frank Nielsen) 著;张伟哲 译
机器学习与R语言(原书第2版)
图分析与可视化:在关联数据中发现商业机会
[美]理查德·布莱斯(Richard Brath)、[美]David Jonker 著;赵利通 译
机器学习与R语言(原书第2版)
Python金融数据分析
Weiming 著;杰姆斯·马伟明(James、Ma、高明 译
机器学习与R语言(原书第2版)
数据科学导论:Python语言实现
[意]阿尔贝托·博斯凯蒂 著;于俊伟 译
相关图书 / 更多
机器学习与R语言(原书第2版)
机器人教育——STEAM课程活动设计下册
周东辉
机器学习与R语言(原书第2版)
机器学习的数学基础
[马来西亚]翁承顺(ChengSoonOng) 著;[英]马克·彼得·戴森罗特(MarcPeterDeisenroth);[英]A.阿尔多·费萨尔(A.AldoFaisal)
机器学习与R语言(原书第2版)
机器人系统中的在线轨迹规划——对不可预见(传感器)事件瞬时反应的基本概念
[德]托尔斯滕·克罗格
机器学习与R语言(原书第2版)
机器学习
胡清华杨柳
机器学习与R语言(原书第2版)
机器视觉特征提取与图像处理实战(高等职业院校基于工作过程项目式系列教程)
张效禹 主编
机器学习与R语言(原书第2版)
机器视觉技术及应用(第2版)
韩九强;钟德星
机器学习与R语言(原书第2版)
机器人工程应用(工业和信息化部十四五规划教材)
王伟 编者;贠超;责编:冯颖
机器学习与R语言(原书第2版)
机器学及应用 大中专高职科技综合
毋建军姜波郭舒
机器学习与R语言(原书第2版)
机器学习(慕课版)
作者
机器学习与R语言(原书第2版)
机器设备评估(第2版高等职业教育资产评估与管理专业产学研结合系列教材)
刘淑琴 编者;责编:王天华;周慧
机器学习与R语言(原书第2版)
机器学习与最优化
田英杰
机器学习与R语言(原书第2版)
机器人泌尿外科手术并发症
[美]MonishAron 主编;[美]RenéSotelo;[墨西哥]JuanArriaga
您可能感兴趣 / 更多
机器学习与R语言(原书第2版)
新编中医证候学
李洪成、李新平、李新晔 著
机器学习与R语言(原书第2版)
R语言经典实例(原书第2版)
李洪成、潘文捷 译;[美]J.D.Long;[美]Paul Teetor
机器学习与R语言(原书第2版)
SPSS数据分析实用教程(第2版)
李洪成、张茂军、马广斌 著
机器学习与R语言(原书第2版)
中医证候学
李洪成、李新平、李新晔 著
机器学习与R语言(原书第2版)
SPSS数据分析教程/21世纪高等学校计算机规划教材·高校系列
李洪成、姜宏华 著
机器学习与R语言(原书第2版)
具体断六爻
李洪成
机器学习与R语言(原书第2版)
SPSS 18数据分析基础与实践
李洪成 著
机器学习与R语言(原书第2版)
中医证候学(上中下)
李洪成 著