精通机器学习:基于R(第2版)

精通机器学习:基于R(第2版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] ,
2018-03
版次: 1
ISBN: 9787115477781
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 291页
正文语种: 简体中文
28人买过
  • 机器学习是近年来的热门技术话题,R语言是处理其中大量数据的有力工具。本书为读者提供机器学习和R语言的坚实算法基础和业务基础,内容包括机器学习基本概念、线性回归、逻辑回归和判别分析、线性模型的高 级选择特性、K* 近邻和支持向量机等,力图平衡实践中的技术和理论两方面。
    本书适合试图理解和表述机器学习算法的IT人士、想在分析中发挥R强大威力的统计学专家。即使是同时精通IT技术和统计学的读者,在本书中仍然可以发现一些有用的窍门和技巧。 Cory Leismester
    具有十多年量化管理经验,目前在银行业担任高 级量化管理经理,负责构建市场营销和监管模型。曾在礼来公司任职16年,负责销售、市场调查、精益六西格玛、营销分析、新产品预测等工作。 第1章 成功之路1
    1.1 流程1
    1.2 业务理解2
    1.2.1 确定业务目标3
    1.2.2 现状评估4
    1.2.3 确定分析目标4
    1.2.4 建立项目计划4
    1.3 数据理解4
    1.4 数据准备5
    1.5 建模5
    1.6 评价6
    1.7 部署6
    1.8 算法流程图7
    1.9 小结10
    第 2章 线性回归:机器学习基础技术11
    2.1 单变量回归11
    2.2 多变量线性回归18
    2.2.1 业务理解18
    2.2.2 数据理解和数据准备18
    2.2.3 模型构建与模型评价21
    2.3 线性模型中的其他问题30
    2.3.1 定性特征30
    2.3.2 交互项32
    2.4 小结34
    第3章 逻辑斯蒂回归与判别分析35
    3.1 分类方法与线性回归35
    3.2 逻辑斯蒂回归36
    3.2.1 业务理解36
    3.2.2 数据理解和数据准备37
    3.2.3 模型构建与模型评价41
    3.3 判别分析概述46
    3.4 多元自适应回归样条方法50
    3.5 模型选择54
    3.6 小结57
    第4章 线性模型中的高 级特征选择技术58
    4.1 正则化简介58
    4.1.1 岭回归59
    4.1.2 LASSO59
    4.1.3 弹性网络60
    4.2 商业案例60
    4.2.1 业务理解60
    4.2.2 数据理解和数据准备60
    4.3 模型构建与模型评价65
    4.3.1 * 优子集65
    4.3.2 岭回归68
    4.3.3 LASSO71
    4.3.4 弹性网络73
    4.3.5 使用glmnet进行交叉验证76
    4.4 模型选择78
    4.5 正则化与分类问题78
    4.6 小结81
    第5章 更多分类技术:K-* 近邻与
    支持向量机82
    5.1 K-* 近邻82
    5.2 支持向量机84
    5.3 商业案例86
    5.3.1 业务理解86
    5.3.2 数据理解和数据准备87
    5.3.3 模型构建与模型评价92
    5.3.4 模型选择98
    5.4 SVM中的特征选择100
    5.5 小结101
    第6章 分类回归树103
    6.1 本章技术概述103
    6.1.1 回归树104
    6.1.2 分类树104
    6.1.3 随机森林105
    6.1.4 梯度提升106
    6.2 商业案例106
    6.2.1 模型构建与模型评价107
    6.2.2 模型选择121
    6.2.3 使用随机森林进行特征选择121
    6.3 小结123
    第7章 神经网络与深度学习124
    7.1 神经网络介绍124
    7.2 深度学习简介128
    深度学习资源与高 级方法130
    7.3 业务理解131
    7.4 数据理解和数据准备132
    7.5 模型构建与模型评价136
    7.6 深度学习示例139
    7.6.1 H2O背景介绍139
    7.6.2 将数据上载到H2O平台140
    7.6.3 建立训练数据集和测试
    数据集141
    7.6.4 模型构建142
    7.7 小结146
    第8章 聚类分析147
    8.1 层次聚类148
    8.2 K-均值聚类149
    8.3 果瓦系数与围绕中心的划分150
    8.3.1 果瓦系数150
    8.3.2 PAM151
    8.4 随机森林151
    8.5 业务理解152
    8.6 数据理解与数据准备152
    8.7 模型构建与模型评价155
    8.7.1 层次聚类155
    8.7.2 K-均值聚类162
    8.7.3 果瓦系数和PAM165
    8.7.4 随机森林与PAM167
    8.8 小结168
    第9章 主成分分析169
    9.1 主成分简介170
    9.2 业务理解173
    9.3 模型构建与模型评价176
    9.3.1 主成分抽取176
    9.3.2 正交旋转与解释177
    9.3.3 根据主成分建立因子得分178
    9.3.4 回归分析178
    9.4 小结184
    * 10章 购物篮分析、推荐引擎与
    序列分析185
    10.1 购物篮分析简介186
    10.2 业务理解187
    10.3 数据理解和数据准备187
    10.4 模型构建与模型评价189
    10.5 推荐引擎简介192
    10.5.1 基于用户的协同过滤193
    10.5.2 基于项目的协同过滤194
    10.5.3 奇异值分解和主成分分析194
    10.6 推荐系统的业务理解198
    10.7 推荐系统的数据理解与数据准备198
    10.8 推荐系统的建模与评价200
    10.9 序列数据分析208
    10.10 小结214
    * 11章 创建集成多类分类215
    11.1 集成模型215
    11.2 业务理解与数据理解216
    11.3 模型评价与模型选择217
    11.4 多类分类219
    11.5 业务理解与数据理解220
    11.6 模型评价与模型选择223
    11.6.1 随机森林224
    11.6.2 岭回归225
    11.7 MLR集成模型226
    11.8 小结228
    * 12章 时间序列与因果关系229
    12.1 单变量时间序列分析229
    12.2 业务理解235
    12.3 模型构建与模型评价240
    12.3.1 单变量时间序列预测240
    12.3.2 检查因果关系243
    12.4 小结249
    * 13章 文本挖掘250
    13.1 文本挖掘框架与方法250
    13.2 主题模型252
    13.3 业务理解254
    13.4 模型构建与模型评价257
    13.4.1 词频分析与主题模型257
    13.4.2 其他定量分析261
    13.5 小结267
    * 14章 在云上使用R语言268
    14.1 创建AWS账户269
    14.1.1 启动虚拟机270
    14.1.2 启动Rstudio272
    14.2 小结274
    附录A R语言基础275
  • 内容简介:
    机器学习是近年来的热门技术话题,R语言是处理其中大量数据的有力工具。本书为读者提供机器学习和R语言的坚实算法基础和业务基础,内容包括机器学习基本概念、线性回归、逻辑回归和判别分析、线性模型的高 级选择特性、K* 近邻和支持向量机等,力图平衡实践中的技术和理论两方面。
    本书适合试图理解和表述机器学习算法的IT人士、想在分析中发挥R强大威力的统计学专家。即使是同时精通IT技术和统计学的读者,在本书中仍然可以发现一些有用的窍门和技巧。
  • 作者简介:
    Cory Leismester
    具有十多年量化管理经验,目前在银行业担任高 级量化管理经理,负责构建市场营销和监管模型。曾在礼来公司任职16年,负责销售、市场调查、精益六西格玛、营销分析、新产品预测等工作。
  • 目录:
    第1章 成功之路1
    1.1 流程1
    1.2 业务理解2
    1.2.1 确定业务目标3
    1.2.2 现状评估4
    1.2.3 确定分析目标4
    1.2.4 建立项目计划4
    1.3 数据理解4
    1.4 数据准备5
    1.5 建模5
    1.6 评价6
    1.7 部署6
    1.8 算法流程图7
    1.9 小结10
    第 2章 线性回归:机器学习基础技术11
    2.1 单变量回归11
    2.2 多变量线性回归18
    2.2.1 业务理解18
    2.2.2 数据理解和数据准备18
    2.2.3 模型构建与模型评价21
    2.3 线性模型中的其他问题30
    2.3.1 定性特征30
    2.3.2 交互项32
    2.4 小结34
    第3章 逻辑斯蒂回归与判别分析35
    3.1 分类方法与线性回归35
    3.2 逻辑斯蒂回归36
    3.2.1 业务理解36
    3.2.2 数据理解和数据准备37
    3.2.3 模型构建与模型评价41
    3.3 判别分析概述46
    3.4 多元自适应回归样条方法50
    3.5 模型选择54
    3.6 小结57
    第4章 线性模型中的高 级特征选择技术58
    4.1 正则化简介58
    4.1.1 岭回归59
    4.1.2 LASSO59
    4.1.3 弹性网络60
    4.2 商业案例60
    4.2.1 业务理解60
    4.2.2 数据理解和数据准备60
    4.3 模型构建与模型评价65
    4.3.1 * 优子集65
    4.3.2 岭回归68
    4.3.3 LASSO71
    4.3.4 弹性网络73
    4.3.5 使用glmnet进行交叉验证76
    4.4 模型选择78
    4.5 正则化与分类问题78
    4.6 小结81
    第5章 更多分类技术:K-* 近邻与
    支持向量机82
    5.1 K-* 近邻82
    5.2 支持向量机84
    5.3 商业案例86
    5.3.1 业务理解86
    5.3.2 数据理解和数据准备87
    5.3.3 模型构建与模型评价92
    5.3.4 模型选择98
    5.4 SVM中的特征选择100
    5.5 小结101
    第6章 分类回归树103
    6.1 本章技术概述103
    6.1.1 回归树104
    6.1.2 分类树104
    6.1.3 随机森林105
    6.1.4 梯度提升106
    6.2 商业案例106
    6.2.1 模型构建与模型评价107
    6.2.2 模型选择121
    6.2.3 使用随机森林进行特征选择121
    6.3 小结123
    第7章 神经网络与深度学习124
    7.1 神经网络介绍124
    7.2 深度学习简介128
    深度学习资源与高 级方法130
    7.3 业务理解131
    7.4 数据理解和数据准备132
    7.5 模型构建与模型评价136
    7.6 深度学习示例139
    7.6.1 H2O背景介绍139
    7.6.2 将数据上载到H2O平台140
    7.6.3 建立训练数据集和测试
    数据集141
    7.6.4 模型构建142
    7.7 小结146
    第8章 聚类分析147
    8.1 层次聚类148
    8.2 K-均值聚类149
    8.3 果瓦系数与围绕中心的划分150
    8.3.1 果瓦系数150
    8.3.2 PAM151
    8.4 随机森林151
    8.5 业务理解152
    8.6 数据理解与数据准备152
    8.7 模型构建与模型评价155
    8.7.1 层次聚类155
    8.7.2 K-均值聚类162
    8.7.3 果瓦系数和PAM165
    8.7.4 随机森林与PAM167
    8.8 小结168
    第9章 主成分分析169
    9.1 主成分简介170
    9.2 业务理解173
    9.3 模型构建与模型评价176
    9.3.1 主成分抽取176
    9.3.2 正交旋转与解释177
    9.3.3 根据主成分建立因子得分178
    9.3.4 回归分析178
    9.4 小结184
    * 10章 购物篮分析、推荐引擎与
    序列分析185
    10.1 购物篮分析简介186
    10.2 业务理解187
    10.3 数据理解和数据准备187
    10.4 模型构建与模型评价189
    10.5 推荐引擎简介192
    10.5.1 基于用户的协同过滤193
    10.5.2 基于项目的协同过滤194
    10.5.3 奇异值分解和主成分分析194
    10.6 推荐系统的业务理解198
    10.7 推荐系统的数据理解与数据准备198
    10.8 推荐系统的建模与评价200
    10.9 序列数据分析208
    10.10 小结214
    * 11章 创建集成多类分类215
    11.1 集成模型215
    11.2 业务理解与数据理解216
    11.3 模型评价与模型选择217
    11.4 多类分类219
    11.5 业务理解与数据理解220
    11.6 模型评价与模型选择223
    11.6.1 随机森林224
    11.6.2 岭回归225
    11.7 MLR集成模型226
    11.8 小结228
    * 12章 时间序列与因果关系229
    12.1 单变量时间序列分析229
    12.2 业务理解235
    12.3 模型构建与模型评价240
    12.3.1 单变量时间序列预测240
    12.3.2 检查因果关系243
    12.4 小结249
    * 13章 文本挖掘250
    13.1 文本挖掘框架与方法250
    13.2 主题模型252
    13.3 业务理解254
    13.4 模型构建与模型评价257
    13.4.1 词频分析与主题模型257
    13.4.2 其他定量分析261
    13.5 小结267
    * 14章 在云上使用R语言268
    14.1 创建AWS账户269
    14.1.1 启动虚拟机270
    14.1.2 启动Rstudio272
    14.2 小结274
    附录A R语言基础275
查看详情
系列丛书 / 更多
精通机器学习:基于R(第2版)
机器学习实战
[美]Peter Harrington 著;李锐、李鹏、曲亚东 译
精通机器学习:基于R(第2版)
图灵程序设计丛书:Python基础教程
[挪威]Magnus Lie Hetland 著;司维、曾军崴、谭颖华 译
精通机器学习:基于R(第2版)
JavaScript高级程序设计(第3版)
[美]Nicholas C.Zakas 著;李松峰、曹力 译
精通机器学习:基于R(第2版)
Python编程:从入门到实践
[美]埃里克·马瑟斯(Eric Matthes) 著;袁国忠 译
精通机器学习:基于R(第2版)
R语言实战(第2版)
[美]卡巴科弗(Robert I. Kabacoff) 著;王小宁、刘撷芯、黄俊文 译
精通机器学习:基于R(第2版)
大数据:互联网大规模数据挖掘与分布式处理
[美]Anand、[美]Jeffrey David Ullman 著;王斌 译
精通机器学习:基于R(第2版)
算法(第4版)
[美]Robert、[美]Kevin Wayne 著;谢路云 译
精通机器学习:基于R(第2版)
Spark快速大数据分析
[美]卡劳(Holden Karau)、[美]肯维尼斯科(Andy Konwinski)、[美]温德尔(Patrick Wendell)、[加拿大]扎哈里亚(Matei Zaharia) 著;王道远 译
精通机器学习:基于R(第2版)
MySQL必知必会
[英]福塔(Ben Forta) 著;刘晓霞、钟鸣 译
精通机器学习:基于R(第2版)
Objective-C基础教程 第2版
[美]Scott、[美]Waqar、[美]Mark Dalrymple 著;周庆成 译
精通机器学习:基于R(第2版)
图解HTTP
[日]上野·宣 著;于均良 译
精通机器学习:基于R(第2版)
算法图解
袁国忠 译
相关图书 / 更多
精通机器学习:基于R(第2版)
精通 Power Query
(加拿大)肯·普尔斯
精通机器学习:基于R(第2版)
精通套期保值
李录林 著
精通机器学习:基于R(第2版)
精通式学习法:基于提高学生能力的学习方法(“翻转课堂”先行者乔纳森·伯格曼最新作品,众多教育名家联袂推荐)
(美)乔纳森·伯格曼著,段文静译;中青文 出品
精通机器学习:基于R(第2版)
精通STM32F4(HAL库版)(下)
刘军 凌柱宁 徐伟健 江荧
精通机器学习:基于R(第2版)
精通STM32F4(HAL库版)(上)
刘军 凌柱宁 徐伟健 江荧
精通机器学习:基于R(第2版)
精通FrontPage XP(中文版)
中国IT培训工程编委会 编
精通机器学习:基于R(第2版)
精通咬合重建——解读牙列不齐、牙周病、多牙缺失
吴松涛 周茂强 译;[日]上田 秀朗
精通机器学习:基于R(第2版)
精通Veeam Backup & Replication(原书第2版)
克里斯·奇尔德霍森(Chris Childerhose)
精通机器学习:基于R(第2版)
精通Shiny(Mastering Shiny)
Hadley Wickham
精通机器学习:基于R(第2版)
精通Apache Pulsar:可伸缩云原生事件流实践
[美]Jowanza Joseph(乔万扎·约瑟夫
精通机器学习:基于R(第2版)
精通嵌入式Linux编程
[美]弗兰克·瓦斯奎兹 著;陈会翔 译
精通机器学习:基于R(第2版)
精通Transformer:从零开始构建最先进的NLP模型
[伊朗]梅萨姆·阿斯加里-切纳格卢 著;江红 余青松 余靖 译;[土耳其]萨瓦斯·伊尔蒂利姆
您可能感兴趣 / 更多
精通机器学习:基于R(第2版)
亚拉山大的读心术(数学大师的逻辑课) 伦理学、逻辑学 [美]雷蒙德·m.斯穆里安(raymondm.smullyan)
[美]雷蒙德·m.斯穆里安(raymondm.smullyan)
精通机器学习:基于R(第2版)
纳博科夫精选集第五辑
[美]弗拉基米尔·纳博科夫著
精通机器学习:基于R(第2版)
九桃盘(美国二十世纪重要女诗人玛丽安·摩尔诗歌精选集,由知名女诗人和女性诗学研究者倪志娟倾情翻译)
[美]玛丽安•摩尔
精通机器学习:基于R(第2版)
全新正版图书 制造德·戴维尼浙江教育出版社9787572276880
[美]理查德·戴维尼
精通机器学习:基于R(第2版)
血泪之泣
[美]希瑟·丘·麦克亚当
精通机器学习:基于R(第2版)
小学生趣味心理学(培养执行技能的40个练习,发展共情能力的46个练习,学会应对焦虑的40个练习 共3册) (美)莎伦·格兰德 王佳妮译
[美]莎伦·格兰德(sharon grand)
精通机器学习:基于R(第2版)
(当代学术棱镜译丛)艺术批评入门:历史、策略与声音
[美]克尔·休斯顿
精通机器学习:基于R(第2版)
金钱游戏(划时代增订版):深层透析金融游戏表象之下的规则与黑箱 长达60年盘踞金融畅销榜的现象级作品
[美]亚当·史密斯(Adam Smith) 著;刘寅龙 译
精通机器学习:基于R(第2版)
矿王谷的黎明:塞拉俱乐部诉莫顿案与美国环境法的转变(精装典藏版)
[美]丹尼尔·P.塞尔米,(Daniel,P.Selmi)
精通机器学习:基于R(第2版)
体式神话:瑜伽传统故事精粹(第二版) (从30个体式古老起源中汲取灵感与力量,内附精美插图)
[美]阿兰娜·凯瓦娅(Alanna Kaivalya)[荷]阿诸那·范德·库伊(Arjuna van der Kooij)
精通机器学习:基于R(第2版)
诺奖作家给孩子的阅读课·生命教育(3-9年级,莫言余华的文学启蒙,垫高阅读起点,提升作文能力)
[美]海明威等
精通机器学习:基于R(第2版)
蚯蚓的日记(全4册)【平装版】
[美]朵琳·克罗宁