数据挖掘与R语言(原书第2版)

数据挖掘与R语言(原书第2版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [葡] ,
2018-05
版次: 1
ISBN: 9787111596660
定价: 99.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 343页
8人买过
  • 本书面向初学者,通过实践案例讲解如何用R进行数据挖掘。全书包括两部分,第 一部分介绍R和数据挖掘的基础知识,第二部分为案例研究,通过预测海藻数量、预测股票市场收益、侦测欺诈交易以及微阵列样本分类四个案例培养构建解决方案的能力,掌握工具的使用技巧。本书适合作为高校学生或业界新手了解R和数据挖掘的入门读本,其中的代码和数据均可免费下载。 路易斯·托尔戈(Luis Torgo) 加拿大达尔豪斯大学计算机科学系教授,葡萄牙波尔图大学计算机科学系副教授,纽约大学斯特恩商学院特邀教授,人工智能和数据分析实验室(LIAAD,隶属于INESC Tec)研究员。他拥有近30年的机器学习和数据挖掘研究经验,在基于树的回归方法和基于效用的预测方法方面贡献卓著。 
    ---译者简介--- 
    李洪成 统计学博士,现为上海金融学院副教授,R语言和SPSS统计分析软件专家,研究方向为金融统计和数据挖掘。他的代表著作有《SPSS数据分析教程》《时间序列预测实践教程》等,译著有《R并行编程实战》《机器学习与R语言》等。 推荐序 
    中文版序 
    译者序 
    前言 
    致谢 
    第1章 简介 1 
    1.1 如何阅读本书 2 
    1.2 重现性 2 
    第一部分 R与数据挖掘简介 
    第2章 R简介 6 
    2.1 R起步 6 
    2.2 与R控制台的简单交互 8 
    2.3 R对象和变量 9 
    2.4 R函数 11 
    2.5 向量 14 
    2.6 向量化 15 
    2.7 因子 16 
    2.8 生成序列 18 
    2.9 数据子集 20 
    2.10 矩阵和数组 22 
    2.11 列表 25 
    2.12 数据框 28 
    2.13 数据框的扩展 31 
    2.14 对象、类和方法 34 
    2.15 管理R会话 35 
    第3章 数据挖掘简介 37 
    3.1 数据挖掘鸟瞰图 37 
    3.2 数据收集和业务理解 38 
    3.2.1 数据和数据集 39 
    3.2.2 导入数据到R 40 
    3.3 数据预处理 45 
    3.3.1 数据清洗 45 
    3.3.2 变换变量 53 
    3.3.3 生成变量 55 
    3.3.4 降维 66 
    3.4 建模 74 
    3.4.1 探索性数据分析 75 
    3.4.2 使用关联规则的依赖建模 94 
    3.4.3 聚类 101 
    3.4.4 异常检测 112 
    3.4.5 预测分析 120 
    3.5 评估 147 
    3.5.1 Holdout和随机子抽样 148 
    3.5.2 交叉验证 150 
    3.5.3 Bootstrap估计 153 
    3.5.4 推荐程序 154 
    3.6 报告和部署 155 
    3.6.1 通过动态文档进行报告 155 
    3.6.2 通过Web应用程序进行部署 158 
    第二部分 数据挖掘案例研究 
    第4章 预测海藻数量 164 
    4.1 问题描述与目标 164 
    4.2 数据说明 164 
    4.3 加载数据到R 165 
    4.4 数据可视化和总结 167 
    4.5 数据缺失 173 
    4.5.1 将缺失部分剔除 173 
    4.5.2 尝试找到缺失值最有可能的赋值 175 
    4.5.3 通过变量的相关关系填补缺失值 176 
    4.5.4 通过探索类似个案填补缺失值 179 
    4.6 获取预测模型 180 
    4.6.1 多元线性回归 181 
    4.6.2 回归树 185 
    4.7 模型评价和选择 189 
    4.8 预测7种海藻的频率 200 
    4.9 小结 202 
    第5章 预测股票市场收益 203 
    5.1 问题描述与目标 203 
    5.2 可用的数据 204 
    5.2.1 从CSV文件读取数据 205 
    5.2.2 从网站上获取数据 205 
    5.3 定义预测任务 206 
    5.3.1 预测什么 206 
    5.3.2 预测变量是什么 208 
    5.3.3 预测任务 212 
    5.3.4 模型评价准则 213 
    5.4 预测模型 215 
    5.4.1 如何应用训练集数据来建模 215 
    5.4.2 建模工具 216 
    5.5 从预测到实践 222 
    5.5.1 如何应用预测模型 222 
    5.5.2 与交易相关的评价准则 223 
    5.5.3 模型集成:仿真交易 224 
    5.6 模型评价和选择 230 
    5.6.1 蒙特卡罗估计 230 
    5.6.2 实验比较 231 
    5.6.3 结果分析 235 
    5.7 交易系统 243 
    5.7.1 评估最终测试数据 243 
    5.7.2 在线交易系统 247 
    5.8 小结 248 
    第6章 侦测欺诈交易 249 
    6.1 问题描述与目标 249 
    6.2 可用的数据 249 
    6.2.1 加载数据到R 250 
    6.2.2 探索数据集 250 
    6.2.3 数据问题 256 
    6.3 定义数据挖掘任务 263 
    6.3.1 问题的不同解决方法 263 
    6.3.2 评价准则 265 
    6.3.3 实验方法 270 
    6.4 计算离群值的排序 271 
    6.4.1 无监督方法 271 
    6.4.2 有监督方法 280 
    6.4.3 半监督方法 290 
    6.5 小结 295 
    第7章 微阵列样本分类 296 
    7.1 问题描述与目标 296 
    7.1.1 微阵列实验背景简介 296 
    7.1.2 数据集ALL 297 
    7.2 可用的数据 297 
    7.3 基因(特征)选择 302 
    7.3.1 基于分布特征的简单过滤方法 302 
    7.3.2 ANOVA过滤 304 
    7.3.3 使用随机森林进行过滤 306 
    7.3.4 使用特征聚类的组合进行过滤 308 
    7.4 遗传学异常的预测 309 
    7.4.1 定义预测任务 309 
    7.4.2 模型评价标准 309 
    7.4.3 实验过程 310 
    7.4.4 建模技术 311 
    7.4.5 模型比较 313 
    7.5 小结 320 
    参考文献 321 
    主题索引 332 
    数据挖掘术语索引 337 
    R函数索引 339
  • 内容简介:
    本书面向初学者,通过实践案例讲解如何用R进行数据挖掘。全书包括两部分,第 一部分介绍R和数据挖掘的基础知识,第二部分为案例研究,通过预测海藻数量、预测股票市场收益、侦测欺诈交易以及微阵列样本分类四个案例培养构建解决方案的能力,掌握工具的使用技巧。本书适合作为高校学生或业界新手了解R和数据挖掘的入门读本,其中的代码和数据均可免费下载。
  • 作者简介:
    路易斯·托尔戈(Luis Torgo) 加拿大达尔豪斯大学计算机科学系教授,葡萄牙波尔图大学计算机科学系副教授,纽约大学斯特恩商学院特邀教授,人工智能和数据分析实验室(LIAAD,隶属于INESC Tec)研究员。他拥有近30年的机器学习和数据挖掘研究经验,在基于树的回归方法和基于效用的预测方法方面贡献卓著。 
    ---译者简介--- 
    李洪成 统计学博士,现为上海金融学院副教授,R语言和SPSS统计分析软件专家,研究方向为金融统计和数据挖掘。他的代表著作有《SPSS数据分析教程》《时间序列预测实践教程》等,译著有《R并行编程实战》《机器学习与R语言》等。
  • 目录:
    推荐序 
    中文版序 
    译者序 
    前言 
    致谢 
    第1章 简介 1 
    1.1 如何阅读本书 2 
    1.2 重现性 2 
    第一部分 R与数据挖掘简介 
    第2章 R简介 6 
    2.1 R起步 6 
    2.2 与R控制台的简单交互 8 
    2.3 R对象和变量 9 
    2.4 R函数 11 
    2.5 向量 14 
    2.6 向量化 15 
    2.7 因子 16 
    2.8 生成序列 18 
    2.9 数据子集 20 
    2.10 矩阵和数组 22 
    2.11 列表 25 
    2.12 数据框 28 
    2.13 数据框的扩展 31 
    2.14 对象、类和方法 34 
    2.15 管理R会话 35 
    第3章 数据挖掘简介 37 
    3.1 数据挖掘鸟瞰图 37 
    3.2 数据收集和业务理解 38 
    3.2.1 数据和数据集 39 
    3.2.2 导入数据到R 40 
    3.3 数据预处理 45 
    3.3.1 数据清洗 45 
    3.3.2 变换变量 53 
    3.3.3 生成变量 55 
    3.3.4 降维 66 
    3.4 建模 74 
    3.4.1 探索性数据分析 75 
    3.4.2 使用关联规则的依赖建模 94 
    3.4.3 聚类 101 
    3.4.4 异常检测 112 
    3.4.5 预测分析 120 
    3.5 评估 147 
    3.5.1 Holdout和随机子抽样 148 
    3.5.2 交叉验证 150 
    3.5.3 Bootstrap估计 153 
    3.5.4 推荐程序 154 
    3.6 报告和部署 155 
    3.6.1 通过动态文档进行报告 155 
    3.6.2 通过Web应用程序进行部署 158 
    第二部分 数据挖掘案例研究 
    第4章 预测海藻数量 164 
    4.1 问题描述与目标 164 
    4.2 数据说明 164 
    4.3 加载数据到R 165 
    4.4 数据可视化和总结 167 
    4.5 数据缺失 173 
    4.5.1 将缺失部分剔除 173 
    4.5.2 尝试找到缺失值最有可能的赋值 175 
    4.5.3 通过变量的相关关系填补缺失值 176 
    4.5.4 通过探索类似个案填补缺失值 179 
    4.6 获取预测模型 180 
    4.6.1 多元线性回归 181 
    4.6.2 回归树 185 
    4.7 模型评价和选择 189 
    4.8 预测7种海藻的频率 200 
    4.9 小结 202 
    第5章 预测股票市场收益 203 
    5.1 问题描述与目标 203 
    5.2 可用的数据 204 
    5.2.1 从CSV文件读取数据 205 
    5.2.2 从网站上获取数据 205 
    5.3 定义预测任务 206 
    5.3.1 预测什么 206 
    5.3.2 预测变量是什么 208 
    5.3.3 预测任务 212 
    5.3.4 模型评价准则 213 
    5.4 预测模型 215 
    5.4.1 如何应用训练集数据来建模 215 
    5.4.2 建模工具 216 
    5.5 从预测到实践 222 
    5.5.1 如何应用预测模型 222 
    5.5.2 与交易相关的评价准则 223 
    5.5.3 模型集成:仿真交易 224 
    5.6 模型评价和选择 230 
    5.6.1 蒙特卡罗估计 230 
    5.6.2 实验比较 231 
    5.6.3 结果分析 235 
    5.7 交易系统 243 
    5.7.1 评估最终测试数据 243 
    5.7.2 在线交易系统 247 
    5.8 小结 248 
    第6章 侦测欺诈交易 249 
    6.1 问题描述与目标 249 
    6.2 可用的数据 249 
    6.2.1 加载数据到R 250 
    6.2.2 探索数据集 250 
    6.2.3 数据问题 256 
    6.3 定义数据挖掘任务 263 
    6.3.1 问题的不同解决方法 263 
    6.3.2 评价准则 265 
    6.3.3 实验方法 270 
    6.4 计算离群值的排序 271 
    6.4.1 无监督方法 271 
    6.4.2 有监督方法 280 
    6.4.3 半监督方法 290 
    6.5 小结 295 
    第7章 微阵列样本分类 296 
    7.1 问题描述与目标 296 
    7.1.1 微阵列实验背景简介 296 
    7.1.2 数据集ALL 297 
    7.2 可用的数据 297 
    7.3 基因(特征)选择 302 
    7.3.1 基于分布特征的简单过滤方法 302 
    7.3.2 ANOVA过滤 304 
    7.3.3 使用随机森林进行过滤 306 
    7.3.4 使用特征聚类的组合进行过滤 308 
    7.4 遗传学异常的预测 309 
    7.4.1 定义预测任务 309 
    7.4.2 模型评价标准 309 
    7.4.3 实验过程 310 
    7.4.4 建模技术 311 
    7.4.5 模型比较 313 
    7.5 小结 320 
    参考文献 321 
    主题索引 332 
    数据挖掘术语索引 337 
    R函数索引 339
查看详情
系列丛书 / 更多
数据挖掘与R语言(原书第2版)
大数据导论
彭智勇 译
数据挖掘与R语言(原书第2版)
统计学习导论 基于R应用
[美]加雷斯·詹姆斯、丹妮拉·威滕、特雷弗·哈斯帖 著;王星 译
数据挖掘与R语言(原书第2版)
大数据分析原理与实践
王宏志 著
数据挖掘与R语言(原书第2版)
Python机器学习
高明、徐莹、陶虎成 译
数据挖掘与R语言(原书第2版)
机器学习与R语言(原书第2版)
李洪成、许金炜、李舰 译
数据挖掘与R语言(原书第2版)
Python金融数据分析
Weiming 著;杰姆斯·马伟明(James、Ma、高明 译
数据挖掘与R语言(原书第2版)
Python机器学习(原书第2版)
瓦希德·米 著;塞巴斯蒂安·拉施卡(Sebastian Raschka)、陈斌 译
数据挖掘与R语言(原书第2版)
机器学习与R语言
[美]Brett Lantz 著;李洪成、许金炜、李舰 译
数据挖掘与R语言(原书第2版)
基于R语言的自动数据收集:网络抓取和文本挖掘实用指南
[德]西蒙·蒙策尔特 著;吴今朝 译
数据挖掘与R语言(原书第2版)
基于MPI的大数据高性能计算导论
弗兰克·尼尔森(Frank Nielsen) 著;张伟哲 译
数据挖掘与R语言(原书第2版)
统计机器学习导论
[日]杉山将 著;谢宁 译
数据挖掘与R语言(原书第2版)
Python文本分析
[印度]迪潘简·撒卡尔 著;闫龙川 高德荃 李君婷 译
相关图书 / 更多
数据挖掘与R语言(原书第2版)
数据传输原理
北京邮电学院数字通信教研室 编著
数据挖掘与R语言(原书第2版)
数据治理实践者手记
苏振中
数据挖掘与R语言(原书第2版)
数据传擒系统
[日]广田宪一郎等著《数据传输系统》翻组 译
数据挖掘与R语言(原书第2版)
数据传输
J.R.戴维著《数据传输》翻组 译;[美]W.R.贝内特
数据挖掘与R语言(原书第2版)
数据对话:建立你的数据流利度
(瑞士)马丁·埃普勒 法比耶纳 宾兹利
数据挖掘与R语言(原书第2版)
数据结构高分(2025版 天勤3版) 大中专公共计算机 率辉 新华正版
率辉
数据挖掘与R语言(原书第2版)
数据工程之道:设计和构建健壮的数据系统 [美]乔·里斯 [美]马特·豪斯利
[美]乔·里斯(Joe Reis),[美]马特·豪斯利(Matt Housley)
数据挖掘与R语言(原书第2版)
数据结构与算法入门到提高(Python语言实现)
谭琨、韦韬 编著
数据挖掘与R语言(原书第2版)
数据合规与网络安全风险防范
冯洋
数据挖掘与R语言(原书第2版)
数据加密与PKI应用(微课版)
王秀英
数据挖掘与R语言(原书第2版)
数据通信原理
[美]R.W.勒基等著成都电讯工程学院205教研组 译
数据挖掘与R语言(原书第2版)
数据资产保护的合规要点与实务
辛小天,周杨,史蕾
您可能感兴趣 / 更多
数据挖掘与R语言(原书第2版)
死亡间歇:萨拉马戈作品(死亡塑造了我们的价值观念,也塑造了生生不息的爱。)(读客彩条文库)
[葡]若泽·萨拉马戈 著;符辰希 译
数据挖掘与R语言(原书第2版)
展望骨科运动医学(忧从何来)
[葡]诺昂·埃斯奎拉-门德斯 编;[澳]布瑞恩·M.德维特、[土]穆斯塔法·卡拉罕、何金深、朱威宏 译
数据挖掘与R语言(原书第2版)
寻(海天译丛)
[葡]雅拉·蒙德罗 著;尚金格 译
数据挖掘与R语言(原书第2版)
家有小妹(魔法象·图画书王国)
[葡]乔安娜·埃斯特雷拉 著;吕婷婷 译;[葡]乔安娜·埃斯特雷拉 绘
数据挖掘与R语言(原书第2版)
数据分析——统计、描述、预测与应用(计算机科学与技术丛书)
[葡]乔·门德斯·莫雷拉、[巴西]安德烈·卡 著
数据挖掘与R语言(原书第2版)
我将宇宙随身携带:佩索阿诗集
[葡]费尔南多·佩索阿 著;程一身 译
数据挖掘与R语言(原书第2版)
债法总论(第二卷)
[葡]若昂·德·马图斯·安图内斯·瓦雷拉、João、de、Matos、Antunes 著
数据挖掘与R语言(原书第2版)
世界尽头的土地上中信出版社
[葡]安东尼奥·洛博·安图内斯 著;徐亦行 译
数据挖掘与R语言(原书第2版)
21世纪葡萄牙语2学生用书
[葡]Ana、Tavares 著
数据挖掘与R语言(原书第2版)
21世纪葡萄牙语2练习册
[葡]Ana、Tavares 著
数据挖掘与R语言(原书第2版)
知了绘本馆-外婆的宝被
[葡]伊莎贝尔·米荷丝·马汀斯 著;伊莎贝尔·米荷丝·马汀斯、亚拉·克诺 绘
数据挖掘与R语言(原书第2版)
拍一拍
[葡]玛德莲娜·玛多索 著