用商业案例学R语言数据挖掘

用商业案例学R语言数据挖掘
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: , , ,
2017-09
版次: 1
ISBN: 9787121319587
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 444页
字数: 736千字
23人买过
  •     商业智能时代已经全面到来,分析型人才的岗位数量在就业市场中呈现井喷式增长。无论是从事产品研发的工程师,还是从事产品推广的市场人员、人力资源和财务会计人员,都需要掌握数据分析技术,否则很有可能被人工智能替代。 
        本书包括 18 章,涉及使用 R 语言做数据分析和数据挖掘的主要分析方法。其中,第 1、 2 章为数据分析方法概述,第 3 章为 R 语言编程基础,第 4 章到第 8 章为统计学习方法,第 9 章到第 16 章为数据挖掘方法,第 17 章为特征工程,第 18 章为 R 文本挖掘。每章都根据所涉及的知识点的不同,选取了实用的案例,并为读者准备了相应的练习题。 
    本书作为 CDA 数据分析师系列丛书中《如虎添翼!数据处理的 SPSS 和 SAS EG 实现(第 2 版)》和《胸有成竹!数据分析的 SPSS 和 SAS EG 进阶(第 2 版)》的姊妹篇,将前两本书的内容进行整合并做了重大拓展,而且秉承了该系列丛书的特点:内容精练、重点突出、示例丰富、语言通俗。可以作为广大从业人员自学商业数据分析的读物,适合大中专院校师生学习和阅读,同时也可以作为高等院校商科、社会科学及相关培训机构的教材。 

    常国珍,北京大学会计学博士,中国大数据产业生态联盟专家委员会专家委员。主要从事金融、电信行业客户画像,信用与操作风险识别与防范,客户终生价值预测与价值提升等工作。 
    曾珂,华中师范大学管理科学工程硕士,现为车贷金融产品部产品经理,精通Python与R语言数据挖掘。曾经就职于华为、国家电网等企业。以金融信用与欺诈风险建模、文本分析、数据可视化等为主要研究方向。 
    朱江,挪威科技大学工学硕士,现为CDA数据分析研究院课程开发副总监,CDA数据挖掘竞赛的评委。精通R与SAS语言数据挖掘,从事电商与互联网数据分析的教学工作。研究方向为电商推荐系统开发、数据可视化、客户特征提取和客户行为模式发现。 
      第1 章 商业数据分析基础 
    1.1 商业数据分析的本质  
    1.2 商业数据分析中心的建设  
    第2 章 数据分析的武器库 
    2.1 数据挖掘简介  
    2.2 R 语言简介 
    2.3 R 与RStudio 的下载和安装 
    2.4 在RStudio 中安装包 
    2.5 练习题  
    第3 章 R 语言编程 
    3.1 R 的基本数据类型 
    3.2 R 的基本数据结构 
    3.3 R 的程序控制  
    3.4 R 的函数  
    3.5 R 的日期与时间数据类型 
    3.6 在R 中读写数据 
    3.7 练习题  
    第4 章 R 描述性统计分析与绘图  
    4.1 描述性统计分析  
    4.2 制图的步骤 
    4.3 R 基础绘图包  
    4.4 ggplot2 绘图  
    4.5 练习题  
    第5 章 数据整合和数据清洗 
    5.1 数据整合  
    5.2 R 中的高级数据整合  
    5.3 R 中的抽样  
    5.4 R 的数据清洗 
    5.5 练习题 
    第6 章 统计推断基础  
    6.1 基本的统计学概念  
    6.2 假设检验与单样本t 检验
    6.3 双样本t 检验 
    6.4 方差分析(分类变量和连续变量关系检验) 
    6.5 相关分析(两连续变量关系检验)
    6.6 卡方检验(二分类变量关系检验) 
    6.7 练习题 
    第7 章 客户价值预测:线性回归模型与诊断 
    7.1 相关性分析  
    7.2 线性回归 
    7.3 线性回归诊断 
    7.4 正则化方法  
    7.5 练习题 
    第8 章 Logistic 回归构建初始信用评级 
    8.1 Logistic 回归的相关关系分析 
    8.2 Logistic 回归模型及实现
    8.3 最大熵模型与极大似然法估计  
    8.4 模型评估  
    8.5 练习题 
    第9 章 使用决策树进行信用评级
    9.1 决策树建模思路 
    9.2 决策树算法 
    9.3 在R 中实现决策树
    9.4 组合算法(Ensemble Learning)
    9.5 练习题 
    第10 章 神经网络  
    10.1 神经元模型
    10.2 人工神经网络模型 
    10.3 单层感知器
    10.4 BP 神经网络  
    10.5 RBF 神经网络  
    10.6 神经网络设计与R 代码实现  
    10.7 练习题  
    第11 章 分类器入门:最近邻域与贝叶斯网络 
    11.1 分类器的概念 
    11.2 KNN 算法  
    11.3 朴素贝叶斯 
    11.4 贝叶斯网络 
    11.5 练习题  
    第12 章 高级分类器:支持向量机 
    12.1 线性可分与线性不可分 
    12.2 线性可分支持向量机  
    12.3 线性支持向量机 
    12.4 非线性支持向量机 
    12.5 R 中的支持向量机 
    12.6 练习题  
    第13 章 连续变量的维度归约  
    13.1 维度归约方法概述 
    13.2 主成分分析 
    13.3 因子分析  
    13.4 奇异值分解
    13.5 对应分析和多维尺度分析 
    13.6 练习题 
    第14 章 聚类 
    14.1 聚类分析概述  
    14.2 聚类算法逻辑  
    14.3 层次聚类 
    14.4 k-means 聚类 
    14.5 基于密度的聚类  
    14.6 聚类模型的评估 
    14.7 高斯混合模型(Gaussian Mixture Model)  
    14.8 客户分群  
    14.9 练习题  
    第15 章 关联规则与推荐算法  
    15.1 长尾理论  
    15.2 关联规则  
    15.3 序贯模型  
    15.4 推荐算法与推荐系统  
    15.5 练习题  
    第16 章 时间序列建模  
    16.1 认识时间序列 
    16.2 简单时间序列分析 
    16.3 平稳时间序列分析ARMA 模型  
    16.4 非平稳时间序列分析ARIMA 模型
    第17 章 特征工程(Feature Engineering)(博文视点官方网站下载) 
    17.1 特征工程概述  
    17.2 数据预处理(Data Preprocessing) 
    17.3 特征构造(Feature Construction)  
    17.4 特征抽取(Feature Extraction) 
    17.5 特征选择(Feature Selection) 
    第18 章 R 文本挖掘(博文视点官方网站下载) 
    18.1 文本挖掘  
    18.2 文本清洗  
    18.3 中文分词与文档模型  
    18.4 文本的特征选择及相关性度量  
    18.5 文本分类  
    18.6 主题模型  
    18.7 综合案例  
    附录A 数据说明(博文视点官方网站下载) 
  • 内容简介:
        商业智能时代已经全面到来,分析型人才的岗位数量在就业市场中呈现井喷式增长。无论是从事产品研发的工程师,还是从事产品推广的市场人员、人力资源和财务会计人员,都需要掌握数据分析技术,否则很有可能被人工智能替代。 
        本书包括 18 章,涉及使用 R 语言做数据分析和数据挖掘的主要分析方法。其中,第 1、 2 章为数据分析方法概述,第 3 章为 R 语言编程基础,第 4 章到第 8 章为统计学习方法,第 9 章到第 16 章为数据挖掘方法,第 17 章为特征工程,第 18 章为 R 文本挖掘。每章都根据所涉及的知识点的不同,选取了实用的案例,并为读者准备了相应的练习题。 
    本书作为 CDA 数据分析师系列丛书中《如虎添翼!数据处理的 SPSS 和 SAS EG 实现(第 2 版)》和《胸有成竹!数据分析的 SPSS 和 SAS EG 进阶(第 2 版)》的姊妹篇,将前两本书的内容进行整合并做了重大拓展,而且秉承了该系列丛书的特点:内容精练、重点突出、示例丰富、语言通俗。可以作为广大从业人员自学商业数据分析的读物,适合大中专院校师生学习和阅读,同时也可以作为高等院校商科、社会科学及相关培训机构的教材。 

  • 作者简介:
    常国珍,北京大学会计学博士,中国大数据产业生态联盟专家委员会专家委员。主要从事金融、电信行业客户画像,信用与操作风险识别与防范,客户终生价值预测与价值提升等工作。 
    曾珂,华中师范大学管理科学工程硕士,现为车贷金融产品部产品经理,精通Python与R语言数据挖掘。曾经就职于华为、国家电网等企业。以金融信用与欺诈风险建模、文本分析、数据可视化等为主要研究方向。 
    朱江,挪威科技大学工学硕士,现为CDA数据分析研究院课程开发副总监,CDA数据挖掘竞赛的评委。精通R与SAS语言数据挖掘,从事电商与互联网数据分析的教学工作。研究方向为电商推荐系统开发、数据可视化、客户特征提取和客户行为模式发现。 
     
  • 目录:
    第1 章 商业数据分析基础 
    1.1 商业数据分析的本质  
    1.2 商业数据分析中心的建设  
    第2 章 数据分析的武器库 
    2.1 数据挖掘简介  
    2.2 R 语言简介 
    2.3 R 与RStudio 的下载和安装 
    2.4 在RStudio 中安装包 
    2.5 练习题  
    第3 章 R 语言编程 
    3.1 R 的基本数据类型 
    3.2 R 的基本数据结构 
    3.3 R 的程序控制  
    3.4 R 的函数  
    3.5 R 的日期与时间数据类型 
    3.6 在R 中读写数据 
    3.7 练习题  
    第4 章 R 描述性统计分析与绘图  
    4.1 描述性统计分析  
    4.2 制图的步骤 
    4.3 R 基础绘图包  
    4.4 ggplot2 绘图  
    4.5 练习题  
    第5 章 数据整合和数据清洗 
    5.1 数据整合  
    5.2 R 中的高级数据整合  
    5.3 R 中的抽样  
    5.4 R 的数据清洗 
    5.5 练习题 
    第6 章 统计推断基础  
    6.1 基本的统计学概念  
    6.2 假设检验与单样本t 检验
    6.3 双样本t 检验 
    6.4 方差分析(分类变量和连续变量关系检验) 
    6.5 相关分析(两连续变量关系检验)
    6.6 卡方检验(二分类变量关系检验) 
    6.7 练习题 
    第7 章 客户价值预测:线性回归模型与诊断 
    7.1 相关性分析  
    7.2 线性回归 
    7.3 线性回归诊断 
    7.4 正则化方法  
    7.5 练习题 
    第8 章 Logistic 回归构建初始信用评级 
    8.1 Logistic 回归的相关关系分析 
    8.2 Logistic 回归模型及实现
    8.3 最大熵模型与极大似然法估计  
    8.4 模型评估  
    8.5 练习题 
    第9 章 使用决策树进行信用评级
    9.1 决策树建模思路 
    9.2 决策树算法 
    9.3 在R 中实现决策树
    9.4 组合算法(Ensemble Learning)
    9.5 练习题 
    第10 章 神经网络  
    10.1 神经元模型
    10.2 人工神经网络模型 
    10.3 单层感知器
    10.4 BP 神经网络  
    10.5 RBF 神经网络  
    10.6 神经网络设计与R 代码实现  
    10.7 练习题  
    第11 章 分类器入门:最近邻域与贝叶斯网络 
    11.1 分类器的概念 
    11.2 KNN 算法  
    11.3 朴素贝叶斯 
    11.4 贝叶斯网络 
    11.5 练习题  
    第12 章 高级分类器:支持向量机 
    12.1 线性可分与线性不可分 
    12.2 线性可分支持向量机  
    12.3 线性支持向量机 
    12.4 非线性支持向量机 
    12.5 R 中的支持向量机 
    12.6 练习题  
    第13 章 连续变量的维度归约  
    13.1 维度归约方法概述 
    13.2 主成分分析 
    13.3 因子分析  
    13.4 奇异值分解
    13.5 对应分析和多维尺度分析 
    13.6 练习题 
    第14 章 聚类 
    14.1 聚类分析概述  
    14.2 聚类算法逻辑  
    14.3 层次聚类 
    14.4 k-means 聚类 
    14.5 基于密度的聚类  
    14.6 聚类模型的评估 
    14.7 高斯混合模型(Gaussian Mixture Model)  
    14.8 客户分群  
    14.9 练习题  
    第15 章 关联规则与推荐算法  
    15.1 长尾理论  
    15.2 关联规则  
    15.3 序贯模型  
    15.4 推荐算法与推荐系统  
    15.5 练习题  
    第16 章 时间序列建模  
    16.1 认识时间序列 
    16.2 简单时间序列分析 
    16.3 平稳时间序列分析ARMA 模型  
    16.4 非平稳时间序列分析ARIMA 模型
    第17 章 特征工程(Feature Engineering)(博文视点官方网站下载) 
    17.1 特征工程概述  
    17.2 数据预处理(Data Preprocessing) 
    17.3 特征构造(Feature Construction)  
    17.4 特征抽取(Feature Extraction) 
    17.5 特征选择(Feature Selection) 
    第18 章 R 文本挖掘(博文视点官方网站下载) 
    18.1 文本挖掘  
    18.2 文本清洗  
    18.3 中文分词与文档模型  
    18.4 文本的特征选择及相关性度量  
    18.5 文本分类  
    18.6 主题模型  
    18.7 综合案例  
    附录A 数据说明(博文视点官方网站下载) 
查看详情
系列丛书 / 更多
用商业案例学R语言数据挖掘
如虎添翼!数据处理的SPSS和SAS EG实现(第2版)
经管之家 编
用商业案例学R语言数据挖掘
胸有成竹!数据分析的SPSS和SAS EG进阶(第2版)
经管之家 编
用商业案例学R语言数据挖掘
胸有成竹!数据分析的SAS EG进阶
常国珍 著;人大经济论坛 编
用商业案例学R语言数据挖掘
如虎添翼!数据处理的SAS EG实现:CDA数据分析师系列丛书
徐筱刚 著;人大经济论坛 编
用商业案例学R语言数据挖掘
触手可及的大数据分析工具:Tableau案例集
沈浩、王涛、韩朝阳、李健 著
用商业案例学R语言数据挖掘
从零进阶!数据分析的统计基础
曹正凤 著;人大经济论坛 编
用商业案例学R语言数据挖掘
大数据的互联网思维
段云峰、秦晓飞 著
用商业案例学R语言数据挖掘
Spark大数据分析技术与实战
经管之家 著
用商业案例学R语言数据挖掘
表哥的Access入门:以Excel视角快速学习数据库知识
林书明 著
用商业案例学R语言数据挖掘
智能大数据SMART准则:数据分析方法、案例和行动纲领
[美]Bernard Marr 著;秦磊、曹正凤 译
用商业案例学R语言数据挖掘
R语言预测实战
游皓麟 著
用商业案例学R语言数据挖掘
医疗革命:医学数据挖掘的理论与实践
邵学杰 著
相关图书 / 更多
用商业案例学R语言数据挖掘
用商品生产商品:经济理论批判绪论
[英]斯拉法(Sraffa.P.) 著;巫宝三 译
用商业案例学R语言数据挖掘
用商业组件构建系统——SEI软件工程丛书·影印版
罗伯特·C·塞克德 著;[美]库尔特·C·瓦尔诺;斯哥特·A·希萨姆
用商业案例学R语言数据挖掘
用商品生产商品
斯拉法
您可能感兴趣 / 更多
用商业案例学R语言数据挖掘
Python数据科学:技术详解与商业实践
常国珍 赵仁乾
用商业案例学R语言数据挖掘
胸有成竹!数据分析的SAS EG进阶
常国珍 著;人大经济论坛 编