基于R的统计分析与数据挖掘

基于R的统计分析与数据挖掘
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2014-05
版次: 1
ISBN: 9787300190747
定价: 48.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 399页
分类: 社会文化
53人买过
  •   《基于R的统计分析与数据挖掘(统计数据分析与应用丛书)》聚焦当今备受国内外数据分析师和数据应用者关注的R语言,关注如何借助R实现统计分析和数据挖掘。它既不是仅侧重理论讲解的统计分析和数据挖掘教科书,也不是仅侧重R编程操作的使用手册,而是以数据分析贯穿全书的两者的有机结合。 


      《基于R的统计分析与数据挖掘(统计数据分析与应用丛书)》特色在于:以数据模拟的直观方式论述方法原理的同时,通过案例强化R的操作实践性;在以解决应用问题为目标讨论R操作的同时,通过原理论述强化模型结果的解读理解。 


      《基于R的统计分析与数据挖掘(统计数据分析与应用丛书)》定位于统计分析和数据挖掘的学习者、实践者和研究者,旨在使读者理解统计分析原理,熟练操控R软件,拓展数据应用,提升研究水平。 


      薛薇,工学硕士,经济学博士,中国人民大学应用统计科学研究中心副主任,中国人民大学统计学院副教授。关注数据挖掘及统计建模、统计和数据挖掘软件应用、统计数据库系统研发等方面。涉足网络新媒体舆论传播和互动建模、政府和官方微博分析、电商数据分析、学科学术热点跟踪等文本挖掘,以及社会网络分析和以数据挖掘为依托的客户关系管理等领域。主要著作:《SPSS统计分析方法及应用》、《SPSS Modeler数据挖掘方法及应用》、《基于R的统计分析和数据挖掘》、《基于信息技术的统计信息系统》等。 


    第1章 关于R
    1.1 为什么选择R
    1.2 如何学习R
    1.3 R入门必备
    1.4 小 结
    第2章 R的数据组织
    2.1 R的数据对象
    2.2 创建和访问R的数据对象
    2.3 从文本文件读数据
    2.4 外部数据的导入
    2.5 R数据组织的其他问题
    2.6 小 结
    第3章 R的数据管理
    3.1 数据合并
    3.2 数据排序
    3.3 缺失数据报告
    3.4 变量计算
    3.5 变量值的重编码
    3.6 数据筛选
    3.7 数据保存
    3.8 数据管理中控制流程
    3.9 小 结
    第4章 R的基本数据分析:描述和相关
    4.1 数值型单变量的描述
    4.2 分类型单变量的描述
    4.3 两数值型变量相关性的分析
    4.4 两分类型变量相关性的分析
    4.5 小 结
    第5章 R的基本数据分析:可视化
    5.1 绘图基础
    5.2 数值型单变量分布的可视化
    5.3 分类型变量分布和相关性的可视化
    5.4 两数值型变量相关性的可视化
    5.5 lattice绘图
    5.6 小 结
    第6章 R的两均值比较检验
    6.1 两独立样本的均值检验
    6.2 两配对样本的均值检验
    6.3 样本均值检验的功效分析
    6.4 两总体分布差异的非参数检验
    6.5 两样本均值差的置换检验
    6.6 两样本均值差的自举法检验
    6.7 小 结
    第7章 R的方差分析
    7.1 单因素方差分析
    7.2 单因素协方差分析
    7.3 多因素方差分析
    7.4 小 结
    第8章 R的回归分析:一般线性模型
    8.1 回归分析概述
    8.2 建立线性回归模型
    8.3 线性回归方程的检验
    8.4 回归诊断:误差项是否满足高斯马尔科夫假定
    8.5 回归诊断:诊断数据中的异常观测点
    8.6 回归诊断:多重共线性的诊断
    8.7 回归建模策略
    8.8 回归模型验证
    8.9 带虚拟变量的线性回归分析
    8.10 小 结
    第9章 R的回归分析:广义线性模型
    9.1 广义线性模型概述
    9.2 logistic回归分析:连接函数和参数估计
    9.3 logistic回归分析:解读模型和模型检验
    9.4 logistic回归分析:R函数和示例
    9.5 logistic回归分析:回归诊断
    9.6 泊松回归分析
    9.7 广义线性模型的交叉验证
    9.8 小 结
    第10章 R的聚类分析
    10.1 聚类分析概述
    10.2 K-Means聚类
    10.3 层次聚类
    10.4 两步聚类
    10.5 小 结
    第11章 R的因子分析:变量降维
    11.1 因子分析概述
    11.2 构造因子变量:基于主成分分析法
    11.3 构造因子变量:基于主轴因子法
    11.4 因子变量的命名
    11.5 计算因子得分
    11.6 小 结
    第12章 R的线性判别分析:分类模型
    12.1 距离判别
    12.2 Fisher判别
    12.3 小 结
    第13章 R的决策树:预测模型
    13.1 决策树算法概述
    13.2 分类回归树的生长过程
    13.3 分类回归树的剪枝
    13.4 建立分类回归树的R函数和示例
    13.5 建立分类回归树的组合预测模型
    13.6 随机森林
    13.7 小 结
    第14章 R的人工神经网络:预测和聚类
    14.1 人工神经网络概述
    14.2 B-P反向传播网络
    14.3 B-P反向传播网络的R函数和示例
    14.4 SOM自组织映射网络
    14.5 小 结
  • 内容简介:
      《基于R的统计分析与数据挖掘(统计数据分析与应用丛书)》聚焦当今备受国内外数据分析师和数据应用者关注的R语言,关注如何借助R实现统计分析和数据挖掘。它既不是仅侧重理论讲解的统计分析和数据挖掘教科书,也不是仅侧重R编程操作的使用手册,而是以数据分析贯穿全书的两者的有机结合。 


      《基于R的统计分析与数据挖掘(统计数据分析与应用丛书)》特色在于:以数据模拟的直观方式论述方法原理的同时,通过案例强化R的操作实践性;在以解决应用问题为目标讨论R操作的同时,通过原理论述强化模型结果的解读理解。 


      《基于R的统计分析与数据挖掘(统计数据分析与应用丛书)》定位于统计分析和数据挖掘的学习者、实践者和研究者,旨在使读者理解统计分析原理,熟练操控R软件,拓展数据应用,提升研究水平。 


  • 作者简介:
      薛薇,工学硕士,经济学博士,中国人民大学应用统计科学研究中心副主任,中国人民大学统计学院副教授。关注数据挖掘及统计建模、统计和数据挖掘软件应用、统计数据库系统研发等方面。涉足网络新媒体舆论传播和互动建模、政府和官方微博分析、电商数据分析、学科学术热点跟踪等文本挖掘,以及社会网络分析和以数据挖掘为依托的客户关系管理等领域。主要著作:《SPSS统计分析方法及应用》、《SPSS Modeler数据挖掘方法及应用》、《基于R的统计分析和数据挖掘》、《基于信息技术的统计信息系统》等。 


  • 目录:
    第1章 关于R
    1.1 为什么选择R
    1.2 如何学习R
    1.3 R入门必备
    1.4 小 结
    第2章 R的数据组织
    2.1 R的数据对象
    2.2 创建和访问R的数据对象
    2.3 从文本文件读数据
    2.4 外部数据的导入
    2.5 R数据组织的其他问题
    2.6 小 结
    第3章 R的数据管理
    3.1 数据合并
    3.2 数据排序
    3.3 缺失数据报告
    3.4 变量计算
    3.5 变量值的重编码
    3.6 数据筛选
    3.7 数据保存
    3.8 数据管理中控制流程
    3.9 小 结
    第4章 R的基本数据分析:描述和相关
    4.1 数值型单变量的描述
    4.2 分类型单变量的描述
    4.3 两数值型变量相关性的分析
    4.4 两分类型变量相关性的分析
    4.5 小 结
    第5章 R的基本数据分析:可视化
    5.1 绘图基础
    5.2 数值型单变量分布的可视化
    5.3 分类型变量分布和相关性的可视化
    5.4 两数值型变量相关性的可视化
    5.5 lattice绘图
    5.6 小 结
    第6章 R的两均值比较检验
    6.1 两独立样本的均值检验
    6.2 两配对样本的均值检验
    6.3 样本均值检验的功效分析
    6.4 两总体分布差异的非参数检验
    6.5 两样本均值差的置换检验
    6.6 两样本均值差的自举法检验
    6.7 小 结
    第7章 R的方差分析
    7.1 单因素方差分析
    7.2 单因素协方差分析
    7.3 多因素方差分析
    7.4 小 结
    第8章 R的回归分析:一般线性模型
    8.1 回归分析概述
    8.2 建立线性回归模型
    8.3 线性回归方程的检验
    8.4 回归诊断:误差项是否满足高斯马尔科夫假定
    8.5 回归诊断:诊断数据中的异常观测点
    8.6 回归诊断:多重共线性的诊断
    8.7 回归建模策略
    8.8 回归模型验证
    8.9 带虚拟变量的线性回归分析
    8.10 小 结
    第9章 R的回归分析:广义线性模型
    9.1 广义线性模型概述
    9.2 logistic回归分析:连接函数和参数估计
    9.3 logistic回归分析:解读模型和模型检验
    9.4 logistic回归分析:R函数和示例
    9.5 logistic回归分析:回归诊断
    9.6 泊松回归分析
    9.7 广义线性模型的交叉验证
    9.8 小 结
    第10章 R的聚类分析
    10.1 聚类分析概述
    10.2 K-Means聚类
    10.3 层次聚类
    10.4 两步聚类
    10.5 小 结
    第11章 R的因子分析:变量降维
    11.1 因子分析概述
    11.2 构造因子变量:基于主成分分析法
    11.3 构造因子变量:基于主轴因子法
    11.4 因子变量的命名
    11.5 计算因子得分
    11.6 小 结
    第12章 R的线性判别分析:分类模型
    12.1 距离判别
    12.2 Fisher判别
    12.3 小 结
    第13章 R的决策树:预测模型
    13.1 决策树算法概述
    13.2 分类回归树的生长过程
    13.3 分类回归树的剪枝
    13.4 建立分类回归树的R函数和示例
    13.5 建立分类回归树的组合预测模型
    13.6 随机森林
    13.7 小 结
    第14章 R的人工神经网络:预测和聚类
    14.1 人工神经网络概述
    14.2 B-P反向传播网络
    14.3 B-P反向传播网络的R函数和示例
    14.4 SOM自组织映射网络
    14.5 小 结
查看详情