R统计应用开发实战

R统计应用开发实战
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [印度] ,
2013-04
版次: 1
ISBN: 9787111493471
定价: 59.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 240页
1人买过
  •   R是一套完整的数据处理、计算和制图的开源软件系统。本书用通俗易懂的语言对R在机器学习、数据挖掘等领域的应用进行深入浅出的讲解,细致地展示实现不同问题的R程序和运行结果,为广大读者快速学习和掌握R语言提供指导。  《R统计应用开发实战》共10章,第1~5章介绍R软件和统计的基本知识,第6~10章详细讨论应用和现代回归树模型。第1章介绍数据特征,用R展示不同类型的变量和数据分类;第2章详细讲解如何用R实现数据的导入和导出;第3章分别对分类型和数值型数据讨论R的可视化问题;第4章研究探索性分析,展示用R实现对数据作初步分析的一些直观的技术和方法;第5章从似然函数和极大似然估计问题开始,通过R编程,选择一些具体的函数研究参数的置信区间,同时对重要统计量进行了比较均值的Z-检验和t-检验以及比较方差的F检验;第6章是线性回归分析的R实现问题,对因变量和自变量建立线性函数关系;第7章引入一个分类模型——logistic回归模型,并用ROC曲线识别更好的分类模型;第8章介绍标准化的回归模型,探讨过拟合问题并给出示例;第9章提出基于树的回归模型,利用R进行建模,形成分类回归机制;第10章运用R解决分类回归等问题,用装袋法(bagging算法)和随机森林比较分类回归的两处改善。   Prabhanjan Narayanachar Tattar,现就职于戴尔全球分析公司的客户服务分析部,担任班加罗尔大学的戴尔公司商业分析顾问。他有多年的R软件使用经验,并曾研发过gpk和ACSWR两个软件包,出版了《A Course in Statistics with R》。他还曾在IBS-GK Shukla青年生物统计学家奖(2005年)和Dr. U.S. Nair奖的评选中均获得青年统计学家的荣誉称号。
      程豪,中国人民大学统计学博士在读,主要研究方向为机器学习、数据挖掘、统计预测、社会网络及结构方程模型。他担任了10多个课题的主要负责人和研究员,合作发表论文6篇,并在“海峡两岸CATI与数据挖掘合作20周年暨第十届中国数据挖掘与商业智能研讨会”中做报告。2014年获得“汇丰杯”中国高校SAS数据分析大赛冠军。除本书外,还曾参与翻译《R语言编程艺术》。 译者序
    前言
    第1章 数据特征1
    1.1 问卷调查及其组成部分1
    1.2 在计算机科学中的不确定性研究5
    1.3 R安装6
    1.3.1 使用R包7
    1.3.2 RSADBE——本书的R包8
    1.3.3 离散分布9
    1.3.4 离散均匀分布10
    1.3.5 二项分布11
    1.3.6 超几何分布13
    1.3.7 负二项分布14
    1.3.8 泊松分布15
    1.4 连续分布16
    1.4.1 均匀分布16
    1.4.2 指数分布17
    1.4.3 正态分布18
    1.5 本章小结20
    第2章 数据导入和导出21
    2.1 data.frame和其他格式数据21
    2.1.1 常数、向量和矩阵21
    2.1.2 列表对象28
    2.1.3 data.frame对象30
    2.1.4 表对象33
    2.2 函数read.csv、read.xls以及外来程序包35
    2.3 导出数据/图表41
    2.3.1 导出R对象41
    2.3.2 导出图表41
    2.4 管理一个R会话43
    2.5 本章小结45
    第3章 数据可视化46
    3.1 分类数据的可视化技术47
    3.1.1 条形图47
    3.1.2 点图52
    3.1.3 脊柱图、马赛克图54
    3.1.4 饼图和四折图58
    3.2 连续型变量数据的可视化59
    3.2.1 箱线图60
    3.2.2 直方图62
    3.2.3 散点图66
    3.2.4 帕累托图70
    3.3 ggplot概述71
    3.4 本章小结73
    第4章 探索性分析75
    4.1 基本汇总统计量75
    4.1.1 百分位数、四分位数和中位数76
    4.1.2 折页数76
    4.1.3 四分位极差77
    4.2 茎叶图80
    4.3 字母值83
    4.4 数据变换84
    4.5 袋状图:二元箱线图86
    4.6 耐抗线88
    4.7 平滑数据90
    4.8 中位数平滑93
    4.9 本章小结95
    第5章 统计推断97
    5.1 极大似然估计98
    5.1.1 可视化似然函数98
    5.1.2 寻找极大似然估计101
    5.1.3 使用fitdistr函数103
    5.2 置信区间105
    5.3 假设检验108
    5.3.1 二项式检验109
    5.3.2 比例检验和卡方检验111
    5.3.3 基于正态分布检验:单样本113
    5.3.4 基于正态分布检验:两样本118
    5.4 本章小结121
    第6章 线性回归分析122
    6.1 简单线性回归模型123
    6.1.1 随意选择参数会发生什么123
    6.1.2 建立一个简单线性回归模型126
    6.1.3 ANOVA及置信区间128
    6.1.4 模型验证129
    6.2 多元线性回归模型133
    6.2.1 平均K个简单线性回归模型或建立一个多元回归模型134
    6.2.2 建立一个多元线性回归模型136
    6.2.3 多元线性回归模型的ANOVA和置信区间137
    6.2.4 有用的残差图139
    6.3 回归诊断141
    6.3.1 杠杆点142
    6.3.2 影响点142
    6.3.3 DFFITS和DFBETAS143
    6.4 多重共线性问题143
    6.5 选择模型145
    6.5.1 逐步选择145
    6.5.2 基于准则的方法146
    6.6 本章小结150
    第7章 logistic回归模型151
    7.1 二元回归问题151
    7.2 probit回归模型153
    7.3 logistic回归模型155
    7.4 模型验证和诊断160
    7.4.1 广义线性模型的残差图160
    7.4.2 广义线性模型的影响点和控制点163
    7.5 接收操作曲线166
    7.6 德国的信用甄别数据集的logistic回归168
    7.7 本章小结171
    第8章 正规化回归模型172
    8.1 过度拟合问题172
    8.2 回归样条176
    8.2.1 基函数176
    8.2.2 分段线性回归模型176
    8.2.3 自然三次样条函数和一般的B样条曲线179
    8.3 线性模型的岭回归183
    8.4 logistic回归模型的岭回归187
    8.5 再看模型评估188
    8.6 本章小结193
    第9章 分类与回归树194
    9.1 递归划分法194
    9.1.1 划分数据196
    9.1.2 第一个树197
    9.2 构造回归树200
    9.3 构造分类树209
    9.4 德国信用数据集的分类树215
    9.5 树的修剪和完善218
    9.6 本章小结220
    第10章 分类与回归树及其他222
    10.1 分类与回归树的改进222
    10.2 Bagging225
    10.2.1 bootstrap算法225
    10.2.2 bagging算法227
    10.3 随机森林230
    10.4 整合233
    10.5 本章小结238
    参考文献239
  • 内容简介:
      R是一套完整的数据处理、计算和制图的开源软件系统。本书用通俗易懂的语言对R在机器学习、数据挖掘等领域的应用进行深入浅出的讲解,细致地展示实现不同问题的R程序和运行结果,为广大读者快速学习和掌握R语言提供指导。  《R统计应用开发实战》共10章,第1~5章介绍R软件和统计的基本知识,第6~10章详细讨论应用和现代回归树模型。第1章介绍数据特征,用R展示不同类型的变量和数据分类;第2章详细讲解如何用R实现数据的导入和导出;第3章分别对分类型和数值型数据讨论R的可视化问题;第4章研究探索性分析,展示用R实现对数据作初步分析的一些直观的技术和方法;第5章从似然函数和极大似然估计问题开始,通过R编程,选择一些具体的函数研究参数的置信区间,同时对重要统计量进行了比较均值的Z-检验和t-检验以及比较方差的F检验;第6章是线性回归分析的R实现问题,对因变量和自变量建立线性函数关系;第7章引入一个分类模型——logistic回归模型,并用ROC曲线识别更好的分类模型;第8章介绍标准化的回归模型,探讨过拟合问题并给出示例;第9章提出基于树的回归模型,利用R进行建模,形成分类回归机制;第10章运用R解决分类回归等问题,用装袋法(bagging算法)和随机森林比较分类回归的两处改善。
  • 作者简介:
      Prabhanjan Narayanachar Tattar,现就职于戴尔全球分析公司的客户服务分析部,担任班加罗尔大学的戴尔公司商业分析顾问。他有多年的R软件使用经验,并曾研发过gpk和ACSWR两个软件包,出版了《A Course in Statistics with R》。他还曾在IBS-GK Shukla青年生物统计学家奖(2005年)和Dr. U.S. Nair奖的评选中均获得青年统计学家的荣誉称号。
      程豪,中国人民大学统计学博士在读,主要研究方向为机器学习、数据挖掘、统计预测、社会网络及结构方程模型。他担任了10多个课题的主要负责人和研究员,合作发表论文6篇,并在“海峡两岸CATI与数据挖掘合作20周年暨第十届中国数据挖掘与商业智能研讨会”中做报告。2014年获得“汇丰杯”中国高校SAS数据分析大赛冠军。除本书外,还曾参与翻译《R语言编程艺术》。
  • 目录:
    译者序
    前言
    第1章 数据特征1
    1.1 问卷调查及其组成部分1
    1.2 在计算机科学中的不确定性研究5
    1.3 R安装6
    1.3.1 使用R包7
    1.3.2 RSADBE——本书的R包8
    1.3.3 离散分布9
    1.3.4 离散均匀分布10
    1.3.5 二项分布11
    1.3.6 超几何分布13
    1.3.7 负二项分布14
    1.3.8 泊松分布15
    1.4 连续分布16
    1.4.1 均匀分布16
    1.4.2 指数分布17
    1.4.3 正态分布18
    1.5 本章小结20
    第2章 数据导入和导出21
    2.1 data.frame和其他格式数据21
    2.1.1 常数、向量和矩阵21
    2.1.2 列表对象28
    2.1.3 data.frame对象30
    2.1.4 表对象33
    2.2 函数read.csv、read.xls以及外来程序包35
    2.3 导出数据/图表41
    2.3.1 导出R对象41
    2.3.2 导出图表41
    2.4 管理一个R会话43
    2.5 本章小结45
    第3章 数据可视化46
    3.1 分类数据的可视化技术47
    3.1.1 条形图47
    3.1.2 点图52
    3.1.3 脊柱图、马赛克图54
    3.1.4 饼图和四折图58
    3.2 连续型变量数据的可视化59
    3.2.1 箱线图60
    3.2.2 直方图62
    3.2.3 散点图66
    3.2.4 帕累托图70
    3.3 ggplot概述71
    3.4 本章小结73
    第4章 探索性分析75
    4.1 基本汇总统计量75
    4.1.1 百分位数、四分位数和中位数76
    4.1.2 折页数76
    4.1.3 四分位极差77
    4.2 茎叶图80
    4.3 字母值83
    4.4 数据变换84
    4.5 袋状图:二元箱线图86
    4.6 耐抗线88
    4.7 平滑数据90
    4.8 中位数平滑93
    4.9 本章小结95
    第5章 统计推断97
    5.1 极大似然估计98
    5.1.1 可视化似然函数98
    5.1.2 寻找极大似然估计101
    5.1.3 使用fitdistr函数103
    5.2 置信区间105
    5.3 假设检验108
    5.3.1 二项式检验109
    5.3.2 比例检验和卡方检验111
    5.3.3 基于正态分布检验:单样本113
    5.3.4 基于正态分布检验:两样本118
    5.4 本章小结121
    第6章 线性回归分析122
    6.1 简单线性回归模型123
    6.1.1 随意选择参数会发生什么123
    6.1.2 建立一个简单线性回归模型126
    6.1.3 ANOVA及置信区间128
    6.1.4 模型验证129
    6.2 多元线性回归模型133
    6.2.1 平均K个简单线性回归模型或建立一个多元回归模型134
    6.2.2 建立一个多元线性回归模型136
    6.2.3 多元线性回归模型的ANOVA和置信区间137
    6.2.4 有用的残差图139
    6.3 回归诊断141
    6.3.1 杠杆点142
    6.3.2 影响点142
    6.3.3 DFFITS和DFBETAS143
    6.4 多重共线性问题143
    6.5 选择模型145
    6.5.1 逐步选择145
    6.5.2 基于准则的方法146
    6.6 本章小结150
    第7章 logistic回归模型151
    7.1 二元回归问题151
    7.2 probit回归模型153
    7.3 logistic回归模型155
    7.4 模型验证和诊断160
    7.4.1 广义线性模型的残差图160
    7.4.2 广义线性模型的影响点和控制点163
    7.5 接收操作曲线166
    7.6 德国的信用甄别数据集的logistic回归168
    7.7 本章小结171
    第8章 正规化回归模型172
    8.1 过度拟合问题172
    8.2 回归样条176
    8.2.1 基函数176
    8.2.2 分段线性回归模型176
    8.2.3 自然三次样条函数和一般的B样条曲线179
    8.3 线性模型的岭回归183
    8.4 logistic回归模型的岭回归187
    8.5 再看模型评估188
    8.6 本章小结193
    第9章 分类与回归树194
    9.1 递归划分法194
    9.1.1 划分数据196
    9.1.2 第一个树197
    9.2 构造回归树200
    9.3 构造分类树209
    9.4 德国信用数据集的分类树215
    9.5 树的修剪和完善218
    9.6 本章小结220
    第10章 分类与回归树及其他222
    10.1 分类与回归树的改进222
    10.2 Bagging225
    10.2.1 bootstrap算法225
    10.2.2 bagging算法227
    10.3 随机森林230
    10.4 整合233
    10.5 本章小结238
    参考文献239
查看详情
系列丛书 / 更多
R统计应用开发实战
人人都是网站分析师:从分析师的视角理解网站和解读数据
王彦平 著
R统计应用开发实战
R的极客理想:——工具篇
张丹 著
R统计应用开发实战
网站数据挖掘与分析:系统方法与商业实践
宋天龙 著
R统计应用开发实战
R语言与网站分析
李明 著
R统计应用开发实战
R的极客理想 高级开发篇
张丹 著
R统计应用开发实战
R语言:实用数据分析和可视化技术
[美]贾里德 P. 兰德(Jared P. Lander) 著;蒋家坤 译
R统计应用开发实战
Tableau数据可视化实战
[美]Ashutosh Nandeshwar 著;任万凤、刁钰 译
R统计应用开发实战
决策分析:以Excel为分析工具
[美]Conrad Carlberg 著;姚军 译
相关图书 / 更多
R统计应用开发实战
R统计数据清洗及应用
埃德温·德荣格(Edwin 著;[荷兰]马克·范德鲁(Mark、van、der、Loo、杨小东 译
R统计应用开发实战
R统计与数据可视化:社会科学数据分析实践(全彩)
David S. Brown(戴维·S.布朗
R统计应用开发实战
R统计高级编程和数据模型 分析、机器学习和可视化
[美]约书亚·F.威利(Joshua F. Wiley) 著;吴文国 胡明晓 译;[美]马特·威利(Matt Wiley)
R统计应用开发实战
R统计编程入门:原书第二版
Braun 著;[美]W.John、齐光、原作强 译
您可能感兴趣 / 更多
R统计应用开发实战
生如夏花:名家译本;插画版泰戈尔诗集;生如夏花之绚烂,死如秋叶之静美
[印度]泰戈尔著 郑振铎 译;小马过河 出品;有容书邦 发行
R统计应用开发实战
无价的罗摩(梵语文学译丛)
[印度]牟罗利 著
R统计应用开发实战
飞鸟集:泰戈尔诗选(诺贝尔奖得主泰戈尔代表作,郑振铎经典译本,赠精美书签)(创美文库)
[印度]泰戈尔 著;郑振铎 译;创美工厂 出品
R统计应用开发实战
天猫文库:泰戈尔诗选(九年级上推荐阅读)
[印度]泰戈尔 著;王立 译;郑振铎
R统计应用开发实战
短经典精选系列:两次暗杀之间(布克奖作家白老虎作者阿迪加短篇小说,一本书看懂印度前世今生)
[印度]阿拉文德·阿迪加
R统计应用开发实战
简易宫腔镜操作手册
[印度]巴斯卡尔·帕尔 主编;胡元晶 李圃 主译;隋龙 主审;[印度]苏尼特·滕杜尔沃德卡
R统计应用开发实战
广雅·波斯航海史(揭开丝绸、战舰、海港背后五千年的爱恨纠缠,述说一条海路勾连起的繁荣共生。)
[印度]哈迪·哈桑 广雅 出品
R统计应用开发实战
新月集
[印度]泰戈尔
R统计应用开发实战
数控机床可靠性与维修策略优化技术
[印度]布佩什·库马尔·拉德 迪维亚·什里瓦斯塔瓦 马克兰德·斯·库尔卡尼
R统计应用开发实战
行动瑜伽(瑜伽哲学经典丛书)
[印度]斯瓦米·辨喜 著;闻中 译
R统计应用开发实战
管理学精选案例(英文版)
[印度]王中(Prasad Siba BORAH);樊茗·h;[克罗地亚]德拉加纳·奥斯蒂奇(Dragana Ostic)
R统计应用开发实战
记忆博物馆
[印度]阿伦·沃尔夫 编;马淑艳 译