实用预测分析

实用预测分析
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] (Ralph Winters)
2018-07
版次: 1
ISBN: 9787111603351
定价: 89.00
装帧: 其他
开本: 16开
纸张: 胶版纸
7人买过
  • 本书详细讲述了预测分析的原理、技术及实现,并深入讨论了大数据。重点着眼于掌握提高开发、实行预测分析所需的6项关键实用技能。本书还提供了来自市场、医疗和零售等行业的真实案例,有助于读者针对产品实现自己的预测分析。 作者简介

    拉尔夫·温特斯(Ralph Winters)目前在一家医疗服务公司担任数据架构师。他已经给很多名列世界500强的大企业提供过自己在统计和分析方面的经验,包括金融、市场营销、保险、医疗和制药领域的企业。他的工作包括很多不同类型的预测分析项目,包括客户保留、反洗钱、客户之声文本挖掘分析,以及医疗风险和客户选择模型。 Contents 目  录

    译者序

    关于作者

    关于审校者

    前言

    第1章预测分析入门  1

    1.1许多行业中都有预测分析  2

    1.1.1市场营销中的预测分析  2

    1.1.2医疗中的预测分析  2

    1.1.3其他行业中的预测分析  3

    1.2技能和角色在预测分析中都很重要  3

    1.3预测分析软件  4

    1.3.1开源软件  5

    1.3.2闭源软件  5

    1.3.3和平共处  5

    1.4其他有用的工具  5

    1.4.1超越基础知识  6

    1.4.2数据分析/研究  6

    1.4.3数据工程  6

    1.4.4管理  7

    1.4.5数据科学团队  7

    1.4.6看待预测分析的两种不同方式  7

    1.5R  8

    1.5.1CRAN  8

    1.5.2安装R语言  8

    1.5.3其他安装R语言的方法  8

    1.6预测分析项目是如何组织的  9

    1.7图形用户界面  10

    1.8RStudio入门  11

    1.8.1重新布局以保持和示例一致  11

    1.8.2部分重要面板的简要描述  12

    1.8.3创建新项目  13

    1.9R语言控制台  14

    1.10源代码窗口  15

    1.11第一个预测模型  16

    1.12第二个脚本  18

    1.12.1代码描述  19

    1.12.2predict函数  20

    1.12.3检验预测误差  21

    1.13 R语言包  22

    1.13.1stargazer包  22

    1.13.2安装stargazer包  23

    1.13.3保存工作  24

    1.14参考资料  24

    1.15本章小结  24

    第2章 建模过程  25

    2.1结构化方法的优点  25

    2.2分析过程方法  26

    2.2.1CRISP-DM和SEMMA  27

    2.2.2CRISP-DM和SEMMA的图表  27

    2.2.3敏捷过程  28

    2.2.4六西格玛和根本原因  28

    2.2.5是否需要数据抽样  28

    2.2.6使用所有数据  29

    2.2.7比较样本与群体  29

    2.3第一步:理解业务  30

    2.4第二步:理解数据  36

    2.4.1衡量尺度  36

    2.4.2单变量分析  38

    2.5第三步:数据准备  43

    2.6第四步:建模  44

    2.6.1具体模型说明  45

    2.6.2逻辑回归  46

    2.6.3支持向量机  47

    2.6.4决策树  47

    2.6.5降维技术  51

    2.6.6主成分  51

    2.6.7聚类  52

    2.6.8时间序列模型  52

    2.6.9朴素贝叶斯分类器  53

    2.6.10文本挖掘技术  54

    2.7第五步:评估  57

    2.7.1模型验证  58

    2.7.2曲线下面积  59

    2.7.3样本内和样本外测试、前进测试  60

    2.7.4训练/测试/验证数据集  60

    2.7.5时间序列验证  61

    2.7.6最佳冠军模型的基准测试  61

    2.7.7专家意见:人与机器  61

    2.7.8元分析  61

    2.7.9飞镖板方法  61

    2.8第六步:部署  62

    2.9参考资料  62

    2.10本章小结  62

    第3章 输入和探索数据  64

    3.1数据输入  64

    3.1.1文本文件输入  65

    3.1.2数据库表格  66

    3.1.3电子表格文件  67

    3.1.4XML和JSON数据  67

    3.1.5生成你自己的数据  68

    3.1.6处理大型文件的技巧  68

    3.1.7数据整理  68

    3.2连接数据  69

    3.2.1使用sqldf函数  69

    3.2.2生成数据  70

    3.2.3检查元数据  71

    3.2.4使用内部连接和外部连接来合并数据  72

    3.2.5识别有多个购买记录的成员  73

    3.2.6清除冗余记录  74

    3.3探索医院数据集  74

    3.3.1str(df)函数的输出  74

    3.3.2View函数的输出  75

    3.3.3colnames函数  75

    3.3.4summary函数  76

    3.3.5在浏览器中打开文件  77

    3.3.6绘制分布图  77

    3.3.7变量的可视化绘图  78

    3.4转置数据帧  80

    3.5缺失值  84

    3.5.1建立缺失值测试数据集  84

    3.5.2缺失值的不同类型  85

    3.5.3纠正缺失值  87

    3.5.4使用替换过的值运行回归  90

    3.6替换分类变量  91

    3.7异常值  91

    3.7.1异常值为什么重要  91

    3.7.2探测异常值  92

    3.8数据转换  96

    3.8.1生成测试数据  97

    3.8.2Box-Cox转换  97

    3.9变量化简/变量重要性  98

    3.9.1主成分分析法  98

    3.9.2全子集回归  102

    3.9.3变量重要性  104

    3.10参考资料  106

    3.11本章小结  106

    第4章 回归算法导论  107

    4.1监督学习模型和无监督学习模型  108

    4.1.1监督学习模型  108

    4.1.2无监督学习模型  108

    4.2回归技术  109

    4.3广义线性模型  110

    4.4逻辑回归  110

    4.4.1比率  111

    4.4.2逻辑回归系数  111

    4.4.3示例:在医疗中使用逻辑回归来预测疼痛阈值  112

    4.4.4GLM模型拟合  114

    4.4.5检验残差项  115

    4.4.6添加变量的分布图  116

    4.4.7p值及其效应量  117

    4.4.8p值及其影响范围  118

    4.4.9变量选择  119

    4.4.10交互  121

    4.4.11拟合优度统计量  123

    4.4.12置信区间和Wald统计  124

    4.4.13基本回归诊断图  124

    4.4.14分布图类型描述  124

    4.4.15拟合优度:Hosmer-Lemeshow检验  126

    4.4.16正则化  127

    4.4.17示例:ElasticNet  128

    4.4.18选择一个正确的Lambda  128

    4.4.19基于Lambda输出可能的系数  129

    4.5本章小结  130

    第5章决策树、聚类和SVM导论  131

    5.1决策树算法  131

    5.1.1决策树的优点  131

    5.1.2决策树的缺点  132

    5.1.3决策树的基本概念  132

    5.1.4扩展树  132

    5.1.5不纯度  133

    5.1.6控制树的增长  134

    5.1.7决策树算法的类型  134

    5.1.8检查目标变量  135

    5.1.9在rpart模型中使用公式符号  135

    5.1.10图的解释  136

    5.1.11输出决策树的文本版本  137

    5.1.12修剪  138

    5.1.13渲染决策树的其他选项  139

    5.2聚类分析  140

    5.2.1聚类分析应用于多种行业  140

    5.2.2什么是聚类  140

    5.2.3聚类的类型  141

    5.2.4k均值聚类算
  • 内容简介:
    本书详细讲述了预测分析的原理、技术及实现,并深入讨论了大数据。重点着眼于掌握提高开发、实行预测分析所需的6项关键实用技能。本书还提供了来自市场、医疗和零售等行业的真实案例,有助于读者针对产品实现自己的预测分析。
  • 作者简介:
    作者简介

    拉尔夫·温特斯(Ralph Winters)目前在一家医疗服务公司担任数据架构师。他已经给很多名列世界500强的大企业提供过自己在统计和分析方面的经验,包括金融、市场营销、保险、医疗和制药领域的企业。他的工作包括很多不同类型的预测分析项目,包括客户保留、反洗钱、客户之声文本挖掘分析,以及医疗风险和客户选择模型。
  • 目录:
    Contents 目  录

    译者序

    关于作者

    关于审校者

    前言

    第1章预测分析入门  1

    1.1许多行业中都有预测分析  2

    1.1.1市场营销中的预测分析  2

    1.1.2医疗中的预测分析  2

    1.1.3其他行业中的预测分析  3

    1.2技能和角色在预测分析中都很重要  3

    1.3预测分析软件  4

    1.3.1开源软件  5

    1.3.2闭源软件  5

    1.3.3和平共处  5

    1.4其他有用的工具  5

    1.4.1超越基础知识  6

    1.4.2数据分析/研究  6

    1.4.3数据工程  6

    1.4.4管理  7

    1.4.5数据科学团队  7

    1.4.6看待预测分析的两种不同方式  7

    1.5R  8

    1.5.1CRAN  8

    1.5.2安装R语言  8

    1.5.3其他安装R语言的方法  8

    1.6预测分析项目是如何组织的  9

    1.7图形用户界面  10

    1.8RStudio入门  11

    1.8.1重新布局以保持和示例一致  11

    1.8.2部分重要面板的简要描述  12

    1.8.3创建新项目  13

    1.9R语言控制台  14

    1.10源代码窗口  15

    1.11第一个预测模型  16

    1.12第二个脚本  18

    1.12.1代码描述  19

    1.12.2predict函数  20

    1.12.3检验预测误差  21

    1.13 R语言包  22

    1.13.1stargazer包  22

    1.13.2安装stargazer包  23

    1.13.3保存工作  24

    1.14参考资料  24

    1.15本章小结  24

    第2章 建模过程  25

    2.1结构化方法的优点  25

    2.2分析过程方法  26

    2.2.1CRISP-DM和SEMMA  27

    2.2.2CRISP-DM和SEMMA的图表  27

    2.2.3敏捷过程  28

    2.2.4六西格玛和根本原因  28

    2.2.5是否需要数据抽样  28

    2.2.6使用所有数据  29

    2.2.7比较样本与群体  29

    2.3第一步:理解业务  30

    2.4第二步:理解数据  36

    2.4.1衡量尺度  36

    2.4.2单变量分析  38

    2.5第三步:数据准备  43

    2.6第四步:建模  44

    2.6.1具体模型说明  45

    2.6.2逻辑回归  46

    2.6.3支持向量机  47

    2.6.4决策树  47

    2.6.5降维技术  51

    2.6.6主成分  51

    2.6.7聚类  52

    2.6.8时间序列模型  52

    2.6.9朴素贝叶斯分类器  53

    2.6.10文本挖掘技术  54

    2.7第五步:评估  57

    2.7.1模型验证  58

    2.7.2曲线下面积  59

    2.7.3样本内和样本外测试、前进测试  60

    2.7.4训练/测试/验证数据集  60

    2.7.5时间序列验证  61

    2.7.6最佳冠军模型的基准测试  61

    2.7.7专家意见:人与机器  61

    2.7.8元分析  61

    2.7.9飞镖板方法  61

    2.8第六步:部署  62

    2.9参考资料  62

    2.10本章小结  62

    第3章 输入和探索数据  64

    3.1数据输入  64

    3.1.1文本文件输入  65

    3.1.2数据库表格  66

    3.1.3电子表格文件  67

    3.1.4XML和JSON数据  67

    3.1.5生成你自己的数据  68

    3.1.6处理大型文件的技巧  68

    3.1.7数据整理  68

    3.2连接数据  69

    3.2.1使用sqldf函数  69

    3.2.2生成数据  70

    3.2.3检查元数据  71

    3.2.4使用内部连接和外部连接来合并数据  72

    3.2.5识别有多个购买记录的成员  73

    3.2.6清除冗余记录  74

    3.3探索医院数据集  74

    3.3.1str(df)函数的输出  74

    3.3.2View函数的输出  75

    3.3.3colnames函数  75

    3.3.4summary函数  76

    3.3.5在浏览器中打开文件  77

    3.3.6绘制分布图  77

    3.3.7变量的可视化绘图  78

    3.4转置数据帧  80

    3.5缺失值  84

    3.5.1建立缺失值测试数据集  84

    3.5.2缺失值的不同类型  85

    3.5.3纠正缺失值  87

    3.5.4使用替换过的值运行回归  90

    3.6替换分类变量  91

    3.7异常值  91

    3.7.1异常值为什么重要  91

    3.7.2探测异常值  92

    3.8数据转换  96

    3.8.1生成测试数据  97

    3.8.2Box-Cox转换  97

    3.9变量化简/变量重要性  98

    3.9.1主成分分析法  98

    3.9.2全子集回归  102

    3.9.3变量重要性  104

    3.10参考资料  106

    3.11本章小结  106

    第4章 回归算法导论  107

    4.1监督学习模型和无监督学习模型  108

    4.1.1监督学习模型  108

    4.1.2无监督学习模型  108

    4.2回归技术  109

    4.3广义线性模型  110

    4.4逻辑回归  110

    4.4.1比率  111

    4.4.2逻辑回归系数  111

    4.4.3示例:在医疗中使用逻辑回归来预测疼痛阈值  112

    4.4.4GLM模型拟合  114

    4.4.5检验残差项  115

    4.4.6添加变量的分布图  116

    4.4.7p值及其效应量  117

    4.4.8p值及其影响范围  118

    4.4.9变量选择  119

    4.4.10交互  121

    4.4.11拟合优度统计量  123

    4.4.12置信区间和Wald统计  124

    4.4.13基本回归诊断图  124

    4.4.14分布图类型描述  124

    4.4.15拟合优度:Hosmer-Lemeshow检验  126

    4.4.16正则化  127

    4.4.17示例:ElasticNet  128

    4.4.18选择一个正确的Lambda  128

    4.4.19基于Lambda输出可能的系数  129

    4.5本章小结  130

    第5章决策树、聚类和SVM导论  131

    5.1决策树算法  131

    5.1.1决策树的优点  131

    5.1.2决策树的缺点  132

    5.1.3决策树的基本概念  132

    5.1.4扩展树  132

    5.1.5不纯度  133

    5.1.6控制树的增长  134

    5.1.7决策树算法的类型  134

    5.1.8检查目标变量  135

    5.1.9在rpart模型中使用公式符号  135

    5.1.10图的解释  136

    5.1.11输出决策树的文本版本  137

    5.1.12修剪  138

    5.1.13渲染决策树的其他选项  139

    5.2聚类分析  140

    5.2.1聚类分析应用于多种行业  140

    5.2.2什么是聚类  140

    5.2.3聚类的类型  141

    5.2.4k均值聚类算
查看详情
12
相关图书 / 更多
实用预测分析
实用畲族药膳学
作者
实用预测分析
实用网络信息检索(第七版)
葛敬民 著;葛敬民 编
实用预测分析
实用超声诊断技术与临床应用
潘宁主编
实用预测分析
实用英语口语教程
崔玉梅
实用预测分析
实用神经病学
黄如训;彭英
实用预测分析
实用交际汉语4
王功平
实用预测分析
实用组织化学与细胞化学技术
李美香 主编;孙国瑛
实用预测分析
实用篮球运动教程 教学方法及理论 新华正版
崔鲁祥
实用预测分析
实用滚镀技术基础
侯进 编著
实用预测分析
实用心内科疾病诊疗与介入应用
赵广阳
实用预测分析
实用会计英语(第四版)十三五规划
葛军 著
实用预测分析
实用临床医学概论
任成山
您可能感兴趣 / 更多
实用预测分析
孩子,把你的手给我1:怎么说孩子才爱听,怎么教孩子才肯学?帮助每一位3-12岁孩子的父母结束与孩子的所有冲突!
[美]海姆·G.吉诺特
实用预测分析
怎样做成大事
[美]丹·加德纳(Dan Gardner) 著;贾拥民 译;湛庐文化 出品;[丹麦]傅以斌(Bent Flyvbjerg)
实用预测分析
1200年希腊罗马神话
[美]伊迪丝·汉密尔顿
实用预测分析
爱情心理学(新编本)
[美]罗伯特·J. 斯腾伯格 (美)凯琳·斯腾伯格 倪爱萍 译
实用预测分析
黄金圈法则
[美]西蒙·斯涅克 著;磨铁文化 出品
实用预测分析
汤姆·索亚历险记 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]马克 吐温
实用预测分析
富兰克林自传 名家全译本 改变无数人命运的励志传奇 埃隆马斯克反复推荐 赠富兰克林签名照及精美插图
[美]本杰明·富兰克林 著;李自修 译
实用预测分析
意大利文艺复兴新艺术史
[美]迈克尔·韦恩·科尔 著;[美]斯蒂芬·J·坎贝尔;邵亦杨
实用预测分析
汤姆素亚历险记:中小学生课外阅读快乐读书吧 儿童文学无障碍有声伴读世界名著童话故事
[美]马克·吐温
实用预测分析
老人与海 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]海明威
实用预测分析
养育的觉醒:全面激发孩子自驱力,教你如何心平气和做妈妈
[美]凯文·莱曼 著;唐晓璐 译;斯坦威 出品
实用预测分析
国际大奖图画书系列 共11册(小老鼠的恐惧的大书,大灰狼,红豆与菲比,别烦我,下雪了 ,穿靴子的猫 ,先有蛋,绿 ,特别快递,如果你想看鲸鱼 ,一个部落的孩子 ) 麦克米伦世纪
[美]莱恩·史密斯 (英)埃米莉·格雷维特 (美)劳拉·瓦卡罗·等/文 (英)埃米莉·格雷维特 等/图 彭懿 杨玲玲 阿甲 孙慧阳 白薇 译