数据挖掘与应用/北京大学光华管理学院教材
出版时间:
2009-06
版次:
1
ISBN:
9787301152393
定价:
22.00
装帧:
平装
开本:
16开
纸张:
胶版纸
页数:
185页
字数:
220千字
正文语种:
简体中文
48人买过
-
《数据挖掘与应用》全面地介绍了数据挖掘的相关主题.包括数据理解与数据准备、关联规则挖掘、多元统计中的降维方法、聚类分析、神经网络、决策树方法、模型评估等内容。全书体系完整,文字精炼,注重对数据挖掘方法的直觉理解及其应用:同时,保持了一定的严谨性,为学生理解和运用这些方法提供了坚实的基础。
《数据挖掘与应用》实例丰富,并附有相应SAS程序,以便于学生尽快理解相关内容并用以解决实际问题。
《数据挖掘与应用》配有教辅,可以免费提供给任课教师使用。如需要,欢迎填写书后的“教师反馈及课件申请表’索取。 张俊妮,美国哈佛大学统计学博士,现为北京大学光华管理学院商务统计及经济计量系副教授。研究领域包括因果推断、贝叶斯分析、蒙特卡洛方法、数据挖掘。在JournalofAmericanStatisticalAssociation、StatisticaSinica、JournalofEducationalandBehavioralStatistics、《经济学(季刊)》、《数理统计与管理》、《管理世界》等期刊上发表论文十余篇。 第一章数据挖掘概述
1.1什么是数据挖掘
1.2数据挖掘的应用
1.3数据挖掘方法论
第二章数据理解和数据准备
2.1数据理解
2.2数据准备
2.3使用SAS进行数据理解和数据准备:FNBA信用卡数据
第三章关联规则挖掘
3.1关联规则的实际意义
3.2关联规则的基本概念及Apriori算法
3.3负关联规则
3.4序列关联规则
3.5使用SAS进行关联规则挖掘
第四章多元统计中的降维方法
4.1主成分分析
4.2探索性因子分析
4.3多维标度分析
第五章聚类分析
5.1距离与相似度的度量
5.2k均值聚类法
5.3层次聚类法
第六章预测性建模的一些基本方法
6.1判别分析
6.2朴素贝叶斯分类算法
6.3k近邻法
6.4线性模型与广义线性模型
第七章神经网络
7.1神经网络架构及基本组成
7.2误差函数
7.3神经网络训练算法
7.4提高神经网络模型的可推广性
7.5数据预处理
7.6使用SAS建立神经网络模型
7.7自组织图
第八章决策树
8.1决策树简介
8.2决策树的生长与修剪
8.3对缺失数据的处理
8.4变量选择
8.5决策树的优缺点
第九章模型评估
9.1因变量为二分变量的情形
9.2因变量为多分变量的情形
9.3因变量为连续变量的情形
9.4使用SAS评估模型
第十章模型组合与两阶段模型
10.1模型组合
10.2随机森林
10.3两阶段模型
参考文献
-
内容简介:
《数据挖掘与应用》全面地介绍了数据挖掘的相关主题.包括数据理解与数据准备、关联规则挖掘、多元统计中的降维方法、聚类分析、神经网络、决策树方法、模型评估等内容。全书体系完整,文字精炼,注重对数据挖掘方法的直觉理解及其应用:同时,保持了一定的严谨性,为学生理解和运用这些方法提供了坚实的基础。
《数据挖掘与应用》实例丰富,并附有相应SAS程序,以便于学生尽快理解相关内容并用以解决实际问题。
《数据挖掘与应用》配有教辅,可以免费提供给任课教师使用。如需要,欢迎填写书后的“教师反馈及课件申请表’索取。
-
作者简介:
张俊妮,美国哈佛大学统计学博士,现为北京大学光华管理学院商务统计及经济计量系副教授。研究领域包括因果推断、贝叶斯分析、蒙特卡洛方法、数据挖掘。在JournalofAmericanStatisticalAssociation、StatisticaSinica、JournalofEducationalandBehavioralStatistics、《经济学(季刊)》、《数理统计与管理》、《管理世界》等期刊上发表论文十余篇。
-
目录:
第一章数据挖掘概述
1.1什么是数据挖掘
1.2数据挖掘的应用
1.3数据挖掘方法论
第二章数据理解和数据准备
2.1数据理解
2.2数据准备
2.3使用SAS进行数据理解和数据准备:FNBA信用卡数据
第三章关联规则挖掘
3.1关联规则的实际意义
3.2关联规则的基本概念及Apriori算法
3.3负关联规则
3.4序列关联规则
3.5使用SAS进行关联规则挖掘
第四章多元统计中的降维方法
4.1主成分分析
4.2探索性因子分析
4.3多维标度分析
第五章聚类分析
5.1距离与相似度的度量
5.2k均值聚类法
5.3层次聚类法
第六章预测性建模的一些基本方法
6.1判别分析
6.2朴素贝叶斯分类算法
6.3k近邻法
6.4线性模型与广义线性模型
第七章神经网络
7.1神经网络架构及基本组成
7.2误差函数
7.3神经网络训练算法
7.4提高神经网络模型的可推广性
7.5数据预处理
7.6使用SAS建立神经网络模型
7.7自组织图
第八章决策树
8.1决策树简介
8.2决策树的生长与修剪
8.3对缺失数据的处理
8.4变量选择
8.5决策树的优缺点
第九章模型评估
9.1因变量为二分变量的情形
9.2因变量为多分变量的情形
9.3因变量为连续变量的情形
9.4使用SAS评估模型
第十章模型组合与两阶段模型
10.1模型组合
10.2随机森林
10.3两阶段模型
参考文献
查看详情
-
八五品
重庆市沙坪坝区
平均发货15小时
成功完成率90.19%
-
八五品
重庆市沙坪坝区
平均发货11小时
成功完成率84.85%
-
八五品
山东省枣庄市
平均发货9小时
成功完成率88.23%
-
八五品
江西省南昌市
平均发货11小时
成功完成率92.05%
-
八五品
四川省成都市
平均发货12小时
成功完成率91.5%
-
九品
山东省济南市
平均发货3小时
成功完成率97.99%
-
九品
北京市海淀区
平均发货10小时
成功完成率90.18%
-
八五品
湖北省武汉市
平均发货7小时
成功完成率96.08%
-
九品
北京市通州区
平均发货10小时
成功完成率92.81%
-
八五品
广东省广州市
平均发货24小时
成功完成率94.95%
-
八五品
北京市昌平区
平均发货21小时
成功完成率94.55%
-
九五品
北京市东城区
平均发货27小时
成功完成率85.2%
-
九五品
四川省成都市
平均发货30小时
成功完成率84.23%
-
九五品
河北省衡水市
平均发货24小时
成功完成率85.81%
-
2014-08 印刷
印次: 2
九品
北京市昌平区
平均发货20小时
成功完成率97.18%
-
八五品
江西省南昌市
平均发货15小时
成功完成率96.85%
-
2014-08 印刷
印次: 2
九品
北京市昌平区
平均发货20小时
成功完成率97.18%
-
九品
北京市海淀区
平均发货24小时
成功完成率86.87%
-
八五品
北京市海淀区
平均发货5小时
成功完成率96.6%