高等学校计算机科学与技术教材:数据挖掘理论与应用
出版时间:
2008-04
版次:
1
ISBN:
9787811232523
定价:
24.00
装帧:
平装
开本:
16开
纸张:
胶版纸
页数:
248页
正文语种:
简体中文
2人买过
-
《高等学校计算机科学与技术教材·数据挖掘理论与应用》从数据挖掘理论与数据挖掘应用过程两个方面介绍了数据挖掘的最新成果。在理论部分,《高等学校计算机科学与技术教材·数据挖掘理论与应用》介绍了数据挖掘技术所涉及的基本概念、主流技术和最新成果;在应用部分,《高等学校计算机科学与技术教材·数据挖掘理论与应用》结合具体的实例系统论述了商业理解、数据预处理、建模、模型部署等整个数据挖掘流程。
《高等学校计算机科学与技术教材·数据挖掘理论与应用》既可以作为大学本科生和研究生的补充教材,也可以作为企业实施数据挖掘和商务智能的实战指导;既可以作为初次接触数据挖掘技术的入门读物,也可以作为高级研究人员的参考书。 第1章导论
1.1 数据挖掘概述
1.1.1 数据挖掘的背景
1.1.2 数据挖掘的定义
1.1.3 数据挖掘的应用
1.2 数据挖掘的一般过程
1.2.1 数据挖掘中的数据集
1.2.2 数据挖掘的任务
1.2.3 数据挖掘过程
1.3 数据挖掘的一般方法
1.3.1分类预测型方法
1.3.2描述型方法
1.3.3文本/Web挖掘方法
理论篇
第2章分类方法
2.1决策树
2.1.1决策树基本概念
2.1.2决策树构造过程
2.1.3决策树的扩展
2.2前馈神经网络
2.2.1基本概念
2.2.2BP训练过程
2.2.3RBF网络
2.3基于规则的方法
2.3.1AQ算法
2.3.2C45rules
2.3.3RIPPER
2.4支持向量机
2.4.1核函数
2.4.2线性可分模式下的最优超平面
2.4.3线性不可分模式下的最优超平面
2.4.4支持向量机
2.5 贝叶斯分类
2.5.1 贝叶斯理论和极大后验假设
2.5.2 贝叶斯网络和贝叶斯分类器
2.5.3 几种常见的贝叶斯分类器模型
2.5.4 贝叶斯分类器应用举例
2.6 粗糙集方法
2.6.1 粗糙集概念
2.6.2 粗糙集基本算法
2.6.3 粗糙集方法的扩展
2.7其他分类方法
2.7.1回归分析
2.7.2k-最近邻分类方法
2.7.3组合学习方法
第3章 聚类方法
3.1 聚类方法概述
3.1.1 聚类分析中的常见数据类型
3.1.2 对聚类算法的一些典型要求
3.1.3 主要的聚类方法
3.2 划分聚类
3.2.1k-均值算法
3.2.2二分k-均值聚类方法
3.2.3k-中心点算法
3.3层次聚类
3.3.1凝聚的和分裂的层次聚类
3.3.2BIRCH算法
3.3.3CuRE算法
3.3.4ROCK算法
3.3.5Chameleon
3.4基于密度的聚类
3.4.1DBSCAN算法
3.4.2OPTICS算法
3.5Kohonen聚类
3.5.1自组织神经网络
3.5.2Kohonen自组织映射
3.6孤立点分析
3.6.1 基于统计的孤立点检测
3.6.2 基于距离的孤立点检测
3.6.3 基于偏离的孤立点检测方法
3.7概念格
3.7.1 基本概念
3.7.2 概念格的建造
3.7.3 规则提取
第4章关联分析
4.1 基本概念与挖掘过程
4.1.1 基本概念
4.1.2 关联规则挖掘过程
4.2 频繁项集挖掘算法
4.2.1Apriori算法
4.2.2Apriori算法的改进
4.2.3FP_Growth算法
4.3 关联规则生成算法
4.4 频繁闭项集挖掘
4.5 关联规则的扩展
4.5.1 多层次关联规则
4.5.2 多维关联规则
4.5.3 定量关联规则
4.5.4 加权关联规则
4.5.5 序列模式分析
第5章文本与Web挖掘
5.1 文本挖掘
5.1.1 文本预处理
5.1.2 文本检索
5.1.3 文本分类
5.1.4 文本聚类
5.1.5 文本摘要
5.2Web挖掘
5.2.1概述
5.2.2Web内容挖掘
5.2.3Web结构挖掘
5.2.4Web使用挖掘
应用篇
第6章业务理解
6.1 需求分析
6.1.1 需求分析的内容
6.1.2 需求分析的方法
6.1.3 需求分析的结果
6.1.4 需求分析的注意事项
6.2 实例:客户细分项目的需求分析
6.2.1 客户细分项目的内容
6.2.2 分析方法
6.2.3 分析结果
第7章 数据预处理
7.1 数据理解
7.2 数据准备
7.2.1 数据整理与合并
7.2.2 数据抽样
7.2.3 训练集和测试集的划分方法
7.2.4 类标签的确定
7.3 数据描述
7.3.1 单变量描述方法
7.3.2 多变量描述方法
7.4 数据清理
7.4.1 缺值处理
7.4.2 探测异常点与噪声清除
7.5 变量变换与合成
7.5.1 连续变量归一化
7.5.2 离散变量的数值化
7.5.3 连续变量离散化
7.5.4 变量变换
7.5.5 变量合成
7.6 变量选择
7.6.1 概述
7.6.2 包装方法
7.6.3 过滤方法
7.6.4 主成分及因子分析
7.7一些算法对预处理的要求
7.8实例:客户流失项目的数据预处理
7.8.1 数据理解和数据准备
7.8.2 数据描述和清理
7.8.3 数据变换与选择
第8章建模
8.1算法选择
8.2模型参数调整
8.3模型评估和性能比较
8.3.1分类模型的评估方法
8.3.2聚类模型的评估方法
8.4模型导出
8.5实例客户流失项目的建模
8.5.1算法选择
8.5.2参数调整
8.5.3性能评估
8.5.4模型导出
第9章模型部署与维护
9.1模型部署
9.2模型维护
9.3客户流失项目的模型部署与维护
附录A主要数据挖掘软件简介
A1SASEnterpriseMiner
A1.1概述
A1.2数据挖掘过程及模块
A2SPSSClementine
A2.1概述
A2.2数据挖掘过程及模块
A3IBMIntelligentMiner
A3.1概述
A3.2数据挖掘过程及模块
A4其他常见数据挖掘工具
参考文献
-
内容简介:
《高等学校计算机科学与技术教材·数据挖掘理论与应用》从数据挖掘理论与数据挖掘应用过程两个方面介绍了数据挖掘的最新成果。在理论部分,《高等学校计算机科学与技术教材·数据挖掘理论与应用》介绍了数据挖掘技术所涉及的基本概念、主流技术和最新成果;在应用部分,《高等学校计算机科学与技术教材·数据挖掘理论与应用》结合具体的实例系统论述了商业理解、数据预处理、建模、模型部署等整个数据挖掘流程。
《高等学校计算机科学与技术教材·数据挖掘理论与应用》既可以作为大学本科生和研究生的补充教材,也可以作为企业实施数据挖掘和商务智能的实战指导;既可以作为初次接触数据挖掘技术的入门读物,也可以作为高级研究人员的参考书。
-
目录:
第1章导论
1.1 数据挖掘概述
1.1.1 数据挖掘的背景
1.1.2 数据挖掘的定义
1.1.3 数据挖掘的应用
1.2 数据挖掘的一般过程
1.2.1 数据挖掘中的数据集
1.2.2 数据挖掘的任务
1.2.3 数据挖掘过程
1.3 数据挖掘的一般方法
1.3.1分类预测型方法
1.3.2描述型方法
1.3.3文本/Web挖掘方法
理论篇
第2章分类方法
2.1决策树
2.1.1决策树基本概念
2.1.2决策树构造过程
2.1.3决策树的扩展
2.2前馈神经网络
2.2.1基本概念
2.2.2BP训练过程
2.2.3RBF网络
2.3基于规则的方法
2.3.1AQ算法
2.3.2C45rules
2.3.3RIPPER
2.4支持向量机
2.4.1核函数
2.4.2线性可分模式下的最优超平面
2.4.3线性不可分模式下的最优超平面
2.4.4支持向量机
2.5 贝叶斯分类
2.5.1 贝叶斯理论和极大后验假设
2.5.2 贝叶斯网络和贝叶斯分类器
2.5.3 几种常见的贝叶斯分类器模型
2.5.4 贝叶斯分类器应用举例
2.6 粗糙集方法
2.6.1 粗糙集概念
2.6.2 粗糙集基本算法
2.6.3 粗糙集方法的扩展
2.7其他分类方法
2.7.1回归分析
2.7.2k-最近邻分类方法
2.7.3组合学习方法
第3章 聚类方法
3.1 聚类方法概述
3.1.1 聚类分析中的常见数据类型
3.1.2 对聚类算法的一些典型要求
3.1.3 主要的聚类方法
3.2 划分聚类
3.2.1k-均值算法
3.2.2二分k-均值聚类方法
3.2.3k-中心点算法
3.3层次聚类
3.3.1凝聚的和分裂的层次聚类
3.3.2BIRCH算法
3.3.3CuRE算法
3.3.4ROCK算法
3.3.5Chameleon
3.4基于密度的聚类
3.4.1DBSCAN算法
3.4.2OPTICS算法
3.5Kohonen聚类
3.5.1自组织神经网络
3.5.2Kohonen自组织映射
3.6孤立点分析
3.6.1 基于统计的孤立点检测
3.6.2 基于距离的孤立点检测
3.6.3 基于偏离的孤立点检测方法
3.7概念格
3.7.1 基本概念
3.7.2 概念格的建造
3.7.3 规则提取
第4章关联分析
4.1 基本概念与挖掘过程
4.1.1 基本概念
4.1.2 关联规则挖掘过程
4.2 频繁项集挖掘算法
4.2.1Apriori算法
4.2.2Apriori算法的改进
4.2.3FP_Growth算法
4.3 关联规则生成算法
4.4 频繁闭项集挖掘
4.5 关联规则的扩展
4.5.1 多层次关联规则
4.5.2 多维关联规则
4.5.3 定量关联规则
4.5.4 加权关联规则
4.5.5 序列模式分析
第5章文本与Web挖掘
5.1 文本挖掘
5.1.1 文本预处理
5.1.2 文本检索
5.1.3 文本分类
5.1.4 文本聚类
5.1.5 文本摘要
5.2Web挖掘
5.2.1概述
5.2.2Web内容挖掘
5.2.3Web结构挖掘
5.2.4Web使用挖掘
应用篇
第6章业务理解
6.1 需求分析
6.1.1 需求分析的内容
6.1.2 需求分析的方法
6.1.3 需求分析的结果
6.1.4 需求分析的注意事项
6.2 实例:客户细分项目的需求分析
6.2.1 客户细分项目的内容
6.2.2 分析方法
6.2.3 分析结果
第7章 数据预处理
7.1 数据理解
7.2 数据准备
7.2.1 数据整理与合并
7.2.2 数据抽样
7.2.3 训练集和测试集的划分方法
7.2.4 类标签的确定
7.3 数据描述
7.3.1 单变量描述方法
7.3.2 多变量描述方法
7.4 数据清理
7.4.1 缺值处理
7.4.2 探测异常点与噪声清除
7.5 变量变换与合成
7.5.1 连续变量归一化
7.5.2 离散变量的数值化
7.5.3 连续变量离散化
7.5.4 变量变换
7.5.5 变量合成
7.6 变量选择
7.6.1 概述
7.6.2 包装方法
7.6.3 过滤方法
7.6.4 主成分及因子分析
7.7一些算法对预处理的要求
7.8实例:客户流失项目的数据预处理
7.8.1 数据理解和数据准备
7.8.2 数据描述和清理
7.8.3 数据变换与选择
第8章建模
8.1算法选择
8.2模型参数调整
8.3模型评估和性能比较
8.3.1分类模型的评估方法
8.3.2聚类模型的评估方法
8.4模型导出
8.5实例客户流失项目的建模
8.5.1算法选择
8.5.2参数调整
8.5.3性能评估
8.5.4模型导出
第9章模型部署与维护
9.1模型部署
9.2模型维护
9.3客户流失项目的模型部署与维护
附录A主要数据挖掘软件简介
A1SASEnterpriseMiner
A1.1概述
A1.2数据挖掘过程及模块
A2SPSSClementine
A2.1概述
A2.2数据挖掘过程及模块
A3IBMIntelligentMiner
A3.1概述
A3.2数据挖掘过程及模块
A4其他常见数据挖掘工具
参考文献
查看详情
-
八五品
北京市海淀区
平均发货9小时
成功完成率91.98%
-
2008-04 印刷
印次: 1
九品
河南省商丘市
平均发货8小时
成功完成率97.33%
-
九五品
北京市朝阳区
平均发货28小时
成功完成率85.63%
-
九品
江苏省南京市
平均发货13小时
成功完成率95.01%
-
2008-04 印刷
印次: 1
八五品
河南省濮阳市
平均发货13小时
成功完成率97.24%
-
九品
北京市海淀区
平均发货9小时
成功完成率91.98%
-
九品
北京市海淀区
平均发货9小时
成功完成率75.41%
-
九品
陕西省西安市
平均发货10小时
成功完成率96.03%
-
六品
-
九品
安徽省安庆市
平均发货11小时
成功完成率94.62%
-
八五品
河北省保定市
平均发货15小时
成功完成率91.8%