数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术

数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2016-07
版次: 1
ISBN: 9787302434122
定价: 54.90
装帧: 平装
开本: 16开
  •   本书较详细地介绍了数据仓库和数据挖掘的原理、方法及应用技术。全书共有14章,分为4篇。第1章为绪论篇,介绍数据仓库与数据挖掘的基本概念及其相互关系;第2~6章为数据仓库原理及应用篇,主要介绍数据仓库的概念模型、逻辑模型和物理模型,以及数据仓库的规划、设计、实施和OLAP应用等;第7~10章为传统数据挖掘原理及算法篇,介绍数据的属性类型与相似性度量、关联规则挖掘、分类规则挖掘、聚类分析和离群点挖掘算法等;第11~14章为数据挖掘创新篇,主要内容取自编者近年指导研究生发表的学术论文,并根据教学需要进行适当补充修改而成,包括混合属性数据、数据流和不确定数据的聚类分析,以及量子遗传聚类算法等。本书可作为普通高等院校计算机专业与IT相关专业高年级本科生和研究生的教材,也可作为经济管理类专业同名课程的教材和参考书,还可作为电子商务、金融保险等行业数据管理与数据分析人员的培训教材或自学参考书。
    第1章绪论
    1.1数据仓库概述
    1.1.1从传统数据库到数据仓库
    1.1.2数据仓库的4个特征
    1.1.3数据仓库系统
    1.1.4数据仓库系统体系结构
    1.1.5数据仓库数据的粒度与组织
    1.2数据挖掘概述
    1.2.1数据挖掘产生的背景
    1.2.2数据挖掘与知识发现
    1.2.3数据挖掘的数据来源
    1.2.4数据挖掘的任务
    1.2.5数据挖掘的步骤
    1.2.6数据挖掘的应用
    1.3数据仓库与数据挖掘
    1.3.1数据仓库与数据挖掘的区别
    1.3.2数据仓库与数据挖掘的关系
    1.4教程章节组织与学时建议
    习题1
    第2章数据仓库原理
    2.1多数据源问题
    2.2数据预处理
    2.2.1数据清洗
    2.2.2数据变换
    2.2.3数据归约
    2.3ER模型
    2.4数据仓库的概念模型
    2.4.1多维数据模型
    2.4.2维度与粒度
    2.5数据仓库的逻辑模型
    2.5.1多维数据库系统
    2.5.2星形模型
    2.5.3雪花模型
    2.6数据仓库的物理模型
    2.6.1位图索引模型
    2.6.2广义索引模型
    2.6.3连接索引模型
    2.6.4RAID存储结构
    习题2
    第3章数据仓库的设计开发应用
    3.1数据仓库设计的特点
    3.2数据仓库系统开发过程
    3.3数据仓库系统的规划
    3.4数据仓库的设计
    3.4.1需求分析
    3.4.2概念设计
    3.4.3逻辑设计
    3.4.4物理设计
    3.5数据仓库的实施
    3.5.1数据仓库的创建
    3.5.2数据的抽取、转换和加载
    3.6数据仓库系统的开发
    3.6.1开发任务
    3.6.2开发方法
    3.6.3系统测试
    3.7数据仓库系统的应用
    3.7.1用户培训
    3.7.2决策支持
    3.7.3维护评估
    习题3
    第4章警务数据仓库的实现
    4.1SQL Server 2008 R2
    4.1.1SQL Server的服务功能
    4.1.2SQL Server Management Studio
    4.1.3Microsoft Visual Studio
    4.2创建集成服务项目与SSIS包
    4.3配置“旅馆_ETL”数据流任务
    4.3.1创建“旅馆_ETL”对象
    4.3.2配置“旅馆_ETL”参数
    4.4配置“人员_ETL”数据流任务
    4.4.1创建“人员_ETL”对象
    4.4.2配置“人员_ETL”参数
    4.5配置“时间_ETL”数据流任务
    4.5.1创建“时间_ETL”对象
    4.5.2配置“时间_ETL”参数
    4.6配置“入住_ETL”数据流任务
    4.6.1创建“入住_ETL”对象
    4.6.2配置“入住_ETL”参数
    4.7部署前面配置的SSIS包
    4.7.1将包另存到SSIS服务器
    4.7.2创建作业代理
    习题4
    第5章联机分析处理技术
    5.1OLAP概述
    5.1.1OLAP的定义
    5.1.2OLAP的12条准则
    5.1.3OLAP的简要准则
    5.1.4OLAP系统的基本结构
    5.2OLAP的多维分析操作
    5.2.1切片
    5.2.2切块
    5.2.3旋转
    5.2.4钻取
    5.3OLAP系统的分类
    5.3.1多维OLAP
    5.3.2关系OLAP
    5.3.3MOLAP与ROLAP的比较
    5.3.4混合OLAP
    5.4OLAP、DW与DM的关系
    5.4.1OLAP、DW与DM的联系
    5.4.2OLAP、DW与DM的区别
    5.4.3OLAP与DW的关系
    5.4.4OLAP与DM的关系
    5.5DOLAM决策支持系统方案
    习题5
    第6章警务数据仓库的OLAP应用
    6.1创建分析服务项目
    6.1.1进入商业智能开发平台
    6.1.2创建分析服务项目
    6.2配置项目的数据源
    6.3构建数据源视图
    6.4创建多维数据集
    6.5配置维的层次结构
    6.5.1配置日期维的层次
    6.5.2配置地址维的层次
    6.5.3配置人员维的层次
    6.5.4配置旅馆维的层次
    6.6添加人口来源地址维
    6.7分析服务项目的部署
    6.8浏览多维数据集
    习题6
    第7章数据的属性与相似性
    7.1数据集的结构
    7.1.1二维表
    7.1.2数据矩阵
    7.2属性的类型
    7.2.1连续属性
    7.2.2离散属性
    7.2.3分类属性
    7.2.4二元属性
    7.2.5序数属性
    7.2.6数值属性
    7.3相似度与相异度
    7.3.1数值属性的距离
    7.3.2分类属性的相似度
    7.3.3余弦相似度
    7.3.4混合属性的相异度
    习题7
    第8章关联规则挖掘
    8.1关联规则的概念
    8.1.1基本概念
    8.1.2项集的性质
    8.2关联规则的Apriori算法
    8.2.1发现频繁项集
    8.2.2产生关联规则
    8.3FP增长算法
    8.3.1算法的背景
    8.3.2构造FP树
    8.3.3生成频繁项集
    8.4关联规则的评价
    8.4.1支持度和置信度的不足
    8.4.2相关性分析
    8.5序列模式发现算法
    8.5.1序列模式的概念
    8.5.2类Apriori算法
    8.6关联规则其他算法
    8.6.1频繁项集算法优化
    8.6.2CLOSE算法
    8.6.3时态关联规则
    8.6.4含负项的关联规则
    习题8
    第9章分类规则挖掘
    9.1分类问题概述
    9.2k最近邻分类法
    9.3决策树分类方法
    9.3.1决策树生成框架
    9.3.2ID3分类方法
    9.3.3决策树的剪枝
    9.3.4C4.5算法
    9.4贝叶斯分类方法
    9.4.1贝叶斯定理
    9.4.2朴素贝叶斯分类器
    9.4.3朴素贝叶斯分类方法的改进
    9.5其他分类方法
    习题9
    第10章聚类分析方法
    10.1聚类分析原理
    10.1.1聚类分析概述
    10.1.2聚类的数学定义
    10.1.3簇的常见类型
    10.1.4聚类框架及性能要求
    10.1.5簇的距离
    10.2划分聚类算法
    10.2.1划分聚类框架
    10.2.2划分聚类的质量
    10.2.3kmeans算法
    10.2.4空簇与离群点
    10.2.5k中心点算法
    10.3层次聚类方法
    10.3.1层次聚类策略
    10.3.2AGNES算法
    10.3.3DIANA算法
    10.4密度聚类方法
    10.4.1基本概念
    10.4.2算法描述
    10.4.3计算实例
    10.4.4算法的性能分析
    10.5聚类的质量评价
    10.5.1簇的数目估计
    10.5.2外部质量评价
    10.5.3内部质量评价
    10.6离群点挖掘
    10.6.1相关问题概述
    10.6.2基于距离的方法
    10.6.3基于相对密度的方法
    10.7其他聚类方法
    习题10
    第11章混合属性数据的聚类分析
    11.1混合属性数据集聚类
    11.1.1混合属性数据普遍存在
    11.1.2kprototypes算法
    11.1.3kprototypes算法的不足
    11.2改进的kprototypes算法
    11.2.1加权频率最大原型
    11.2.2离散属性的频率相异度
    11.2.3改进的kprototypes算法
    11.3强连通聚类融合算法
    11.3.1聚类融合方法
    11.3.2强连通聚类融合
    11.3.3聚类融合优化算法
    习题11
    第12章数据流挖掘与聚类分析
    12.1数据流挖掘的概念
    12.1.1数据流的定义
    12.1.2数据流挖掘的任务
    12.2数据流处理技术
    12.2.1概要数据结构
    12.2.2时间倾斜技术
    12.2.3数据流聚类的要求
    12.2.4数据流聚类的一般步骤
    12.3两层数据流聚类框架
    12.4三层数据流聚类框架
    12.5最优2k近邻聚类算法
    12.5.1算法设计动因
    12.5.2定义2k最近邻集
    12.5.3在线2k最近邻集生成
    12.5.4最优2k近邻集算法
    12.5.5最优2k近邻聚类算法
    12.5.6实例计算结果
    习题12
    第13章不确定数据的聚类分析
    13.1不确定数据挖掘概述
    13.1.1不确定数据的产生
    13.1.2不确定数据的种类
    13.1.3不确定数据的聚类
    13.2基于相对密度的不确定数据聚类算法
    13.2.1基于相对密度的聚类思想
    13.2.2不确定相异度与k最近邻集
    13.2.3不确定k最近邻密度
    13.2.4RDBCAU算法描述
    13.2.5计算实例
    13.3不确定分类属性数据聚类算法
    13.3.1传统分类属性相似度
    13.3.2分类属性加权相似度
    13.3.3分类属性双重加权相似度
    13.3.4不确定分类属性双重加权相似度
    13.3.5基于连通分支的不确定分类属性聚类算法
    习题13
    第14章量子计算与量子遗传聚类算法
    14.1量子计算与数据挖掘
    14.1.1量子计算的诞生
    14.1.2量子计算研究
    14.1.3量子数据挖掘算法
    14.2量子计算原理
    14.2.1量子态与量子比特
    14.2.2量子门与基本运算
    14.2.3量子纠缠特性
    14.3经典量子算法
    14.3.1量子傅里叶变换
    14.3.2Shor因子分解算法
    14.3.3Grover算法
    14.4基于3D角度编码的量子遗传算法
    14.4.1量子遗传算法
    14.4.2量子3D角度编码
    14.4.3解空间的映射
    14.4.4量子染色体更新
    14.4.5量子位的变异
    14.4.6QGAB3DC算法
    14.5量子遗传聚类算法
    14.5.1属性值q分位数与极差
    14.5.2基于极差的广义加权距离
    14.5.3量子遗传聚类算法
    习题14
    参考文献

  • 内容简介:
      本书较详细地介绍了数据仓库和数据挖掘的原理、方法及应用技术。全书共有14章,分为4篇。第1章为绪论篇,介绍数据仓库与数据挖掘的基本概念及其相互关系;第2~6章为数据仓库原理及应用篇,主要介绍数据仓库的概念模型、逻辑模型和物理模型,以及数据仓库的规划、设计、实施和OLAP应用等;第7~10章为传统数据挖掘原理及算法篇,介绍数据的属性类型与相似性度量、关联规则挖掘、分类规则挖掘、聚类分析和离群点挖掘算法等;第11~14章为数据挖掘创新篇,主要内容取自编者近年指导研究生发表的学术论文,并根据教学需要进行适当补充修改而成,包括混合属性数据、数据流和不确定数据的聚类分析,以及量子遗传聚类算法等。本书可作为普通高等院校计算机专业与IT相关专业高年级本科生和研究生的教材,也可作为经济管理类专业同名课程的教材和参考书,还可作为电子商务、金融保险等行业数据管理与数据分析人员的培训教材或自学参考书。
  • 目录:
    第1章绪论
    1.1数据仓库概述
    1.1.1从传统数据库到数据仓库
    1.1.2数据仓库的4个特征
    1.1.3数据仓库系统
    1.1.4数据仓库系统体系结构
    1.1.5数据仓库数据的粒度与组织
    1.2数据挖掘概述
    1.2.1数据挖掘产生的背景
    1.2.2数据挖掘与知识发现
    1.2.3数据挖掘的数据来源
    1.2.4数据挖掘的任务
    1.2.5数据挖掘的步骤
    1.2.6数据挖掘的应用
    1.3数据仓库与数据挖掘
    1.3.1数据仓库与数据挖掘的区别
    1.3.2数据仓库与数据挖掘的关系
    1.4教程章节组织与学时建议
    习题1
    第2章数据仓库原理
    2.1多数据源问题
    2.2数据预处理
    2.2.1数据清洗
    2.2.2数据变换
    2.2.3数据归约
    2.3ER模型
    2.4数据仓库的概念模型
    2.4.1多维数据模型
    2.4.2维度与粒度
    2.5数据仓库的逻辑模型
    2.5.1多维数据库系统
    2.5.2星形模型
    2.5.3雪花模型
    2.6数据仓库的物理模型
    2.6.1位图索引模型
    2.6.2广义索引模型
    2.6.3连接索引模型
    2.6.4RAID存储结构
    习题2
    第3章数据仓库的设计开发应用
    3.1数据仓库设计的特点
    3.2数据仓库系统开发过程
    3.3数据仓库系统的规划
    3.4数据仓库的设计
    3.4.1需求分析
    3.4.2概念设计
    3.4.3逻辑设计
    3.4.4物理设计
    3.5数据仓库的实施
    3.5.1数据仓库的创建
    3.5.2数据的抽取、转换和加载
    3.6数据仓库系统的开发
    3.6.1开发任务
    3.6.2开发方法
    3.6.3系统测试
    3.7数据仓库系统的应用
    3.7.1用户培训
    3.7.2决策支持
    3.7.3维护评估
    习题3
    第4章警务数据仓库的实现
    4.1SQL Server 2008 R2
    4.1.1SQL Server的服务功能
    4.1.2SQL Server Management Studio
    4.1.3Microsoft Visual Studio
    4.2创建集成服务项目与SSIS包
    4.3配置“旅馆_ETL”数据流任务
    4.3.1创建“旅馆_ETL”对象
    4.3.2配置“旅馆_ETL”参数
    4.4配置“人员_ETL”数据流任务
    4.4.1创建“人员_ETL”对象
    4.4.2配置“人员_ETL”参数
    4.5配置“时间_ETL”数据流任务
    4.5.1创建“时间_ETL”对象
    4.5.2配置“时间_ETL”参数
    4.6配置“入住_ETL”数据流任务
    4.6.1创建“入住_ETL”对象
    4.6.2配置“入住_ETL”参数
    4.7部署前面配置的SSIS包
    4.7.1将包另存到SSIS服务器
    4.7.2创建作业代理
    习题4
    第5章联机分析处理技术
    5.1OLAP概述
    5.1.1OLAP的定义
    5.1.2OLAP的12条准则
    5.1.3OLAP的简要准则
    5.1.4OLAP系统的基本结构
    5.2OLAP的多维分析操作
    5.2.1切片
    5.2.2切块
    5.2.3旋转
    5.2.4钻取
    5.3OLAP系统的分类
    5.3.1多维OLAP
    5.3.2关系OLAP
    5.3.3MOLAP与ROLAP的比较
    5.3.4混合OLAP
    5.4OLAP、DW与DM的关系
    5.4.1OLAP、DW与DM的联系
    5.4.2OLAP、DW与DM的区别
    5.4.3OLAP与DW的关系
    5.4.4OLAP与DM的关系
    5.5DOLAM决策支持系统方案
    习题5
    第6章警务数据仓库的OLAP应用
    6.1创建分析服务项目
    6.1.1进入商业智能开发平台
    6.1.2创建分析服务项目
    6.2配置项目的数据源
    6.3构建数据源视图
    6.4创建多维数据集
    6.5配置维的层次结构
    6.5.1配置日期维的层次
    6.5.2配置地址维的层次
    6.5.3配置人员维的层次
    6.5.4配置旅馆维的层次
    6.6添加人口来源地址维
    6.7分析服务项目的部署
    6.8浏览多维数据集
    习题6
    第7章数据的属性与相似性
    7.1数据集的结构
    7.1.1二维表
    7.1.2数据矩阵
    7.2属性的类型
    7.2.1连续属性
    7.2.2离散属性
    7.2.3分类属性
    7.2.4二元属性
    7.2.5序数属性
    7.2.6数值属性
    7.3相似度与相异度
    7.3.1数值属性的距离
    7.3.2分类属性的相似度
    7.3.3余弦相似度
    7.3.4混合属性的相异度
    习题7
    第8章关联规则挖掘
    8.1关联规则的概念
    8.1.1基本概念
    8.1.2项集的性质
    8.2关联规则的Apriori算法
    8.2.1发现频繁项集
    8.2.2产生关联规则
    8.3FP增长算法
    8.3.1算法的背景
    8.3.2构造FP树
    8.3.3生成频繁项集
    8.4关联规则的评价
    8.4.1支持度和置信度的不足
    8.4.2相关性分析
    8.5序列模式发现算法
    8.5.1序列模式的概念
    8.5.2类Apriori算法
    8.6关联规则其他算法
    8.6.1频繁项集算法优化
    8.6.2CLOSE算法
    8.6.3时态关联规则
    8.6.4含负项的关联规则
    习题8
    第9章分类规则挖掘
    9.1分类问题概述
    9.2k最近邻分类法
    9.3决策树分类方法
    9.3.1决策树生成框架
    9.3.2ID3分类方法
    9.3.3决策树的剪枝
    9.3.4C4.5算法
    9.4贝叶斯分类方法
    9.4.1贝叶斯定理
    9.4.2朴素贝叶斯分类器
    9.4.3朴素贝叶斯分类方法的改进
    9.5其他分类方法
    习题9
    第10章聚类分析方法
    10.1聚类分析原理
    10.1.1聚类分析概述
    10.1.2聚类的数学定义
    10.1.3簇的常见类型
    10.1.4聚类框架及性能要求
    10.1.5簇的距离
    10.2划分聚类算法
    10.2.1划分聚类框架
    10.2.2划分聚类的质量
    10.2.3kmeans算法
    10.2.4空簇与离群点
    10.2.5k中心点算法
    10.3层次聚类方法
    10.3.1层次聚类策略
    10.3.2AGNES算法
    10.3.3DIANA算法
    10.4密度聚类方法
    10.4.1基本概念
    10.4.2算法描述
    10.4.3计算实例
    10.4.4算法的性能分析
    10.5聚类的质量评价
    10.5.1簇的数目估计
    10.5.2外部质量评价
    10.5.3内部质量评价
    10.6离群点挖掘
    10.6.1相关问题概述
    10.6.2基于距离的方法
    10.6.3基于相对密度的方法
    10.7其他聚类方法
    习题10
    第11章混合属性数据的聚类分析
    11.1混合属性数据集聚类
    11.1.1混合属性数据普遍存在
    11.1.2kprototypes算法
    11.1.3kprototypes算法的不足
    11.2改进的kprototypes算法
    11.2.1加权频率最大原型
    11.2.2离散属性的频率相异度
    11.2.3改进的kprototypes算法
    11.3强连通聚类融合算法
    11.3.1聚类融合方法
    11.3.2强连通聚类融合
    11.3.3聚类融合优化算法
    习题11
    第12章数据流挖掘与聚类分析
    12.1数据流挖掘的概念
    12.1.1数据流的定义
    12.1.2数据流挖掘的任务
    12.2数据流处理技术
    12.2.1概要数据结构
    12.2.2时间倾斜技术
    12.2.3数据流聚类的要求
    12.2.4数据流聚类的一般步骤
    12.3两层数据流聚类框架
    12.4三层数据流聚类框架
    12.5最优2k近邻聚类算法
    12.5.1算法设计动因
    12.5.2定义2k最近邻集
    12.5.3在线2k最近邻集生成
    12.5.4最优2k近邻集算法
    12.5.5最优2k近邻聚类算法
    12.5.6实例计算结果
    习题12
    第13章不确定数据的聚类分析
    13.1不确定数据挖掘概述
    13.1.1不确定数据的产生
    13.1.2不确定数据的种类
    13.1.3不确定数据的聚类
    13.2基于相对密度的不确定数据聚类算法
    13.2.1基于相对密度的聚类思想
    13.2.2不确定相异度与k最近邻集
    13.2.3不确定k最近邻密度
    13.2.4RDBCAU算法描述
    13.2.5计算实例
    13.3不确定分类属性数据聚类算法
    13.3.1传统分类属性相似度
    13.3.2分类属性加权相似度
    13.3.3分类属性双重加权相似度
    13.3.4不确定分类属性双重加权相似度
    13.3.5基于连通分支的不确定分类属性聚类算法
    习题13
    第14章量子计算与量子遗传聚类算法
    14.1量子计算与数据挖掘
    14.1.1量子计算的诞生
    14.1.2量子计算研究
    14.1.3量子数据挖掘算法
    14.2量子计算原理
    14.2.1量子态与量子比特
    14.2.2量子门与基本运算
    14.2.3量子纠缠特性
    14.3经典量子算法
    14.3.1量子傅里叶变换
    14.3.2Shor因子分解算法
    14.3.3Grover算法
    14.4基于3D角度编码的量子遗传算法
    14.4.1量子遗传算法
    14.4.2量子3D角度编码
    14.4.3解空间的映射
    14.4.4量子染色体更新
    14.4.5量子位的变异
    14.4.6QGAB3DC算法
    14.5量子遗传聚类算法
    14.5.1属性值q分位数与极差
    14.5.2基于极差的广义加权距离
    14.5.3量子遗传聚类算法
    习题14
    参考文献

查看详情
相关图书 / 更多
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据中心经营之道 唐汝林 等
唐汝林 等
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据管理十讲 袁野 崔斌 李战怀 等
袁野 崔斌 李战怀 等
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据要素教程
杨东 白银 著
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据确权的理论基础探索
彭诚信、史晓宇 著
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据经济学
赵昌文,戎珂
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据挖掘竞赛实战:方法与案例
许可乐
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据要素估值
刘赛红、吕颖毅、王连军
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据驱动的物流选址与调度模型及其实践
木仁 徐志强
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据存储架构与技术(第2版)
舒继武
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据定价策略与优化研究
喻海飞
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据与人工智能驱动型公司:用数据和人工智能升级企业
(西) 理查德·本杰明(Richard Benjamins)
数据仓库与数据挖掘教程/21世纪高等学校规划教材·计算机科学与技术
数据库管理系统原理与实现
杜小勇、陈红、卢卫