统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)

统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: ,
2014-01
版次: 2
ISBN: 9787121222030
定价: 39.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 268页
正文语种: 简体中文
72人买过
  •   数据挖掘是当前数据分析领域中最活跃、最前沿的地带。《统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)》以数据挖掘的实践过程为主线,通过生动的应用案例,从数据挖掘实施角度,系统介绍了经典的数据挖掘方法和利用SPSSModeler实现数据挖掘的全部过程,讲解方法从易到难,说明问题从浅至深。《统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)》力求以最通俗的方式阐述数据挖掘方法的核心思想与基本原理,同时配合SPSSModeler软件操作的说明,希望读者能够直观了解方法本质,尽快掌握SPSSModeler软件使用,并应用到数据挖掘实践中。书中所有数据和案例与华信教育资源网上数据资料内容一致。 薛薇,中国人民大学应用统计科学研究中心副主任 第1章数据挖掘和Clementine概述
    1.1数据挖掘的产生背景
    1.1.1海量数据的分析需求催生数据挖掘
    1.1.2应用对理论的挑战催生数据挖掘
    1.2什么是数据挖掘
    1.2.1数据挖掘的概念
    1.2.2数据挖掘能做什么
    1.2.3数据挖掘得到的知识形式
    1.2.4数据挖掘的算法分类
    1.3Clementine软件概述
    1.3.1Clementine的窗口
    1.3.2数据流的基本管理和执行
    1.3.3数据流的其他管理
    1.3.4从一个示例看Clementine的使用

    第2章Clementine数据的读入
    2.1变量的类型
    2.1.1从数据挖掘角度看变量类型
    2.1.2从数据存储角度看变量类型
    2.2读入数据
    2.2.1读自由格式的文本文件
    2.2.2读Excel电子表格数据
    2.2.3读SPSS格式文件
    2.2.4读数据库文件
    2.3生成实验方案数据
    2.4合并数据
    2.4.1数据的纵向合并
    2.4.2数据的横向合并44
    第3章Clementine变量的管理
    3.1变量说明
    3.1.1取值范围和缺失值的说明
    3.1.2变量取值有效性检查和修正
    3.1.3变量角色的说明
    3.2变量值的重新计算
    3.2.1CLEM表达式
    3.2.2变量值重新计算示例
    3.3变量类别值的调整
    3.4生成新变量
    3.5变量值的离散化处理
    3.5.1常用的分箱方法
    3.5.2变量值的离散化处理示例
    3.6生成样本集分割变量
    3.6.1样本集分割的意义和常见方法
    3.6.2生成样本集分割变量的示例

    第4章Clementine样本的管理
    4.1样本的排序
    4.2样本的条件筛选
    4.3样本的随机抽样
    4.4样本的浓缩处理
    4.5样本的分类汇总
    4.6样本的平衡处理
    4.7样本的其他管理
    4.7.1数据转置
    4.7.2数据的重新组织

    第5章Clementine数据的基本分析
    5.1数据质量的探索
    5.1.1数据的基本描述与质量探索
    5.1.2离群点和极端值的修正
    5.1.3缺失值的替补
    5.1.4数据质量管理的其他功能
    5.2基本描述分析
    5.2.1计算基本描述统计量
    5.2.2绘制散点图
    5.3变量分布的探索
    5.4两分类变量相关性的研究
    5.4.1两分类变量相关性的图形分析
    5.4.2两分类变量相关性的数值分析
    5.5两总体的均值比较
    5.5.1两总体均值比较的图形分析
    5.5.2独立样本的均值检验
    5.5.3配对样本的均值检验
    5.6变量重要性的分析
    5.6.1变量重要性分析的一般方法
    5.6.2变量重要性分析的应用示例

    第6章分类预测:Clementine的决策树
    6.1决策树算法概述
    6.1.1什么是决策树
    6.1.2决策树的几何理解
    6.1.3决策树的核心问题
    6.2Clementine的C5.0算法及应用
    6.2.1信息熵和信息增益
    6.2.2C5.0的决策树生长算法
    6.2.3C5.0的剪枝算法
    6.2.4C5.0的推理规则集
    6.2.5C5.0的基本应用示例
    6.2.6C5.0的损失矩阵和Boosting技术
    6.2.7C5.0的模型评价
    6.2.8C5.0的其他话题:推理规则、交叉验证和未剪枝的决策树
    6.3Clementine的分类回归树及应用
    6.3.1分类回归树的生长过程
    6.3.2分类回归树的剪枝过程
    6.3.3损失矩阵对分类树的影响
    6.3.4分类回归树的基本应用示例
    6.3.5分类回归树的交互建模
    6.3.6分类回归树的模型评价
    6.4Clementine的CHAID算法及应用
    6.4.1CHAID分组变量的预处理和选择策略
    6.4.2ExhaustiveCHAID算法
    6.4.3CHAID的剪枝
    6.4.4CHAID的应用示例
    6.5Clementine的QUEST算法及应用
    6.5.1QUEST算法确定最佳分组变量和分割点的方法
    6.5.2QUEST算法的应用示例
    6.6决策树算法评估的图形比较
    6.6.1不同模型的误差对比
    6.6.2不同模型收益的对比

    第7章分类预测:Clementine的人工神经网络
    7.1人工神经网络算法概述
    7.1.1人工神经网络的概念和种类
    7.1.2人工神经网络中的节点和意义
    7.1.3人工神经网络建立的一般步骤
    7.2Clementine的B-P反向传播网络
    7.2.1感知机模型
    7.2.2B-P反向传播网络的特点
    7.2.3B-P反向传播算法
    7.2.4B-P反向传播网络的其他问题
    7.3Clementine的B-P反向传播网络的应用
    7.3.1基本操作说明
    7.3.2计算结果说明
    7.3.3提高模型预测精度
    7.4Clementine的径向基函数网络及应用
    7.4.1径向基函数网络中的隐节点和输出节点
    7.4.2径向基函数网络的学习过程
    7.4.3径向基函数网络的应用示例

    第8章分类预测:Clementine的统计方法
    8.1Clementine的Logistic回归分析及应用
    8.1.1二项Logistic回归方程
    8.1.2二项Logistic回归方程系数的含义
    8.1.3二项Logistic回归方程的检验
    8.1.4二项Logistic回归分析的应用示例
    8.1.5多项Logistic回归分析的应用示例
    8.2Clementine的判别分析及应用
    8.2.1距离判别法
    8.2.2Fisher判别法
    8.2.3贝叶斯判别法
    8.2.4判别分析的应用示例

    第9章探索内部结构:Clementine的关联分析
    9.1简单关联规则及其有效性
    9.1.1简单关联规则的基本概念
    9.1.2简单关联规则的有效性和实用性
    9.2Clementine的Apriori算法及应用
    9.2.1产生频繁项集
    9.2.2依据频繁项集产生简单关联规则
    9.2.3Apriori算法的应用示例
    9.3Clementine的GRI算法及应用
    9.3.1GRI算法基本思路
    9.3.2GRI算法的具体策略
    9.3.3GRI算法的应用示例
    9.4Clementine的序列关联及应用
    9.4.1序列关联中的基本概念
    9.4.2Sequence算法
    9.4.3序列关联的时间约束
    9.4.4序列关联分析的应用示例

    第10章探索内部结构:Clementine的聚类分析
    10.1聚类分析的一般问题
    10.1.1聚类分析的提出
    10.1.2聚类分析的算法
    10.2Clementine的K-Means聚类及应用
    10.2.1K-Means对“亲疏程度”的测度
    10.2.2K-Means聚类过程
    10.2.3K-Means聚类的应用示例
    10.3Clementine的两步聚类及应用
    10.3.1两步聚类对“亲疏程度”的测度
    10.3.2两步聚类过程
    10.3.3聚类数目的确定
    10.3.4两步聚类的应用示例
    10.4Clementine的Kohonen网络聚类及应用
    10.4.1Kohonen网络的聚类机理
    10.4.2Kohonen网络的聚类过程
    10.4.3Kohonen网络聚类的示例
    10.5基于聚类分析的离群点探索及应用
    10.5.1多维空间基于聚类的诊断方法
    10.5.2多维空间基于聚类的诊断方法应用示例
    参考文献
  • 内容简介:
      数据挖掘是当前数据分析领域中最活跃、最前沿的地带。《统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)》以数据挖掘的实践过程为主线,通过生动的应用案例,从数据挖掘实施角度,系统介绍了经典的数据挖掘方法和利用SPSSModeler实现数据挖掘的全部过程,讲解方法从易到难,说明问题从浅至深。《统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)》力求以最通俗的方式阐述数据挖掘方法的核心思想与基本原理,同时配合SPSSModeler软件操作的说明,希望读者能够直观了解方法本质,尽快掌握SPSSModeler软件使用,并应用到数据挖掘实践中。书中所有数据和案例与华信教育资源网上数据资料内容一致。
  • 作者简介:
    薛薇,中国人民大学应用统计科学研究中心副主任
  • 目录:
    第1章数据挖掘和Clementine概述
    1.1数据挖掘的产生背景
    1.1.1海量数据的分析需求催生数据挖掘
    1.1.2应用对理论的挑战催生数据挖掘
    1.2什么是数据挖掘
    1.2.1数据挖掘的概念
    1.2.2数据挖掘能做什么
    1.2.3数据挖掘得到的知识形式
    1.2.4数据挖掘的算法分类
    1.3Clementine软件概述
    1.3.1Clementine的窗口
    1.3.2数据流的基本管理和执行
    1.3.3数据流的其他管理
    1.3.4从一个示例看Clementine的使用

    第2章Clementine数据的读入
    2.1变量的类型
    2.1.1从数据挖掘角度看变量类型
    2.1.2从数据存储角度看变量类型
    2.2读入数据
    2.2.1读自由格式的文本文件
    2.2.2读Excel电子表格数据
    2.2.3读SPSS格式文件
    2.2.4读数据库文件
    2.3生成实验方案数据
    2.4合并数据
    2.4.1数据的纵向合并
    2.4.2数据的横向合并44
    第3章Clementine变量的管理
    3.1变量说明
    3.1.1取值范围和缺失值的说明
    3.1.2变量取值有效性检查和修正
    3.1.3变量角色的说明
    3.2变量值的重新计算
    3.2.1CLEM表达式
    3.2.2变量值重新计算示例
    3.3变量类别值的调整
    3.4生成新变量
    3.5变量值的离散化处理
    3.5.1常用的分箱方法
    3.5.2变量值的离散化处理示例
    3.6生成样本集分割变量
    3.6.1样本集分割的意义和常见方法
    3.6.2生成样本集分割变量的示例

    第4章Clementine样本的管理
    4.1样本的排序
    4.2样本的条件筛选
    4.3样本的随机抽样
    4.4样本的浓缩处理
    4.5样本的分类汇总
    4.6样本的平衡处理
    4.7样本的其他管理
    4.7.1数据转置
    4.7.2数据的重新组织

    第5章Clementine数据的基本分析
    5.1数据质量的探索
    5.1.1数据的基本描述与质量探索
    5.1.2离群点和极端值的修正
    5.1.3缺失值的替补
    5.1.4数据质量管理的其他功能
    5.2基本描述分析
    5.2.1计算基本描述统计量
    5.2.2绘制散点图
    5.3变量分布的探索
    5.4两分类变量相关性的研究
    5.4.1两分类变量相关性的图形分析
    5.4.2两分类变量相关性的数值分析
    5.5两总体的均值比较
    5.5.1两总体均值比较的图形分析
    5.5.2独立样本的均值检验
    5.5.3配对样本的均值检验
    5.6变量重要性的分析
    5.6.1变量重要性分析的一般方法
    5.6.2变量重要性分析的应用示例

    第6章分类预测:Clementine的决策树
    6.1决策树算法概述
    6.1.1什么是决策树
    6.1.2决策树的几何理解
    6.1.3决策树的核心问题
    6.2Clementine的C5.0算法及应用
    6.2.1信息熵和信息增益
    6.2.2C5.0的决策树生长算法
    6.2.3C5.0的剪枝算法
    6.2.4C5.0的推理规则集
    6.2.5C5.0的基本应用示例
    6.2.6C5.0的损失矩阵和Boosting技术
    6.2.7C5.0的模型评价
    6.2.8C5.0的其他话题:推理规则、交叉验证和未剪枝的决策树
    6.3Clementine的分类回归树及应用
    6.3.1分类回归树的生长过程
    6.3.2分类回归树的剪枝过程
    6.3.3损失矩阵对分类树的影响
    6.3.4分类回归树的基本应用示例
    6.3.5分类回归树的交互建模
    6.3.6分类回归树的模型评价
    6.4Clementine的CHAID算法及应用
    6.4.1CHAID分组变量的预处理和选择策略
    6.4.2ExhaustiveCHAID算法
    6.4.3CHAID的剪枝
    6.4.4CHAID的应用示例
    6.5Clementine的QUEST算法及应用
    6.5.1QUEST算法确定最佳分组变量和分割点的方法
    6.5.2QUEST算法的应用示例
    6.6决策树算法评估的图形比较
    6.6.1不同模型的误差对比
    6.6.2不同模型收益的对比

    第7章分类预测:Clementine的人工神经网络
    7.1人工神经网络算法概述
    7.1.1人工神经网络的概念和种类
    7.1.2人工神经网络中的节点和意义
    7.1.3人工神经网络建立的一般步骤
    7.2Clementine的B-P反向传播网络
    7.2.1感知机模型
    7.2.2B-P反向传播网络的特点
    7.2.3B-P反向传播算法
    7.2.4B-P反向传播网络的其他问题
    7.3Clementine的B-P反向传播网络的应用
    7.3.1基本操作说明
    7.3.2计算结果说明
    7.3.3提高模型预测精度
    7.4Clementine的径向基函数网络及应用
    7.4.1径向基函数网络中的隐节点和输出节点
    7.4.2径向基函数网络的学习过程
    7.4.3径向基函数网络的应用示例

    第8章分类预测:Clementine的统计方法
    8.1Clementine的Logistic回归分析及应用
    8.1.1二项Logistic回归方程
    8.1.2二项Logistic回归方程系数的含义
    8.1.3二项Logistic回归方程的检验
    8.1.4二项Logistic回归分析的应用示例
    8.1.5多项Logistic回归分析的应用示例
    8.2Clementine的判别分析及应用
    8.2.1距离判别法
    8.2.2Fisher判别法
    8.2.3贝叶斯判别法
    8.2.4判别分析的应用示例

    第9章探索内部结构:Clementine的关联分析
    9.1简单关联规则及其有效性
    9.1.1简单关联规则的基本概念
    9.1.2简单关联规则的有效性和实用性
    9.2Clementine的Apriori算法及应用
    9.2.1产生频繁项集
    9.2.2依据频繁项集产生简单关联规则
    9.2.3Apriori算法的应用示例
    9.3Clementine的GRI算法及应用
    9.3.1GRI算法基本思路
    9.3.2GRI算法的具体策略
    9.3.3GRI算法的应用示例
    9.4Clementine的序列关联及应用
    9.4.1序列关联中的基本概念
    9.4.2Sequence算法
    9.4.3序列关联的时间约束
    9.4.4序列关联分析的应用示例

    第10章探索内部结构:Clementine的聚类分析
    10.1聚类分析的一般问题
    10.1.1聚类分析的提出
    10.1.2聚类分析的算法
    10.2Clementine的K-Means聚类及应用
    10.2.1K-Means对“亲疏程度”的测度
    10.2.2K-Means聚类过程
    10.2.3K-Means聚类的应用示例
    10.3Clementine的两步聚类及应用
    10.3.1两步聚类对“亲疏程度”的测度
    10.3.2两步聚类过程
    10.3.3聚类数目的确定
    10.3.4两步聚类的应用示例
    10.4Clementine的Kohonen网络聚类及应用
    10.4.1Kohonen网络的聚类机理
    10.4.2Kohonen网络的聚类过程
    10.4.3Kohonen网络聚类的示例
    10.5基于聚类分析的离群点探索及应用
    10.5.1多维空间基于聚类的诊断方法
    10.5.2多维空间基于聚类的诊断方法应用示例
    参考文献
查看详情
12
系列丛书 / 更多
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
SPSS统计分析(第5版)
卢纹岱、朱红兵 编
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
SAS统计分析应用(第2版)
董大钧 著
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计分析教材:社会调查方法与实践
杜智敏 著;郭宜斌 校
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
SPSS在社会调查中的应用
杜智敏、樊文强 著
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
MATLAB & Excel定量预测与决策:运作案例精编
张建林 著
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
SAS统计分析教程
胡良平、高辉 编
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计分析教材:MATLAB定量决策五大类问题·50个运作管理经典案例分析
张建林 著
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计分析教材:非线性回归分析与SAS智能化实现
胡良平、高辉 著
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
医学综合统计设计与数据分析
胡良平 著
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
基础医学统计设计与数据分析
胡良平、余红梅、高辉 编
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计分析教材·市场营销研究与应用:基于SPSS
陈文沛、张挺 著
相关图书 / 更多
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计物理简义
秦思学
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计预测
洪兴建 编
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计考古
苑世领
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计机器学习及R实现
孙德山
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计学:SPSS应用及案例分析
王秀芝
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计学——使用R语言
朱顺泉 等编著
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计学高级教程:回归分析(原书第8版) [美]威廉·门登霍尔
(美)威廉·门登霍尔(William Mendenhall),(美)特里·辛西奇(Terry Sincich)
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计分析与SPSS的应用(第7版)()
薛薇
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计学(第三版)
主编 马秀颖 马敏娜 副主编 李国荣 王
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计学原理及应用研究
张海凤;舒春光;晋新焕
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计学习题册(第二版)
王利娟、李梨、马雨 编
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
统计思维:科学家入门导引 [美]M. D.埃奇
(美)M. D.埃奇
您可能感兴趣 / 更多
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
悦读无字之书砺炼思想品格 思想政治理论课实效性成果汇编
薛薇、袁宏松、周颖 编
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
基于Clementine的数据挖掘
薛薇、陈欢歌 著;魏文 译
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
Clementine数据挖掘方法及应用
薛薇、陈欢歌 著
统计分析教材:SPSSModeler数据挖掘方法及应用(第2版)
基于EXCEL的统计应用
薛薇、陈欢歌 著