并行离群数据挖掘及应用

并行离群数据挖掘及应用
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2021-07
ISBN: 9787518977383
定价: 39.00
装帧: 平装
开本: 16开
纸张: 胶版纸
1人买过
  • 全书共由7章组成,其中:第1章主要介绍数据挖掘技术、离群挖掘、集群系统与Spark并行计算模型及大数据的相关概念、理论基础和应用。第2章利用特征分组,针对高维分类数据集,研究了一种基于加权特征分组的离群检测新方法,通过将特征分为多个特征组来发现每个组中特征模式的不同方面。第3章利用Spark计算平台,研究了高维分类数据的并行离群检测算法。第4章通过分析属性间的相关性,研究了一种基于互信息的混合属性离群检测算法。该算法在互信息机制下给出了针对数值型和分类型统一的属性加权方法和离群得分计算方法,而且不同类型属性下的相似性度量也进行了规范化处理。第5章针对互信息计算的复杂性问题,充分利用Spark并行计算框架的强大计算能力,研究了一种并行互信息计算方法,该算法利用列变换和虚拟数据划分技术降低了网络传输和计算代价。第6章以某钢铁企业实际的冷轧辊产品加工数据为背景,设计与实现了冷轧辊制造过程离群检测原型系统,从而为企业开展产品质量控制提供了一种新的技术方法和解决思路。第7章是研究的总结与展望。 目录 

     

     
    第1章绪论 

     
    1.1大数据挖掘及应用 

     
    1.1.1数据挖掘技术 

     
    1.1.2数据挖掘的发展趋势和研究前沿 

     
    1.1.3大数据及其应用 

     
    1.1.4集群系统与并行计算 

     
    1.1.5Spark并行计算模型 

     
    1.1.6大数据挖掘技术的应用 

     
    1.2离群数据挖掘及研究动态 

     
    1.2.1离群数据挖掘 

     
    1.2.2分类数据离群挖掘 

     
    1.2.3混合属性数据离群挖掘 

     
    1.2.4离群数据并行挖掘及性能优化 

     
    1.2.5离群数据挖掘的应用 

     
    1.3本章小结 

     

     
    第2章基于加权特征分组的高维分类数据离群挖掘 

     
    2.1引言 

     
    2.2相关工作 

     
    2.2.1离群检测 

     
    2.2.2高维数据离群检测 

     
    2.2.3分类数据离群检测 

     
    2.3离群检测前期准备 

     
    2.3.1分类数据和问题陈述 

     
    2.3.2计算特征的相关性 

     
    2.3.3特征分组算法 

     
    2.4离群值检测算法WATCH 

     
    2.4.1特征加权 

     
    2.4.2离群得分 

     
    2.4.3离群检测算法 

     
    2.4.4时间复杂度分析 

     
    2.5实验分析 

     
    2.5.1数据集 

     
    2.5.2特征分组评估 

     
    2.5.3特征分组结果分析 

     
    2.5.4离群点检测的精度 

     
    2.5.5离群检测效率 

     
    2.5.6可解释性 

     
    2.6本章小结 

     

     
    第3章基于Spark的分类数据并行离群挖掘 

     
    3.1引言 

     
    3.2基本概念 

     
    3.2.1高维分类数据特征组 

     
    3.2.2MapReduce和Spark RDD 

     
    3.3特征分组 

     
    3.3.1特征分组的基本概念 

     
    3.3.2基于Spark的特征分组的并行实现 

     
    3.4基于Spark的POS算法 

     
    3.4.1基于Spark的POS算法的工作流程 

     
    3.4.2基于Spark的特征分组 

     
    3.4.3并行离群挖掘 

     
    3.5POS的性能调优 

     
    3.5.1RDD缓存 

     
    3.5.2参数调优 

     
    3.6实验分析 

     
    3.6.1数据集 

     
    3.6.2伪分布环境下的挖掘性能 

     
    3.6.3RDD缓存的影响 

     
    3.6.4特征组的数量对算法的影响 

     
    3.6.5算法的可扩展性 

     
    3.6.6算法的可伸缩性 

     
    3.7本章小结 

     

     
    第4章基于互信息的混合属性加权离群挖掘算法 

     
    4.1引言 

     
    4.2相关工作 

     
    4.3基于互信息的混合属性相关性度量及加权机制 

     
    4.3.1互信息计算 

     
    4.3.2混合属性加权机制 

     
    4.4基于互信息的混合属性加权离群检测算法 

     
    4.4.1数值空间离群得分 

     
    4.4.2分类空间离群得分 

     
    4.4.3混合属性加权离群检测算法 

     
    4.5实验结果与分析 

     
    4.5.1混合属性数据离群检测分析 

     
    4.5.2数值型数据离群检测分析 

     
    4.5.3分类型数据离群检测分析 

     
    4.6本章小结 

     

     
    第5章基于Spark的并行互信息计算及其性能优化 

     
    5.1引言 

     
    5.2相关工作 

     
    5.2.1互信息及其并行化 

     
    5.2.2性能优化 

     
    5.3并行互信息计算及性能优化 

     
    5.3.1列变换 

     
    5.3.2数据倾斜 

     
    5.4MiCS算法的具体实现 

     
    5.4.1列变换及虚拟划分策略 

     
    5.4.2互信息计算 

     
    5.5实验与分析 

     
    5.5.1应用背景 

     
    5.5.2数据集 

     
    5.5.3列变换对MiCS的影响 

     
    5.5.4虚拟分区对MiCS的影响 

     
    5.6本章小结 

     

     
    第6章冷轧辊制造过程离群数据挖掘原型系统 

     
    6.1引言 

     
    6.2系统需求与总体设计 

     
    6.2.1冷轧辊制造过程的复杂性 

     
    6.2.2冷轧辊的失效分析 

     
    6.2.3影响冷轧辊生产过程质量的因素 

     
    6.2.4系统的软件体系结构及功能 

     
    6.3数据收集及预处理 

     
    6.3.1数据收集 

     
    6.3.2数据预处理 

     
    6.4冷轧辊制造过程离群检测及质量分析 

     
    6.5本章小结 

     

     
    第7章总结与展望 

     
    7.1总结 

     
    7.2展望 

  • 内容简介:
    全书共由7章组成,其中:第1章主要介绍数据挖掘技术、离群挖掘、集群系统与Spark并行计算模型及大数据的相关概念、理论基础和应用。第2章利用特征分组,针对高维分类数据集,研究了一种基于加权特征分组的离群检测新方法,通过将特征分为多个特征组来发现每个组中特征模式的不同方面。第3章利用Spark计算平台,研究了高维分类数据的并行离群检测算法。第4章通过分析属性间的相关性,研究了一种基于互信息的混合属性离群检测算法。该算法在互信息机制下给出了针对数值型和分类型统一的属性加权方法和离群得分计算方法,而且不同类型属性下的相似性度量也进行了规范化处理。第5章针对互信息计算的复杂性问题,充分利用Spark并行计算框架的强大计算能力,研究了一种并行互信息计算方法,该算法利用列变换和虚拟数据划分技术降低了网络传输和计算代价。第6章以某钢铁企业实际的冷轧辊产品加工数据为背景,设计与实现了冷轧辊制造过程离群检测原型系统,从而为企业开展产品质量控制提供了一种新的技术方法和解决思路。第7章是研究的总结与展望。
  • 目录:
    目录 

     

     
    第1章绪论 

     
    1.1大数据挖掘及应用 

     
    1.1.1数据挖掘技术 

     
    1.1.2数据挖掘的发展趋势和研究前沿 

     
    1.1.3大数据及其应用 

     
    1.1.4集群系统与并行计算 

     
    1.1.5Spark并行计算模型 

     
    1.1.6大数据挖掘技术的应用 

     
    1.2离群数据挖掘及研究动态 

     
    1.2.1离群数据挖掘 

     
    1.2.2分类数据离群挖掘 

     
    1.2.3混合属性数据离群挖掘 

     
    1.2.4离群数据并行挖掘及性能优化 

     
    1.2.5离群数据挖掘的应用 

     
    1.3本章小结 

     

     
    第2章基于加权特征分组的高维分类数据离群挖掘 

     
    2.1引言 

     
    2.2相关工作 

     
    2.2.1离群检测 

     
    2.2.2高维数据离群检测 

     
    2.2.3分类数据离群检测 

     
    2.3离群检测前期准备 

     
    2.3.1分类数据和问题陈述 

     
    2.3.2计算特征的相关性 

     
    2.3.3特征分组算法 

     
    2.4离群值检测算法WATCH 

     
    2.4.1特征加权 

     
    2.4.2离群得分 

     
    2.4.3离群检测算法 

     
    2.4.4时间复杂度分析 

     
    2.5实验分析 

     
    2.5.1数据集 

     
    2.5.2特征分组评估 

     
    2.5.3特征分组结果分析 

     
    2.5.4离群点检测的精度 

     
    2.5.5离群检测效率 

     
    2.5.6可解释性 

     
    2.6本章小结 

     

     
    第3章基于Spark的分类数据并行离群挖掘 

     
    3.1引言 

     
    3.2基本概念 

     
    3.2.1高维分类数据特征组 

     
    3.2.2MapReduce和Spark RDD 

     
    3.3特征分组 

     
    3.3.1特征分组的基本概念 

     
    3.3.2基于Spark的特征分组的并行实现 

     
    3.4基于Spark的POS算法 

     
    3.4.1基于Spark的POS算法的工作流程 

     
    3.4.2基于Spark的特征分组 

     
    3.4.3并行离群挖掘 

     
    3.5POS的性能调优 

     
    3.5.1RDD缓存 

     
    3.5.2参数调优 

     
    3.6实验分析 

     
    3.6.1数据集 

     
    3.6.2伪分布环境下的挖掘性能 

     
    3.6.3RDD缓存的影响 

     
    3.6.4特征组的数量对算法的影响 

     
    3.6.5算法的可扩展性 

     
    3.6.6算法的可伸缩性 

     
    3.7本章小结 

     

     
    第4章基于互信息的混合属性加权离群挖掘算法 

     
    4.1引言 

     
    4.2相关工作 

     
    4.3基于互信息的混合属性相关性度量及加权机制 

     
    4.3.1互信息计算 

     
    4.3.2混合属性加权机制 

     
    4.4基于互信息的混合属性加权离群检测算法 

     
    4.4.1数值空间离群得分 

     
    4.4.2分类空间离群得分 

     
    4.4.3混合属性加权离群检测算法 

     
    4.5实验结果与分析 

     
    4.5.1混合属性数据离群检测分析 

     
    4.5.2数值型数据离群检测分析 

     
    4.5.3分类型数据离群检测分析 

     
    4.6本章小结 

     

     
    第5章基于Spark的并行互信息计算及其性能优化 

     
    5.1引言 

     
    5.2相关工作 

     
    5.2.1互信息及其并行化 

     
    5.2.2性能优化 

     
    5.3并行互信息计算及性能优化 

     
    5.3.1列变换 

     
    5.3.2数据倾斜 

     
    5.4MiCS算法的具体实现 

     
    5.4.1列变换及虚拟划分策略 

     
    5.4.2互信息计算 

     
    5.5实验与分析 

     
    5.5.1应用背景 

     
    5.5.2数据集 

     
    5.5.3列变换对MiCS的影响 

     
    5.5.4虚拟分区对MiCS的影响 

     
    5.6本章小结 

     

     
    第6章冷轧辊制造过程离群数据挖掘原型系统 

     
    6.1引言 

     
    6.2系统需求与总体设计 

     
    6.2.1冷轧辊制造过程的复杂性 

     
    6.2.2冷轧辊的失效分析 

     
    6.2.3影响冷轧辊生产过程质量的因素 

     
    6.2.4系统的软件体系结构及功能 

     
    6.3数据收集及预处理 

     
    6.3.1数据收集 

     
    6.3.2数据预处理 

     
    6.4冷轧辊制造过程离群检测及质量分析 

     
    6.5本章小结 

     

     
    第7章总结与展望 

     
    7.1总结 

     
    7.2展望 

查看详情
相关图书 / 更多
并行离群数据挖掘及应用
并行程序设计:概念与实践
[德]贝蒂尔·施密特(Bertil Schmidt) 著;张常有 、吴长茂、解庆春 译
并行离群数据挖掘及应用
并行编程
张杨
并行离群数据挖掘及应用
并行计算导论/人工智能与大数据技术丛书
雷向东、雷振阳、龙军 著
并行离群数据挖掘及应用
并行数据挖掘及性能优化:关联规则与数据相关性分析
荀亚玲 著
并行离群数据挖掘及应用
并行编程实战——基于C#8和.NETCore3
[印]沙克蒂·坦沃 著;马琳琳 译
并行离群数据挖掘及应用
并行计算的编程模型
[美]帕万·巴拉吉(Pavan Balaji)
并行离群数据挖掘及应用
并行计算与高性能计算
尤莉安娜·萨莫拉(Yuliana Zamora)著 殷海英 译;[美]罗伯特·罗比(Robert Robey)
并行离群数据挖掘及应用
并行化河流数学模型研发及应用
李健、霍军军 著
并行离群数据挖掘及应用
并行多核体系结构基础
[美]汤孟岩(Yan Solihin)
并行离群数据挖掘及应用
并行计算机体系结构(第2版)
陈国良
并行离群数据挖掘及应用
并行书系 雕光刻影 皮影雕刻巨匠汪天稳 传承传统文化 匠人精神在中国
张欣 著
并行离群数据挖掘及应用
并行编程原理与程序设计
何兵寿;宋鹏;刘颖
您可能感兴趣 / 更多