大数据挖掘

大数据挖掘
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: , ,
2016-03
版次: 1
ISBN: 9787547829615
定价: 75.00
装帧: 软精装
开本: 16开
纸张: 胶版纸
页数: 320页
字数: 425千字
正文语种: 简体中文
  • 《大数据挖掘》一书系统介绍了大数据挖掘的概念、原理、技术和应用。包括:认识和理解大数据;大数据挖掘需要的相关技术(大数据获取技术、大数据存储管理技术和大数据可视化技术等);大数据计算框架;大数据挖掘任务(关联分析、聚类分析、分类分析、演变分析、特异群组分析和异常分析);大数据应用实现;以及大数据挖掘工具。
    《大数据挖掘》对大数据挖掘技术进行了全面而细致的定义和归纳,并将向读者展现该领域研究热点和技术。关于大数据应用实现章节的内容将采用作者实际主持和完成的大数据挖掘项目为实际案例,阐述大数据挖掘应用实现过程中的问题、解决方案和取得的成果。
    《大数据挖掘》一书的主要读者是数据科学专业的高等学校学生及老师,从事数据和信息质量工作的研究人员、技术人员、管理人员和决策人员 熊赟,教授。作为项目负责人主持或参与省部级或企业合作项目11项。相关研究成果在本领域国际会议“IEEE International Conference on Data Mining (ICDM)”、《IEEE Intelligent Systems》、《Bioinformatics》、《软件学报》等国内外期刊或会议上发表论文30余篇。出版专著2本。主要研究兴趣包括数据科学和技术、大规模数据处理、数据挖掘及其应用等。提出了特异群组挖掘、Day-by-Day行为数据、多支持度序列挖掘、生物数据模型等学术观点和见解。朱扬勇,复旦大学计算机科学技术学院教授、学术委员会主任,上海市数据科学重点实验室主任,上海市政府信息化专家委员会专家,中国计算机学会大数据专家委员会专家,美国马里兰大学客座教授。从事数据领域研究25年,是国内较早一批从事数据挖掘研究的学者,是国际数据科学研究的主要倡导者之一。主持过国家自然科学基金、国家863计划项目、上海市科委重点等多项数据挖掘领域的研究课题,曾获上海市科技进步一、二、三等奖。相关研究成果在国内外期刊或会议上发表论文100余篇,出版专著2本,教材3本。 第1章 绪论 
    1.1 理解大数据挖掘 
    1.1.1 大数据挖掘的定义 
    1.1.2 大数据挖掘的任务 
    1.1.3 大数据挖掘的特点 
    1.1.4 大数据挖掘与相关技术的差异 
    1.2 大数据挖掘需要的相关技术 
    1.2.1 大数据获取
    1.2.2 大数据存储与管理
    1.2.3 大数据可视化
    1.3 小结
    参考文献 
    第2章 大数据计算框架 
    2.1. HDFS 
    2.2. MapReduce
    2.2.1 MapReduce框架及范例
    2.2.2 MapReduce存在的问题和解决方法
    2.3. NoSQL(非关系型)数据库
    2.3.1 NoSQL数据库的分类
    2.3.2 NoSQL数据库实例
    2.4. SQL(关系型)数据库
    2.4.1. Apache HIVE 
    2.4.2. 其他SQL数据库 
    2.5 小结
    参考文献 
    第3章 关联分析 
    3.1关联分析的基本概念 
    3.1.1 关联分析的定义
    3.1.2 关联规则的定义
    3.1.3 关联规则的分类
    3.2 关联规则挖掘的原理
    3.2.1 挖掘简单关联规则 
    3.2.2 挖掘量化关联规则 
    3.2.3 挖掘多层关联规则 
    3.2.4 挖掘多维关联规则 
    3.3 关联规则挖掘的基础算法
    3.3.1 Apriori算法
    3.3.2 Apriori算法
    3.3.3 FP-Growth算法
    3.3.4 序列模式挖掘算法
    3.4挖掘算法的进阶方法 
    3.4.1 USpan:高效用序列模式挖掘算法
    3.4.2 基于MapReduce的HusMaR算法
    3.5 小结
    参考文献 
    第4章 聚类分析 
    4.1聚类分析的基本概念
    4.1.1 簇与聚类 
    4.1.2 相似性度量和聚类原理 
    4.2聚类分析的基础算法 
    4.2.1 层次的方法――单连接算法、BIRCH算法 
    4.2.2 划分的方法――k-means和k-medoids算法
    4.2.3 基于密度的方法――OPTICS算法
    4.3 进阶方法
    4.3.1 Density Peaks算法(AA算法)
    4.3.2 K-Means||:基于MapReduce的K-Means算法
    4.4 小结 
    参考文献 
    第5章 分类分析 
    5.1分类分析的基本概念 
    5.2 分类模型
    5.3 分类分析的原理 
    5.3.1 决策树
    5.3.2 基于统计的算法
    5.3.3 基于神经网络的算法
    5.4 分类分析的基础算法 
    5.5 分类分析的进阶方法
    5.6 小结
    参考文献 
    第6章 异常分析
    6.1异常分析的基本概念
    6.1.1 异常
    6.1.2 异常分析
    6.2异常分析的原理 
    6.2.1 基于统计的异常分析方法
    6.2.2 基于偏差的异常分析方法 
    6.2.3 基于距离的异常分析方法
    6.2.4 基于密度的异常分析方法 
    6.3异常分析的主要算法
    6.3.1 基于距离的异常分析算法
    6.3.2 基于密度的异常分析算法
    6.4 小结
    参考文献 
    第7章 特异群组挖掘 
    7.1特异群组挖掘的基本概念
    7.2 特异群组挖掘与聚类和异常检测的关系
    7.3 特异群组挖掘形式化描述
    7.4 特异群组挖掘框架算法
    7.5 特异群组挖掘应用 
    7.6 小结 
    参考文献 
    第8章 演变分析 
    8.1演变分析的基本概念 
    8.2 演变分析的原理
    8.3 演变分析的基础算法 
    8.4 演变分析的进阶算法 
    8.4.1 时间序列随机偏移符号化表示算法
    8.4.2 多维温度序列协同异常事件挖掘算法
    8.5 小结
    参考文献 
    第9章 异质数据网络挖掘
    9.1 异质数据网络
    9.2 异质数据网络挖掘研究现状
    9.3 数据网络上的相似性度量的研究
    9.4 异质数据网络挖掘研究内容
    9.5 小结
    参考文献
    第10章 大数据挖掘应用之推荐系统
    10.1 推荐系统研究阶段
    10.2 推荐系统算法 
    10.2.1 推荐系统定义 
    10.2.2 推荐算法分类 
    10.2.3 比较与分析
    10.3 推荐系统的评测 
    0.4 小结
    参考文献
    第11章 大数据中的隐私问题 
    11.1. 隐私的重要性 
    11.2. 隐私保护技术 
    11.2.1. 直接攻击的应对方法 
    11.2.2. 间接攻击的应对方法
    11.3 小结
    参考文献 

  • 内容简介:
    《大数据挖掘》一书系统介绍了大数据挖掘的概念、原理、技术和应用。包括:认识和理解大数据;大数据挖掘需要的相关技术(大数据获取技术、大数据存储管理技术和大数据可视化技术等);大数据计算框架;大数据挖掘任务(关联分析、聚类分析、分类分析、演变分析、特异群组分析和异常分析);大数据应用实现;以及大数据挖掘工具。
    《大数据挖掘》对大数据挖掘技术进行了全面而细致的定义和归纳,并将向读者展现该领域研究热点和技术。关于大数据应用实现章节的内容将采用作者实际主持和完成的大数据挖掘项目为实际案例,阐述大数据挖掘应用实现过程中的问题、解决方案和取得的成果。
    《大数据挖掘》一书的主要读者是数据科学专业的高等学校学生及老师,从事数据和信息质量工作的研究人员、技术人员、管理人员和决策人员
  • 作者简介:
    熊赟,教授。作为项目负责人主持或参与省部级或企业合作项目11项。相关研究成果在本领域国际会议“IEEE International Conference on Data Mining (ICDM)”、《IEEE Intelligent Systems》、《Bioinformatics》、《软件学报》等国内外期刊或会议上发表论文30余篇。出版专著2本。主要研究兴趣包括数据科学和技术、大规模数据处理、数据挖掘及其应用等。提出了特异群组挖掘、Day-by-Day行为数据、多支持度序列挖掘、生物数据模型等学术观点和见解。朱扬勇,复旦大学计算机科学技术学院教授、学术委员会主任,上海市数据科学重点实验室主任,上海市政府信息化专家委员会专家,中国计算机学会大数据专家委员会专家,美国马里兰大学客座教授。从事数据领域研究25年,是国内较早一批从事数据挖掘研究的学者,是国际数据科学研究的主要倡导者之一。主持过国家自然科学基金、国家863计划项目、上海市科委重点等多项数据挖掘领域的研究课题,曾获上海市科技进步一、二、三等奖。相关研究成果在国内外期刊或会议上发表论文100余篇,出版专著2本,教材3本。
  • 目录:
    第1章 绪论 
    1.1 理解大数据挖掘 
    1.1.1 大数据挖掘的定义 
    1.1.2 大数据挖掘的任务 
    1.1.3 大数据挖掘的特点 
    1.1.4 大数据挖掘与相关技术的差异 
    1.2 大数据挖掘需要的相关技术 
    1.2.1 大数据获取
    1.2.2 大数据存储与管理
    1.2.3 大数据可视化
    1.3 小结
    参考文献 
    第2章 大数据计算框架 
    2.1. HDFS 
    2.2. MapReduce
    2.2.1 MapReduce框架及范例
    2.2.2 MapReduce存在的问题和解决方法
    2.3. NoSQL(非关系型)数据库
    2.3.1 NoSQL数据库的分类
    2.3.2 NoSQL数据库实例
    2.4. SQL(关系型)数据库
    2.4.1. Apache HIVE 
    2.4.2. 其他SQL数据库 
    2.5 小结
    参考文献 
    第3章 关联分析 
    3.1关联分析的基本概念 
    3.1.1 关联分析的定义
    3.1.2 关联规则的定义
    3.1.3 关联规则的分类
    3.2 关联规则挖掘的原理
    3.2.1 挖掘简单关联规则 
    3.2.2 挖掘量化关联规则 
    3.2.3 挖掘多层关联规则 
    3.2.4 挖掘多维关联规则 
    3.3 关联规则挖掘的基础算法
    3.3.1 Apriori算法
    3.3.2 Apriori算法
    3.3.3 FP-Growth算法
    3.3.4 序列模式挖掘算法
    3.4挖掘算法的进阶方法 
    3.4.1 USpan:高效用序列模式挖掘算法
    3.4.2 基于MapReduce的HusMaR算法
    3.5 小结
    参考文献 
    第4章 聚类分析 
    4.1聚类分析的基本概念
    4.1.1 簇与聚类 
    4.1.2 相似性度量和聚类原理 
    4.2聚类分析的基础算法 
    4.2.1 层次的方法――单连接算法、BIRCH算法 
    4.2.2 划分的方法――k-means和k-medoids算法
    4.2.3 基于密度的方法――OPTICS算法
    4.3 进阶方法
    4.3.1 Density Peaks算法(AA算法)
    4.3.2 K-Means||:基于MapReduce的K-Means算法
    4.4 小结 
    参考文献 
    第5章 分类分析 
    5.1分类分析的基本概念 
    5.2 分类模型
    5.3 分类分析的原理 
    5.3.1 决策树
    5.3.2 基于统计的算法
    5.3.3 基于神经网络的算法
    5.4 分类分析的基础算法 
    5.5 分类分析的进阶方法
    5.6 小结
    参考文献 
    第6章 异常分析
    6.1异常分析的基本概念
    6.1.1 异常
    6.1.2 异常分析
    6.2异常分析的原理 
    6.2.1 基于统计的异常分析方法
    6.2.2 基于偏差的异常分析方法 
    6.2.3 基于距离的异常分析方法
    6.2.4 基于密度的异常分析方法 
    6.3异常分析的主要算法
    6.3.1 基于距离的异常分析算法
    6.3.2 基于密度的异常分析算法
    6.4 小结
    参考文献 
    第7章 特异群组挖掘 
    7.1特异群组挖掘的基本概念
    7.2 特异群组挖掘与聚类和异常检测的关系
    7.3 特异群组挖掘形式化描述
    7.4 特异群组挖掘框架算法
    7.5 特异群组挖掘应用 
    7.6 小结 
    参考文献 
    第8章 演变分析 
    8.1演变分析的基本概念 
    8.2 演变分析的原理
    8.3 演变分析的基础算法 
    8.4 演变分析的进阶算法 
    8.4.1 时间序列随机偏移符号化表示算法
    8.4.2 多维温度序列协同异常事件挖掘算法
    8.5 小结
    参考文献 
    第9章 异质数据网络挖掘
    9.1 异质数据网络
    9.2 异质数据网络挖掘研究现状
    9.3 数据网络上的相似性度量的研究
    9.4 异质数据网络挖掘研究内容
    9.5 小结
    参考文献
    第10章 大数据挖掘应用之推荐系统
    10.1 推荐系统研究阶段
    10.2 推荐系统算法 
    10.2.1 推荐系统定义 
    10.2.2 推荐算法分类 
    10.2.3 比较与分析
    10.3 推荐系统的评测 
    0.4 小结
    参考文献
    第11章 大数据中的隐私问题 
    11.1. 隐私的重要性 
    11.2. 隐私保护技术 
    11.2.1. 直接攻击的应对方法 
    11.2.2. 间接攻击的应对方法
    11.3 小结
    参考文献 

查看详情
您可能感兴趣 / 更多
大数据挖掘
大数学家讲故事:李毓佩数学童话-数学小子杜鲁克
李毓佩
大数据挖掘
大数据驱动的突发事件情报感知及快速响应研究
唐明伟,庄玉良
大数据挖掘
大数据处理技术基础与应用(Hadoop+Spark)
许桂秋 孙海民 胡贵恒
大数据挖掘
大数据警务的崛起
(美)安德鲁.格思里.弗格森
大数据挖掘
大数据时代图书馆服务体系的创新与发展
程结晶
大数据挖掘
大数据观下的国家情报工作制度研究
马海群 等
大数据挖掘
大数据时代政府治理转型研究-(数字政府建设的江苏实践)
范炜烽等著
大数据挖掘
大数据环境下数字图书馆创新发展
金济
大数据挖掘
大数据背景下公众参与环境治理的程度评估与作用机制研究
史亚东
大数据挖掘
大数据医疗:从即时检测设备进行解析
(英)波利亚·阿梅里安,(英)特鲁迪·朗,(英)弗朗索瓦·范·洛格伦伯格
大数据挖掘
大数据可视化编程和应用
倪振松 胡煜华 朱家全 主编 谢岳富 陈建平 副主编
大数据挖掘
大数据思想政治教育模式构建研究(国家社科基金丛书—其他)
林晶 著
系列丛书 / 更多
大数据挖掘
大数学家讲故事:李毓佩数学童话-数学小子杜鲁克
李毓佩
大数据挖掘
大数据驱动的突发事件情报感知及快速响应研究
唐明伟,庄玉良
大数据挖掘
大数据处理技术基础与应用(Hadoop+Spark)
许桂秋 孙海民 胡贵恒
大数据挖掘
大数据警务的崛起
(美)安德鲁.格思里.弗格森
大数据挖掘
大数据时代图书馆服务体系的创新与发展
程结晶
大数据挖掘
大数据观下的国家情报工作制度研究
马海群 等
大数据挖掘
大数据时代政府治理转型研究-(数字政府建设的江苏实践)
范炜烽等著
大数据挖掘
大数据环境下数字图书馆创新发展
金济
大数据挖掘
大数据背景下公众参与环境治理的程度评估与作用机制研究
史亚东
大数据挖掘
大数据医疗:从即时检测设备进行解析
(英)波利亚·阿梅里安,(英)特鲁迪·朗,(英)弗朗索瓦·范·洛格伦伯格
大数据挖掘
大数据可视化编程和应用
倪振松 胡煜华 朱家全 主编 谢岳富 陈建平 副主编
大数据挖掘
大数据思想政治教育模式构建研究(国家社科基金丛书—其他)
林晶 著
相关图书 / 更多
大数据挖掘
大数学家讲故事:李毓佩数学童话-数学小子杜鲁克
李毓佩
大数据挖掘
大数据驱动的突发事件情报感知及快速响应研究
唐明伟,庄玉良
大数据挖掘
大数据处理技术基础与应用(Hadoop+Spark)
许桂秋 孙海民 胡贵恒
大数据挖掘
大数据警务的崛起
(美)安德鲁.格思里.弗格森
大数据挖掘
大数据时代图书馆服务体系的创新与发展
程结晶
大数据挖掘
大数据观下的国家情报工作制度研究
马海群 等
大数据挖掘
大数据时代政府治理转型研究-(数字政府建设的江苏实践)
范炜烽等著
大数据挖掘
大数据环境下数字图书馆创新发展
金济
大数据挖掘
大数据背景下公众参与环境治理的程度评估与作用机制研究
史亚东
大数据挖掘
大数据医疗:从即时检测设备进行解析
(英)波利亚·阿梅里安,(英)特鲁迪·朗,(英)弗朗索瓦·范·洛格伦伯格
大数据挖掘
大数据可视化编程和应用
倪振松 胡煜华 朱家全 主编 谢岳富 陈建平 副主编
大数据挖掘
大数据思想政治教育模式构建研究(国家社科基金丛书—其他)
林晶 著