大数据:战略·技术·实践

大数据:战略·技术·实践
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: , ,
2013-05
版次: 1
ISBN: 9787121202650
定价: 56.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 320页
字数: 518千字
正文语种: 简体中文
66人买过
  •   《大数据:战略·技术·实践》从实际技术解决方案出发,提出了大数据技术四层架构,即:基础设施层、管理层、分析层、应用层。在此基础上,全面剖析了当前大数据领域中的主流技术,并配以行业应用实例和一线研发人员的独到见解。力求使读者能够通过阅读此书,全面了解当前大数据技术动态和发展趋势,并可针对自己面临的大数据问题找到可行的解决方案。
      《大数据:战略·技术·实践》是一本不错的技术普及读物。可作为软件开发者、数据存储处理工程师、数据分析师等工程技术人员的参考书,亦可作为高等学校相关专业课程的教材或参考书。 周宝曜,博士,现任EMC中国研究院数据科学实验塞主任,资深主任研究员。新加坡南洋理工大学计算机工程博士,清华大学学士和硕士。主要从事大数据相关的蕾理集构和分析挖掘算法的研究。曾就职于惠普中国研究院和IBM中国研究院。已发表国际学术论文30余篇,并拥有4项美国专利和多项中国专利。

    刘伟,博士,现任EMC北京研发中心总经理、EMC中国研究院院长。此前蕾任思辩大中华区高级副总裁、中国研发中心高级总监。惠蕾中国研究院院长等职务。现担任CCF高级会员,中国电子学会云计算专家委员会委员,中国计算机学会大数据专家委员会委员等社会职务。美国科罗拉多州立大掌电子工程与计算机科学博士,南开大学电子学及物理学本科及硕士。

    范承工,博士,是VMware中国研发中心和EMC中国卓越研发集团的创始人,现任VMware全球高级副总裁,负责领导VMware应用存储与数据产品的全球研发团队。加州理工学院电子工程硕士和博士,纽约古柏联舍学院电子工程学士。国际知名分布式系统和网络存储技术专家。曾是Rainfinity公司联台创始人之一,任首席技术官。 第一部分 大数据技术概览
    第1章 概述
    1.1 什么是大数据
    1.1.1 大数据的定义及特征
    1.1.2 大数据结构类型
    1.1.3 大数据实例
    1.2 大数据发展史
    1.3 大数据技术架构
    1.4 机遇与挑战
    参考文献
    第2章 大数据应用
    2.1 大数据驱动新应用
    2.1.1 大数据生态系统
    2.1.2 新的业务应用
    2.2 行业应用实例
    2.2.1 奥巴马的大数据
    2.2.2 预测犯罪
    2.2.3 数据让游戏更精彩
    2.2.4 智能交通
    2.2.5 大学教育
    2.2.6 大数据的姻缘
    2.2.7 传媒出版
    参考文献
    第3章 大数据基础设施
    3.1 云端大数据
    3.1.1 云基础设施
    3.1.2 虚拟化的三驾马车
    3.1.3 云安全和云平台
    3.2 计算虚拟化
    3.2.1 基本概念
    3.2.2 从部分虚拟化到全虚拟化
    3.2.3 处理器(CPU)的虚拟化
    3.2.4 内存(Memory)的虚拟化
    3.3 大数据存储
    3.3.1 传统存储系统时代的简单回顾
    3.3.2 大数据时代的新挑战
    3.3.3 分布式存储及其案例
    3.3.4 云存储及其存储虚拟化
    3.3.5 大数据存储的其他需求及其特点
    3.4 网络虚拟化
    3.4.1 网卡虚拟化
    3.4.2 虚拟交换机(Virtual Switch)
    3.4.3 接入层的虚拟化
    3.4.4 覆盖网络虚拟化(NetworkVirtualization Overlay)
    3.4.5 软件定义的网络(SDN)
    3.4.6 对大数据处理的意义
    3.5 基础架构的安全:云环境中面临的新的安全挑战
    3.5.1 计算资源方面的安全和挑战
    3.5.2 存储方面的安全和挑战
    3.5.3 网络方面的安全和挑战
    3.6 大数据时代的云服务
    3.6.1 大数据与基础设施即服务
    3.6.2 亚马逊云计算服务的解决方案
    3.6.3 OpenStack解决方案
    3.6.4 大数据与应用平台即服务
    参考文献
    第4章 大数据管理
    4.1 大数据事务处理(OLTP)
    4.1.1 NoSQL
    4.1.2 NewSQL
    4.2 大数据分析处理(OLAP)
    4.2.1 分布式大规模批量处理(MapReduce / Hadoop)
    4.2.2 MPP数据库
    4.3 流数据管理
    4.3.1 流数据管理简介
    4.3.2 复杂事件处理简介
    4.3.3 复杂事件处理软件Esper介绍
    4.3.4 大数据流处理
    4.3.5 大数据摄取与处理
    参考文献
    第5章 大数据分析
    5.1 数据分析的演变与现状
    5.1.1 数据分析的商业驱动力
    5.1.2 面向分析的数据环境的演变
    5.1.3 传统分析架构
    5.2 大数据分析平台
    5.2.1 大数据分析平台的要点
    5.2.2 大数据分析平台实例:Cetas
    5.3 高级分析理论与方法
    5.3.1 聚类分析
    5.3.2 关联规则
    5.3.3 回归和分类预测
    5.4 数据可视化
    5.4.1 数据可视化基础
    5.4.2 用数据讲故事
    5.4.3 数据可视化的模式
    5.4.4 数据可视化工具基础
    5.4.5 大数据的可视化
    参考文献
    第6章 数据科学与数据科学家
    6.1 商业智能vs数据科学
    6.2 数据科学家
    6.2.1 大数据生态系统中的关键角色
    6.2.2 数据科学家的特质
    6.3 数据分析生命周期模型
    6.3.1 模型概述
    6.3.2 阶段1:探索发现
    6.3.3 阶段2:数据准备
    6.3.4 阶段3:模型规划
    6.3.5 阶段4:模型建造
    6.3.6 阶段5:沟通结果
    6.3.7 阶段6:项目实施
    6.4 使用范例:企业创新分析
    6.4.1 阶段1:探索发现
    6.4.2 阶段2:数据准备
    6.4.3 阶段3:模型规划
    6.4.4 阶段4:模型建造
    6.4.5 阶段5:沟通结果
    6.4.6 阶段6:项目实施
    参考文献
    第二部分 大数据解决方案范例
    第7章 医疗大数据解决方案
    7.1 医疗信息化
    7.1.1 全球医疗信息化历史回顾
    7.1.2 我国医疗信息化发展趋势
    7.2 医疗数据综述
    7.2.1 医疗数据的大数据特性
    7.2.2 医疗大数据挑战和机遇
    7.3 医疗大数据基础架构
    7.3.1 建设原则
    7.3.2 面向医疗大数据的信息基础架构方案
    7.4 医疗大数据分析
    7.4.1 医疗云的兴起
    7.4.2 医疗云上的大数据
    7.4.3 医疗大数据分析解决方案
    7.5 医疗大数据的展望
    参考文献
    第8章 物联网大数据解决方案
    8.1 物联网
    8.1.1 物联网的概念
    8.1.2 物联网技术
    8.1.3 物联网数据
    8.1.4 物联网的机遇和挑战
    8.1.5 物联网应用实例
    8.2 应用行业背景
    8.2.1 脱硫系统的必要性
    8.2.2 脱硫系统工作原理
    8.2.3 大数据时代的数据挖掘
    8.3 参数分析
    8.3.1 火电厂的大数据
    8.3.2 脱硫相关参数
    8.4 优化目标
    8.4.1 脱硫参数优化
    8.4.2 目标成本优化
    8.5 优化方法
    8.5.1 基于数据的理论与方法
    8.5.2 最优化脱硫系统可调参数
    8.5.3 最小化脱硫系统成本
    8.6 数据相关问题
    8.6.1 主要监控参数
    8.6.2 业务相关假设
    8.6.3 数据中存在的问题
    8.7 优化目标1: 脱硫运行参数最优目标值挖掘
    8.7.1 数据分布直方图
    8.7.2 基于历史数据的工况划分
    8.7.3 FCM与模糊关联规则挖掘最优可调参数
    8.8 优化目标2: 最优目标成本计算
    8.8.1 增压风机用电成本估计
    8.8.2 石灰石成本函数
    8.9 实现简介
    8.9.1 基于HBase的数据模型
    8.9.2 对Mahout的改进
    8.1 总结
    参考文献
    第9章 移动平台大数据解决方案
    9.1 移动平台的大数据挑战
    9.2 Instagram案例研究
    9.2.1 面临的挑战
    9.2.2 解决方案
    9.3 Mobile Back-end as a Service基础
    9.4 MBaaS提供商案例研究
    9.5 基于PaaS的MBaaS大数据解决方案
    参考文献
    第10章 社交网站大数据解决方案
    10.1 大数据时代社交网站面临的挑战
    10.2 Twitter解决方案
    10.2.1 Twitter在线部分大数据解决方案
    10.2.2 Twitter离线部分大数据解决方案
    10.3 LinkedIn解决方案
    10.4 Facebook解决方案
    10.5 国内社交网络解决方案
    10.5.1 腾讯大数据解决方案
    10.5.2 新浪微博大数据解决方案
    参考文献
    第11章 大数据未来展望
    11.1 大数据发展趋势
    11.2 新的机遇与挑战
    参考文献
  • 内容简介:
      《大数据:战略·技术·实践》从实际技术解决方案出发,提出了大数据技术四层架构,即:基础设施层、管理层、分析层、应用层。在此基础上,全面剖析了当前大数据领域中的主流技术,并配以行业应用实例和一线研发人员的独到见解。力求使读者能够通过阅读此书,全面了解当前大数据技术动态和发展趋势,并可针对自己面临的大数据问题找到可行的解决方案。
      《大数据:战略·技术·实践》是一本不错的技术普及读物。可作为软件开发者、数据存储处理工程师、数据分析师等工程技术人员的参考书,亦可作为高等学校相关专业课程的教材或参考书。
  • 作者简介:
    周宝曜,博士,现任EMC中国研究院数据科学实验塞主任,资深主任研究员。新加坡南洋理工大学计算机工程博士,清华大学学士和硕士。主要从事大数据相关的蕾理集构和分析挖掘算法的研究。曾就职于惠普中国研究院和IBM中国研究院。已发表国际学术论文30余篇,并拥有4项美国专利和多项中国专利。

    刘伟,博士,现任EMC北京研发中心总经理、EMC中国研究院院长。此前蕾任思辩大中华区高级副总裁、中国研发中心高级总监。惠蕾中国研究院院长等职务。现担任CCF高级会员,中国电子学会云计算专家委员会委员,中国计算机学会大数据专家委员会委员等社会职务。美国科罗拉多州立大掌电子工程与计算机科学博士,南开大学电子学及物理学本科及硕士。

    范承工,博士,是VMware中国研发中心和EMC中国卓越研发集团的创始人,现任VMware全球高级副总裁,负责领导VMware应用存储与数据产品的全球研发团队。加州理工学院电子工程硕士和博士,纽约古柏联舍学院电子工程学士。国际知名分布式系统和网络存储技术专家。曾是Rainfinity公司联台创始人之一,任首席技术官。
  • 目录:
    第一部分 大数据技术概览
    第1章 概述
    1.1 什么是大数据
    1.1.1 大数据的定义及特征
    1.1.2 大数据结构类型
    1.1.3 大数据实例
    1.2 大数据发展史
    1.3 大数据技术架构
    1.4 机遇与挑战
    参考文献
    第2章 大数据应用
    2.1 大数据驱动新应用
    2.1.1 大数据生态系统
    2.1.2 新的业务应用
    2.2 行业应用实例
    2.2.1 奥巴马的大数据
    2.2.2 预测犯罪
    2.2.3 数据让游戏更精彩
    2.2.4 智能交通
    2.2.5 大学教育
    2.2.6 大数据的姻缘
    2.2.7 传媒出版
    参考文献
    第3章 大数据基础设施
    3.1 云端大数据
    3.1.1 云基础设施
    3.1.2 虚拟化的三驾马车
    3.1.3 云安全和云平台
    3.2 计算虚拟化
    3.2.1 基本概念
    3.2.2 从部分虚拟化到全虚拟化
    3.2.3 处理器(CPU)的虚拟化
    3.2.4 内存(Memory)的虚拟化
    3.3 大数据存储
    3.3.1 传统存储系统时代的简单回顾
    3.3.2 大数据时代的新挑战
    3.3.3 分布式存储及其案例
    3.3.4 云存储及其存储虚拟化
    3.3.5 大数据存储的其他需求及其特点
    3.4 网络虚拟化
    3.4.1 网卡虚拟化
    3.4.2 虚拟交换机(Virtual Switch)
    3.4.3 接入层的虚拟化
    3.4.4 覆盖网络虚拟化(NetworkVirtualization Overlay)
    3.4.5 软件定义的网络(SDN)
    3.4.6 对大数据处理的意义
    3.5 基础架构的安全:云环境中面临的新的安全挑战
    3.5.1 计算资源方面的安全和挑战
    3.5.2 存储方面的安全和挑战
    3.5.3 网络方面的安全和挑战
    3.6 大数据时代的云服务
    3.6.1 大数据与基础设施即服务
    3.6.2 亚马逊云计算服务的解决方案
    3.6.3 OpenStack解决方案
    3.6.4 大数据与应用平台即服务
    参考文献
    第4章 大数据管理
    4.1 大数据事务处理(OLTP)
    4.1.1 NoSQL
    4.1.2 NewSQL
    4.2 大数据分析处理(OLAP)
    4.2.1 分布式大规模批量处理(MapReduce / Hadoop)
    4.2.2 MPP数据库
    4.3 流数据管理
    4.3.1 流数据管理简介
    4.3.2 复杂事件处理简介
    4.3.3 复杂事件处理软件Esper介绍
    4.3.4 大数据流处理
    4.3.5 大数据摄取与处理
    参考文献
    第5章 大数据分析
    5.1 数据分析的演变与现状
    5.1.1 数据分析的商业驱动力
    5.1.2 面向分析的数据环境的演变
    5.1.3 传统分析架构
    5.2 大数据分析平台
    5.2.1 大数据分析平台的要点
    5.2.2 大数据分析平台实例:Cetas
    5.3 高级分析理论与方法
    5.3.1 聚类分析
    5.3.2 关联规则
    5.3.3 回归和分类预测
    5.4 数据可视化
    5.4.1 数据可视化基础
    5.4.2 用数据讲故事
    5.4.3 数据可视化的模式
    5.4.4 数据可视化工具基础
    5.4.5 大数据的可视化
    参考文献
    第6章 数据科学与数据科学家
    6.1 商业智能vs数据科学
    6.2 数据科学家
    6.2.1 大数据生态系统中的关键角色
    6.2.2 数据科学家的特质
    6.3 数据分析生命周期模型
    6.3.1 模型概述
    6.3.2 阶段1:探索发现
    6.3.3 阶段2:数据准备
    6.3.4 阶段3:模型规划
    6.3.5 阶段4:模型建造
    6.3.6 阶段5:沟通结果
    6.3.7 阶段6:项目实施
    6.4 使用范例:企业创新分析
    6.4.1 阶段1:探索发现
    6.4.2 阶段2:数据准备
    6.4.3 阶段3:模型规划
    6.4.4 阶段4:模型建造
    6.4.5 阶段5:沟通结果
    6.4.6 阶段6:项目实施
    参考文献
    第二部分 大数据解决方案范例
    第7章 医疗大数据解决方案
    7.1 医疗信息化
    7.1.1 全球医疗信息化历史回顾
    7.1.2 我国医疗信息化发展趋势
    7.2 医疗数据综述
    7.2.1 医疗数据的大数据特性
    7.2.2 医疗大数据挑战和机遇
    7.3 医疗大数据基础架构
    7.3.1 建设原则
    7.3.2 面向医疗大数据的信息基础架构方案
    7.4 医疗大数据分析
    7.4.1 医疗云的兴起
    7.4.2 医疗云上的大数据
    7.4.3 医疗大数据分析解决方案
    7.5 医疗大数据的展望
    参考文献
    第8章 物联网大数据解决方案
    8.1 物联网
    8.1.1 物联网的概念
    8.1.2 物联网技术
    8.1.3 物联网数据
    8.1.4 物联网的机遇和挑战
    8.1.5 物联网应用实例
    8.2 应用行业背景
    8.2.1 脱硫系统的必要性
    8.2.2 脱硫系统工作原理
    8.2.3 大数据时代的数据挖掘
    8.3 参数分析
    8.3.1 火电厂的大数据
    8.3.2 脱硫相关参数
    8.4 优化目标
    8.4.1 脱硫参数优化
    8.4.2 目标成本优化
    8.5 优化方法
    8.5.1 基于数据的理论与方法
    8.5.2 最优化脱硫系统可调参数
    8.5.3 最小化脱硫系统成本
    8.6 数据相关问题
    8.6.1 主要监控参数
    8.6.2 业务相关假设
    8.6.3 数据中存在的问题
    8.7 优化目标1: 脱硫运行参数最优目标值挖掘
    8.7.1 数据分布直方图
    8.7.2 基于历史数据的工况划分
    8.7.3 FCM与模糊关联规则挖掘最优可调参数
    8.8 优化目标2: 最优目标成本计算
    8.8.1 增压风机用电成本估计
    8.8.2 石灰石成本函数
    8.9 实现简介
    8.9.1 基于HBase的数据模型
    8.9.2 对Mahout的改进
    8.1 总结
    参考文献
    第9章 移动平台大数据解决方案
    9.1 移动平台的大数据挑战
    9.2 Instagram案例研究
    9.2.1 面临的挑战
    9.2.2 解决方案
    9.3 Mobile Back-end as a Service基础
    9.4 MBaaS提供商案例研究
    9.5 基于PaaS的MBaaS大数据解决方案
    参考文献
    第10章 社交网站大数据解决方案
    10.1 大数据时代社交网站面临的挑战
    10.2 Twitter解决方案
    10.2.1 Twitter在线部分大数据解决方案
    10.2.2 Twitter离线部分大数据解决方案
    10.3 LinkedIn解决方案
    10.4 Facebook解决方案
    10.5 国内社交网络解决方案
    10.5.1 腾讯大数据解决方案
    10.5.2 新浪微博大数据解决方案
    参考文献
    第11章 大数据未来展望
    11.1 大数据发展趋势
    11.2 新的机遇与挑战
    参考文献
查看详情