数据科学与大数据分析:数据的发现 分析 可视化与表示

数据科学与大数据分析:数据的发现 分析 可视化与表示
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] (EMC Education Services) , , ,
2016-07
版次: 1
ISBN: 9787115416377
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 356页
字数: 515千字
正文语种: 简体中文
原版书名: Data Science and Big Data Analytics
139人买过
  • 数据科学与大数据分析在当前是炙手可热的概念,关注的是如何通过分析海量数据来洞悉隐藏于数据背后的见解。本书是数据科学领域为数不多的实用性技术图书,它通过详细剖析数据分析生命周期的各个阶段来讲解用于发现、分析、可视化、表示数据的相关方法和技术。
    《数据科学与大数据分析——数据的发现 分析 可视化与表示》总共分为12章,主要内容包括大数据分析的简单介绍,数据分析生命周期的各个阶段,使用R语言进行基本的数据分析,以及高级的分析理论和方法,主要涉及数据的聚类、关联规则、回归、分类、时间序列分析、文本分析等方法。此外,本书还涵盖了用来进行高级数据分析所使用的技术和工具,比如MapReduce和Hadoop、数据库内分析等。
    《数据科学与大数据分析——数据的发现 分析 可视化与表示》内容详细,示例丰富,侧重于理论与练习的结合,因此比较适合对大数据分析、数据科学感兴趣的人员阅读,有志于成为数据科学家的读者也可以从本书中获益。 DavidDietrich是EMCEducationServices的数据科学教育团队的负责人,他领导着大数据分析和数据科学相关的课程、策略和课程开发工作。他参与编写了EMC数据科学课程的首门课程,以及两门额外的EMC课程(以向领导和管理人员讲授大数据和数据科学为主),而且还是本书的作者兼编辑。他在数据科学、数据隐私和云计算领域已经申请了14项专利。
    David曾指导若干所大学开设数据分析相关的课程项目,而且还经常在会议和行业活动中发表演讲。他还是波士顿地区几所大学的客座讲师。他的作品已被精选到包括福布斯杂志、哈佛商业评论以及由美国马萨诸塞州长DevalPatrick委托起草的2014马萨诸塞大数据报告等内在的主流出版物中。
    David在分析和技术领域已经浸淫了近20年。在其职业生涯中,他曾在多家财富500强公司工作过,出任多个与数据分析相关的职位,其中包括管理分析和运营团队,提供分析咨询服务,管理用于规范美国银行业的分析软件产品线,以及开发软件即服务(Software-as-a-Service)和Bl即服务(Bl-as-a-Service)的产品。此外,David还曾与美联储一起合作开发用于监控房产抵押贷款的预测模型。
    BarryHeller是EMCEducationServices的一名咨询技术教育顾问。Barry是大数据和数据科学新兴技术领域的课程开发人员和课程顾问。在此之前,Barry曾是一名顾问研究科学家,在EMC全面客户体验(TotalCustomerExperience)部门内发起并领导了许多与数据分析相关的项目。在其EMC职业生涯的早期,他负责管理统计工程团队,并负责企业资源企划(ERP)实施中的数据仓库工作。在加盟EMC之前,Barry在医疗诊断和技术公司担任过可靠性工程功能(ReliabilityEngineeringFunctions)的管理和分析角色。在此期间,他将其数量分析技能应用到了客户服务、工程、制造、销售/营销、金融和法律领域内的无数商业应用中。他强调与客户管理人员深入互动的重要性,他的许多成功案例不仅源自对分析的技术细节的关注,也源自针对分析结果会做出的决策的关注。Barry拥有罗彻斯特理工学院计算数学专业的本科学位,以及纽约州立大学新帕尔兹分校数学专业的硕士学位。
    BeibeiYang是EMCEducationServices的一名技术教育顾问,在EMC负责开发若干与数据科学和大数据分析相关的公开课程。Bebei在IT行业有7年的从业经验。在加盟EMC之前,她在一家财富500强公司先后担任过软件工程师、系统管理员和网络管理员等职位,并引入了多种提升效率和鼓励合作的新技术。Beibei曾在国际会议上发表过学术论文,并申请了多项专利。她在马萨诸塞大学卢维尔分校获得了计算机科学专业的博士学位。她专注于自然语言处理和数据挖掘,尤其是使用各种工具和技术来发现数据中隐藏的模式,以及用数据来讲故事。数据科学和大数据分析是一个令人振奋的领域。在这个领域,数字信息的潜力可以很大程度地用来帮助做出明智的商业决策。我们相信,无论是短期、中期还是长期来看,这一领域都将会吸引越来越多有才华的学生和专业人士投身其中。

    译者简介
    曹逾,于新加坡国立大学获得计算机博士学位,杰出大数据与机器学习专家,当前供职于EMC中国卓越研发集团首席技术官办公室,同时担任EMC中国研究院数据科学实验室主任,主要负责EMC大中华区大数据与数据科学方向的应用型研究以及创新解决方案研发,同时也负责EMC在亚太特别是中国大陆地区的高校科研合作项目。曹博士在SIGMOD、VLDB、ICDE、VLDBJournal等国际会议和期刊发表论文20余篇,并多次受邀担任国际会议和期刊审稿人,而且其相关研究成果在EMC内部产品及解决方案中得以广泛应用。曹博士拥有60余项美国及国际专利授权或申请。
    刘文苗,现任EMCIT第三平台高级项目经理,对大数据、存储系统、网络系统以及文件系统具有一定研究,还具有国内金融行业多年从业经验。刘先生曾经参与过上海证券交易所新一代交易系统、海通期货核心交易系统的设计与建设工作。
    李枫林,于上海交通大学获得软件工程硕士学位,曾在微软中国公司担任数据库工程师,现就职于EMC中国研发中心,担任SeniorSocialEngagementManager一职,主要负责EMC中文技术社区的运营与后台数据处理工作,近年来潜心钻研数据存储与大数据相关技术,曾在EMC中文社区及社交媒体上发表多篇大数据技术相关的文章。

    主审人员简介
    孙宇熙(RickySun),EMC中国研究院院长,在EMC主要负责大数据、软件定义的数据中心、云计算、超融合架构、高性能计算、高效存储等领域的研发、战略合作与创新等工作。
    Ricky有在硅谷和国内近20年的学习、工作、生活和创业的经验。Ricky既有在大型跨国公司(EMC、微软、Yahoo!)的工作经历,也有过往成功的创业经历,曾于2001年在美国加州硅谷地区创立WL科技公司并成功带领公司在2004年与香港Telewave集团合并。Ricky在混合云架构、大数据快数据处理与分析、软件定义存储等领域有着多年的国际领先的工作经验业界的影响力,并持有多项专利。Ricky在近年的专业著作有《程序员生存手册:面试篇》、《软件定义数据中心:技术与实践》等。 第1章  大数据分析介绍1

    1.1  大数据概述2

    1.1.1  数据结构4

    1.1.2  数据存储的分析视角9

    1.2  分析的实践状态10

    1.2.1  商业智能 VS 数据科学11

    1.2.2  当前分析架构12

    1.2.3  大数据的驱动力14

    1.2.4  新的大数据生态系统和新的分析方法15

    1.3  新的大数据生态系统中的关键角色17

    1.4  大数据分析案例20

    1.5  总结21

    1.6  练习21

    参考书目21

    第2章  数据分析生命周期23

    2.1  数据分析生命周期概述24

    2.1.1  一个成功分析项目的关键角色24

    2.1.2  数据分析生命周期的背景和概述26

    2.2  第1阶段:发现28

    2.2.1  学习业务领域29

    2.2.2  资源29

    2.2.3  设定问题30

    2.2.4  确定关键利益相关者30

    2.2.5  采访分析发起人31

    2.2.6  形成初始假设32

    2.2.7  明确潜在数据源32

    2.3  第2阶段:数据准备33

    2.3.1  准备分析沙箱34

    2.3.2  执行ETLT35

    2.3.3  研究数据36

    2.3.4  数据治理37

    2.3.5  调查和可视化37

    2.3.6  数据准备阶段的常用工具38

    2.4  第3阶段:模型规划39

    2.4.1  数据探索和变量选择40

    2.4.2  模型的选择41

    2.4.3  模型设计阶段的常用工具42

    2.5  第4阶段:模型建立42

    2.5.1  模型构建阶段中的常用工具44

    2.6  第5阶段:沟通结果45

    2.7  第6阶段:实施46

    2.8  案例研究:全球创新网络和分析(GINA)49

    2.8.1  第1阶段:发现50

    2.8.2  第2阶段:数据准备51

    2.8.3  第3阶段:模型规划51

    2.8.4  第4阶段:模型建立51

    2.8.5  第5阶段:沟通结果53

    2.8.6  第6阶段:实施54

    2.9  总结55

    2.10  练习55

    参考书目55

    第3章  使用R进行基本数据分析57

    3.1  R简介58

    3.1.1  R图形用户界面6
  • 内容简介:
    数据科学与大数据分析在当前是炙手可热的概念,关注的是如何通过分析海量数据来洞悉隐藏于数据背后的见解。本书是数据科学领域为数不多的实用性技术图书,它通过详细剖析数据分析生命周期的各个阶段来讲解用于发现、分析、可视化、表示数据的相关方法和技术。
    《数据科学与大数据分析——数据的发现 分析 可视化与表示》总共分为12章,主要内容包括大数据分析的简单介绍,数据分析生命周期的各个阶段,使用R语言进行基本的数据分析,以及高级的分析理论和方法,主要涉及数据的聚类、关联规则、回归、分类、时间序列分析、文本分析等方法。此外,本书还涵盖了用来进行高级数据分析所使用的技术和工具,比如MapReduce和Hadoop、数据库内分析等。
    《数据科学与大数据分析——数据的发现 分析 可视化与表示》内容详细,示例丰富,侧重于理论与练习的结合,因此比较适合对大数据分析、数据科学感兴趣的人员阅读,有志于成为数据科学家的读者也可以从本书中获益。
  • 作者简介:
    DavidDietrich是EMCEducationServices的数据科学教育团队的负责人,他领导着大数据分析和数据科学相关的课程、策略和课程开发工作。他参与编写了EMC数据科学课程的首门课程,以及两门额外的EMC课程(以向领导和管理人员讲授大数据和数据科学为主),而且还是本书的作者兼编辑。他在数据科学、数据隐私和云计算领域已经申请了14项专利。
    David曾指导若干所大学开设数据分析相关的课程项目,而且还经常在会议和行业活动中发表演讲。他还是波士顿地区几所大学的客座讲师。他的作品已被精选到包括福布斯杂志、哈佛商业评论以及由美国马萨诸塞州长DevalPatrick委托起草的2014马萨诸塞大数据报告等内在的主流出版物中。
    David在分析和技术领域已经浸淫了近20年。在其职业生涯中,他曾在多家财富500强公司工作过,出任多个与数据分析相关的职位,其中包括管理分析和运营团队,提供分析咨询服务,管理用于规范美国银行业的分析软件产品线,以及开发软件即服务(Software-as-a-Service)和Bl即服务(Bl-as-a-Service)的产品。此外,David还曾与美联储一起合作开发用于监控房产抵押贷款的预测模型。
    BarryHeller是EMCEducationServices的一名咨询技术教育顾问。Barry是大数据和数据科学新兴技术领域的课程开发人员和课程顾问。在此之前,Barry曾是一名顾问研究科学家,在EMC全面客户体验(TotalCustomerExperience)部门内发起并领导了许多与数据分析相关的项目。在其EMC职业生涯的早期,他负责管理统计工程团队,并负责企业资源企划(ERP)实施中的数据仓库工作。在加盟EMC之前,Barry在医疗诊断和技术公司担任过可靠性工程功能(ReliabilityEngineeringFunctions)的管理和分析角色。在此期间,他将其数量分析技能应用到了客户服务、工程、制造、销售/营销、金融和法律领域内的无数商业应用中。他强调与客户管理人员深入互动的重要性,他的许多成功案例不仅源自对分析的技术细节的关注,也源自针对分析结果会做出的决策的关注。Barry拥有罗彻斯特理工学院计算数学专业的本科学位,以及纽约州立大学新帕尔兹分校数学专业的硕士学位。
    BeibeiYang是EMCEducationServices的一名技术教育顾问,在EMC负责开发若干与数据科学和大数据分析相关的公开课程。Bebei在IT行业有7年的从业经验。在加盟EMC之前,她在一家财富500强公司先后担任过软件工程师、系统管理员和网络管理员等职位,并引入了多种提升效率和鼓励合作的新技术。Beibei曾在国际会议上发表过学术论文,并申请了多项专利。她在马萨诸塞大学卢维尔分校获得了计算机科学专业的博士学位。她专注于自然语言处理和数据挖掘,尤其是使用各种工具和技术来发现数据中隐藏的模式,以及用数据来讲故事。数据科学和大数据分析是一个令人振奋的领域。在这个领域,数字信息的潜力可以很大程度地用来帮助做出明智的商业决策。我们相信,无论是短期、中期还是长期来看,这一领域都将会吸引越来越多有才华的学生和专业人士投身其中。

    译者简介
    曹逾,于新加坡国立大学获得计算机博士学位,杰出大数据与机器学习专家,当前供职于EMC中国卓越研发集团首席技术官办公室,同时担任EMC中国研究院数据科学实验室主任,主要负责EMC大中华区大数据与数据科学方向的应用型研究以及创新解决方案研发,同时也负责EMC在亚太特别是中国大陆地区的高校科研合作项目。曹博士在SIGMOD、VLDB、ICDE、VLDBJournal等国际会议和期刊发表论文20余篇,并多次受邀担任国际会议和期刊审稿人,而且其相关研究成果在EMC内部产品及解决方案中得以广泛应用。曹博士拥有60余项美国及国际专利授权或申请。
    刘文苗,现任EMCIT第三平台高级项目经理,对大数据、存储系统、网络系统以及文件系统具有一定研究,还具有国内金融行业多年从业经验。刘先生曾经参与过上海证券交易所新一代交易系统、海通期货核心交易系统的设计与建设工作。
    李枫林,于上海交通大学获得软件工程硕士学位,曾在微软中国公司担任数据库工程师,现就职于EMC中国研发中心,担任SeniorSocialEngagementManager一职,主要负责EMC中文技术社区的运营与后台数据处理工作,近年来潜心钻研数据存储与大数据相关技术,曾在EMC中文社区及社交媒体上发表多篇大数据技术相关的文章。

    主审人员简介
    孙宇熙(RickySun),EMC中国研究院院长,在EMC主要负责大数据、软件定义的数据中心、云计算、超融合架构、高性能计算、高效存储等领域的研发、战略合作与创新等工作。
    Ricky有在硅谷和国内近20年的学习、工作、生活和创业的经验。Ricky既有在大型跨国公司(EMC、微软、Yahoo!)的工作经历,也有过往成功的创业经历,曾于2001年在美国加州硅谷地区创立WL科技公司并成功带领公司在2004年与香港Telewave集团合并。Ricky在混合云架构、大数据快数据处理与分析、软件定义存储等领域有着多年的国际领先的工作经验业界的影响力,并持有多项专利。Ricky在近年的专业著作有《程序员生存手册:面试篇》、《软件定义数据中心:技术与实践》等。
  • 目录:
    第1章  大数据分析介绍1

    1.1  大数据概述2

    1.1.1  数据结构4

    1.1.2  数据存储的分析视角9

    1.2  分析的实践状态10

    1.2.1  商业智能 VS 数据科学11

    1.2.2  当前分析架构12

    1.2.3  大数据的驱动力14

    1.2.4  新的大数据生态系统和新的分析方法15

    1.3  新的大数据生态系统中的关键角色17

    1.4  大数据分析案例20

    1.5  总结21

    1.6  练习21

    参考书目21

    第2章  数据分析生命周期23

    2.1  数据分析生命周期概述24

    2.1.1  一个成功分析项目的关键角色24

    2.1.2  数据分析生命周期的背景和概述26

    2.2  第1阶段:发现28

    2.2.1  学习业务领域29

    2.2.2  资源29

    2.2.3  设定问题30

    2.2.4  确定关键利益相关者30

    2.2.5  采访分析发起人31

    2.2.6  形成初始假设32

    2.2.7  明确潜在数据源32

    2.3  第2阶段:数据准备33

    2.3.1  准备分析沙箱34

    2.3.2  执行ETLT35

    2.3.3  研究数据36

    2.3.4  数据治理37

    2.3.5  调查和可视化37

    2.3.6  数据准备阶段的常用工具38

    2.4  第3阶段:模型规划39

    2.4.1  数据探索和变量选择40

    2.4.2  模型的选择41

    2.4.3  模型设计阶段的常用工具42

    2.5  第4阶段:模型建立42

    2.5.1  模型构建阶段中的常用工具44

    2.6  第5阶段:沟通结果45

    2.7  第6阶段:实施46

    2.8  案例研究:全球创新网络和分析(GINA)49

    2.8.1  第1阶段:发现50

    2.8.2  第2阶段:数据准备51

    2.8.3  第3阶段:模型规划51

    2.8.4  第4阶段:模型建立51

    2.8.5  第5阶段:沟通结果53

    2.8.6  第6阶段:实施54

    2.9  总结55

    2.10  练习55

    参考书目55

    第3章  使用R进行基本数据分析57

    3.1  R简介58

    3.1.1  R图形用户界面6
查看详情
相关图书 / 更多
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据新闻与信息可视化
周葆华;徐笛;崔迪
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据合规师概论
郑少华、商建刚
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据思维——从数据分析到商业价值(第2版)
王汉生
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据科学优化方法
孙怡帆
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据资产入表:理论与实务
赵治纲
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据处理技术与方法研究
付雯
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据治理 工业企业数字化转型之道 第2版
祝守宇
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据可视化Pyecharts探秘实践教程/新工科大数据专业群实践丛书
余先昊、袁华 编
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据标注工程——语言知识与应用
于东
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据可视化基础与应用
刘佳 许桂秋 李静雯
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据权利保护的模式与机制
余圣琪
数据科学与大数据分析:数据的发现 分析 可视化与表示
数据科学伦理:概念、技术和警世故事
[比利时]大卫·马滕斯(David;Martens
您可能感兴趣 / 更多
数据科学与大数据分析:数据的发现 分析 可视化与表示
孩子,把你的手给我1:怎么说孩子才爱听,怎么教孩子才肯学?帮助每一位3-12岁孩子的父母结束与孩子的所有冲突!
[美]海姆·G.吉诺特
数据科学与大数据分析:数据的发现 分析 可视化与表示
怎样做成大事
[美]丹·加德纳(Dan Gardner) 著;贾拥民 译;湛庐文化 出品;[丹麦]傅以斌(Bent Flyvbjerg)
数据科学与大数据分析:数据的发现 分析 可视化与表示
1200年希腊罗马神话
[美]伊迪丝·汉密尔顿
数据科学与大数据分析:数据的发现 分析 可视化与表示
爱情心理学(新编本)
[美]罗伯特·J. 斯腾伯格 (美)凯琳·斯腾伯格 倪爱萍 译
数据科学与大数据分析:数据的发现 分析 可视化与表示
黄金圈法则
[美]西蒙·斯涅克 著;磨铁文化 出品
数据科学与大数据分析:数据的发现 分析 可视化与表示
汤姆·索亚历险记 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]马克 吐温
数据科学与大数据分析:数据的发现 分析 可视化与表示
富兰克林自传 名家全译本 改变无数人命运的励志传奇 埃隆马斯克反复推荐 赠富兰克林签名照及精美插图
[美]本杰明·富兰克林 著;李自修 译
数据科学与大数据分析:数据的发现 分析 可视化与表示
意大利文艺复兴新艺术史
[美]迈克尔·韦恩·科尔 著;[美]斯蒂芬·J·坎贝尔;邵亦杨
数据科学与大数据分析:数据的发现 分析 可视化与表示
汤姆素亚历险记:中小学生课外阅读快乐读书吧 儿童文学无障碍有声伴读世界名著童话故事
[美]马克·吐温
数据科学与大数据分析:数据的发现 分析 可视化与表示
老人与海 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]海明威
数据科学与大数据分析:数据的发现 分析 可视化与表示
养育的觉醒:全面激发孩子自驱力,教你如何心平气和做妈妈
[美]凯文·莱曼 著;唐晓璐 译;斯坦威 出品
数据科学与大数据分析:数据的发现 分析 可视化与表示
国际大奖图画书系列 共11册(小老鼠的恐惧的大书,大灰狼,红豆与菲比,别烦我,下雪了 ,穿靴子的猫 ,先有蛋,绿 ,特别快递,如果你想看鲸鱼 ,一个部落的孩子 ) 麦克米伦世纪
[美]莱恩·史密斯 (英)埃米莉·格雷维特 (美)劳拉·瓦卡罗·等/文 (英)埃米莉·格雷维特 等/图 彭懿 杨玲玲 阿甲 孙慧阳 白薇 译