实用机器学习

实用机器学习
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: (Sunila Gollapudi) ,
2018-06
版次: 1
ISBN: 9787111598886
定价: 79.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 267页
2人买过
  • 本书探索了一系列广泛应用的机器学习技术,用实际例子揭示了常见数据中隐藏的处理技巧和窍门。本书还探讨了机器学习的前沿进展,提供了一些关于深度学习和强化学习的范例和指导原则,完美演绎了实操过程及算法原理。本书的目标读者为那些想了解机器学习实践通过机器学习技术解决现实应用的数据科学家。 关 于 作 者Sunila Gollapudi 担任Broadridge金融解决方案(印度)有限公司的技术副总裁。该公司是美国Broadridge金融解决方案公司的全资子公司(BR)。她在IT服务领域拥有14年的丰富实践经验。她目前负责印度卓越架构中心,是大数据和数据科学计划的领军人物。 

     
        加入Broadridge之前,她在全球性领先机构担任重要职位,专门从事Java、分布式架构、大数据技术、高级分析、机器学习、语义技术和数据集成工具等领域的研发工作。Sunila是Broadridge在全球技术领导和创新论坛的理事,近在IEEE的工作是研究语义技术及其在业务数据湖中的作用。全球科技领域瞬息万变,新的技术层出不穷,Sunila的个人优势在于其密切关注并持续跟进全球科技,统上领下,串联前后,实现业务交付的具体架构方案。她从计算机科学专业研究生毕业后的一本出版著作是关于大数据数据仓库解决方案Greenplum的,书名为《Getting Started with Greenplum for Big Data Analytics》(Packt出版社)。她有自己的孩子和家庭,此外她是一名享誉国内外的印度古典舞蹈家,还是一位画家。 

     
        致谢首先,我要向Broadridge金融解决方案(印度)有限公司致以诚挚的谢意,感谢他们为我提供了一个追求技术的平台。 

     
        衷心感谢我的导师和公司董事总经理Laxmikanth V对我一如继往的支持,并撰写了推荐序。感谢国际工程学院(INSOFE)总裁Dakshinamurthy Kolluru博士发现了我对机器学习的热情。此外,还要感谢我的企业架构导师、Canopus咨询公司创始人兼首席架构师Nagaraju Pappu先生。 

     
        在此要特别感谢Packt出版社给我这个著书立作的机会,以及在本书的出版发行中提供的全程支持。这是我们合作出版的第二本书,能与极富专业精神的出版界人士和评审专家合作让我倍感荣幸。 

     
        感谢我的丈夫、家人和朋友一如既往的支持。我愧对的是可爱懂事的女儿Sai Nikita,在本书的编写过程中她和我一样心怀喜悦,但愿每天能有超过24小时陪她一起度过! 

     
        后,拙作献给技术领域所有不安分守己的大脑,是他们不懈追求,创新进取,才让人们的生活更加美好,更加精彩纷呈。 

    目录 

     
    推荐序 

     
    推荐序二 

     
    译者序 

     
    前言 

     
    关于作者 

     
    关于审校者 

     
    第1章机器学习简介 

     
    1.1机器学习 

     
    1.1.1定义 

     
    1.1.2核心概念与术语 

     
    1.1.3什么是学习 

     
    1.1.4机器学习中的数据不一致性 

     
    1.1.5机器学习实践范例 

     
    1.1.6机器学习问题类型 

     
    1.2性能度量 

     
    1.3机器学习的相关领域 

     
    1.3.1数据挖掘 

     
    1.3.2人工智能 

     
    1.3.3统计学习 

     
    1.3.4数据科学 

     
    1.4机器学习处理流程及解决方案架构 

     
    1.5机器学习算法 

     
    1.5.1基于决策树的算法 

     
    1.5.2基于贝叶斯的算法 

     
    1.5.3基于核方法的算法 

     
    1.5.4聚类算法 

     
    1.5.5人工神经网络 

     
    1.5.6降维方法 

     
    1.5.7集成方法 

     
    1.5.8基于实例的算法 

     
    1.5.9基于回归分析的算法 

     
    1.5.10基于关联规则的算法 

     
    1.6机器学习工具与框架 

     
    1.7小结 

     
    第2章机器学习和大规模数据集 

     
    2.1大数据和大规模机器学习 

     
    2.1.1功能与架构:方法论的失配 

     
    2.1.2机器学习的可扩展性和性能 

     
    2.1.3模型选择过程 

     
    2.1.4大规模机器学习的潜在问题 

     
    2.2算法和并发 

     
    2.3垂直扩展的机器学习技术方案 

     
    2.3.1MapReduce编程架构 

     
    2.3.2利用消息传递接口进行高性能计算 

     
    2.3.3LINQ框架 

     
    2.3.4使用LINQ操作数据集 

     
    2.3.5GPU 

     
    2.3.6FPGA 

     
    2.3.7多核或多处理器系统 

     
    2.4小结 

     
    第3章Hadoop架构和生态系统简介 

     
    3.1Apache Hadoop简介 

     
    3.1.1Hadoop的演化 

     
    3.1.2Hadoop及其核心要素 

     
    3.2基于Hadoop的大数据机器学习解决方案架构 

     
    3.2.1数据源层 

     
    3.2.2数据摄入层 

     
    3.2.3Hadoop数据存储层 

     
    3.2.4Hadoop基础设施层 

     
    3.2.5Hadoop平台/处理层 

     
    3.2.6分析层 

     
    3.2.7数据消费层 

     
    3.2.8MapReduce 

     
    3.3Hadoop 2.x 

     
    3.3.1Hadoop生态系统组件 

     
    3.3.2Hadoop安装和配置 

     
    3.3.3Hadoop发行版和供应商 

     
    3.4小结 

     
    第4章机器学习工具、库及框架 

     
    4.1机器学习工具概览 

     
    4.2Apache Mahout 

     
    4.2.1Mahout如何工作 

     
    4.2.2安装和设置Apache Mahout 

     
    4.2.3Mahout软件包详解 

     
    4.2.4Mahout中的vector实现 

     
    4.3R 

     
    4.3.1安装和设置R 

     
    4.3.2R与Apache Hadoop集成 

     
    4.4Julia 

     
    4.4.1安装和设置Julia 

     
    4.4.2在命令行中执行Julia程序 

     
    4.4.3例解Julia 

     
    4.4.4变量与赋值 

     
    4.4.5使用Julia的好处 

     
    4.4.6Julia与Hadoop集成 

     
    4.5Python 

     
    4.5.1Python中工具包的选择 

     
    4.5.2例解Python 

     
    4.6Apache Spark 

     
    4.6.1Scala 

     
    4.6.2RDD编程 

     
    4.7Spring XD 

     
    4.8小结 

     
    第5章基于决策树的学习 

     
    5.1决策树 

     
    5.1.1术语 

     
    5.1.2目标与用途 

     
    5.1.3构造决策树 

     
    5.1.4特殊的决策树 

     
    5.2实现决策树 

     
    5.3小结 

     
    第6章基于实例和核方法的学习 

     
    6.1基于实例的学习 

     
    6.1.1最近邻 

     
    6.1.2实现kNN 

     
    6.2基于核方法的学习 

     
    6.2.1核函数 

     
    6.2.2支持向量机 

     
    6.2.3实现SVM 

     
    6.3小结 

     
    第7章关联规则学习 

     
    7.1关联规则学习 

     
    7.1.1关联规则的定义 

     
    7.1.2Apriori算法 

     
    7.1.3FPgrowth算法 

     
    7.1.4Apriori与FPgrowth 

     
    7.2实现Apriori及FPgrowth算法 

     
    7.3小结 

     
    第8章聚类学习 

     
    8.1聚类学习 

     
    8.2聚类的类型 

     
    8.2.1层次聚类 

     
    8.2.2划分式聚类 

     
    8.3kmeans聚类算法 

     
    8.3.1kmeans算法的收敛性 

     
    8.3.2kmeans算法的优点 

     
    8.3.3kmeans算法的缺点 

     
    8.3.4距离度量 

     
    8.3.5复杂度度量 

     
    8.4实现kmeans聚类 

     
    8.5小结 

     
    第9章贝叶斯学习 

     
    9.1贝叶斯学习 

     
    9.1.1统计学家的视角 

     
    9.1.2贝叶斯定理 

     
    9.1.3朴素贝叶斯分类器 

     
    9.2实现朴素贝叶斯算法 

     
    9.3小结 

     
    第10章基于回归的学习 

     
    10.1回归分析 

     
    10.1.1重温统计学 

     
    10.1.2混杂 

     
    10.1.3效应修饰 

     
    10.2回归方法 

     
    10.2.1简单线性回归 

     
    10.2.2多元线性回归 

     
    10.2.3多项式回归 

     
    10.2.4广义线性模型 

     
    10.2.5逻辑回归(logit连接) 

     
    10.2.6泊松回归 

     
    10.3实现线性回归和逻辑回归 

     
    10.4小结 

     
    第11章深度学习 

     
    11.1背景知识 

     
    11.1.1人类大脑结构 

     
    11.1.2神经网络 

     
    11.1.3反向传播算法 

     
    11.1.4Softmax回归算法 

     
    11.2深度学习类型 

     
    11.2.1卷积神经网络 

     
    11.2.2循环神经网络 

     
    11.2.3受限玻尔兹曼机 

     
    11.2.4深度玻尔兹曼机 

     
    11.2.5自动编码器 

     
    11.3实现ANN和深度学习方法 

     
    11.4小结 

     
    第12章强化学习 

     
    12.1强化学习 

     
    12.1.1强化学习的背景知识 

     
    12.1.2强化学习的主要特点 

     
    12.2强化学习算法 

     
    12.2.1动态规划 

     
    12.2.2蒙特卡罗方法 

     
    12.2.3时序差分学习 

     
    12.2.4Qlearning(异策略TD) 

     
    12.2.5actorcritic方法(同策略) 

     
    12.2.6Rlearning(异策略) 

     
    12.3实现强化学习方法 

     
    12.4小结 

     
    第13章集成学习 

     
    13.1集成学习方法 

     
    13.1.1群体智慧 

     
    13.1.2经典应用 

     
    13.1.3集成方法 

     
    13.2实现集成学习方法 

     
    13.3小结 

     
    第14章下一代机器学习数据架构 

     
    14.1数据架构的演进 

     
    14.2机器学习的现代数据架构 

     
    14.2.1语义数据架构 

     
    14.2.2多模型数据库架构/混合持久化 

     
    14.2.3Lambda架构 

     
    14.3小结 

  • 内容简介:
    本书探索了一系列广泛应用的机器学习技术,用实际例子揭示了常见数据中隐藏的处理技巧和窍门。本书还探讨了机器学习的前沿进展,提供了一些关于深度学习和强化学习的范例和指导原则,完美演绎了实操过程及算法原理。本书的目标读者为那些想了解机器学习实践通过机器学习技术解决现实应用的数据科学家。
  • 作者简介:
    关 于 作 者Sunila Gollapudi 担任Broadridge金融解决方案(印度)有限公司的技术副总裁。该公司是美国Broadridge金融解决方案公司的全资子公司(BR)。她在IT服务领域拥有14年的丰富实践经验。她目前负责印度卓越架构中心,是大数据和数据科学计划的领军人物。 

     
        加入Broadridge之前,她在全球性领先机构担任重要职位,专门从事Java、分布式架构、大数据技术、高级分析、机器学习、语义技术和数据集成工具等领域的研发工作。Sunila是Broadridge在全球技术领导和创新论坛的理事,近在IEEE的工作是研究语义技术及其在业务数据湖中的作用。全球科技领域瞬息万变,新的技术层出不穷,Sunila的个人优势在于其密切关注并持续跟进全球科技,统上领下,串联前后,实现业务交付的具体架构方案。她从计算机科学专业研究生毕业后的一本出版著作是关于大数据数据仓库解决方案Greenplum的,书名为《Getting Started with Greenplum for Big Data Analytics》(Packt出版社)。她有自己的孩子和家庭,此外她是一名享誉国内外的印度古典舞蹈家,还是一位画家。 

     
        致谢首先,我要向Broadridge金融解决方案(印度)有限公司致以诚挚的谢意,感谢他们为我提供了一个追求技术的平台。 

     
        衷心感谢我的导师和公司董事总经理Laxmikanth V对我一如继往的支持,并撰写了推荐序。感谢国际工程学院(INSOFE)总裁Dakshinamurthy Kolluru博士发现了我对机器学习的热情。此外,还要感谢我的企业架构导师、Canopus咨询公司创始人兼首席架构师Nagaraju Pappu先生。 

     
        在此要特别感谢Packt出版社给我这个著书立作的机会,以及在本书的出版发行中提供的全程支持。这是我们合作出版的第二本书,能与极富专业精神的出版界人士和评审专家合作让我倍感荣幸。 

     
        感谢我的丈夫、家人和朋友一如既往的支持。我愧对的是可爱懂事的女儿Sai Nikita,在本书的编写过程中她和我一样心怀喜悦,但愿每天能有超过24小时陪她一起度过! 

     
        后,拙作献给技术领域所有不安分守己的大脑,是他们不懈追求,创新进取,才让人们的生活更加美好,更加精彩纷呈。 

  • 目录:
    目录 

     
    推荐序 

     
    推荐序二 

     
    译者序 

     
    前言 

     
    关于作者 

     
    关于审校者 

     
    第1章机器学习简介 

     
    1.1机器学习 

     
    1.1.1定义 

     
    1.1.2核心概念与术语 

     
    1.1.3什么是学习 

     
    1.1.4机器学习中的数据不一致性 

     
    1.1.5机器学习实践范例 

     
    1.1.6机器学习问题类型 

     
    1.2性能度量 

     
    1.3机器学习的相关领域 

     
    1.3.1数据挖掘 

     
    1.3.2人工智能 

     
    1.3.3统计学习 

     
    1.3.4数据科学 

     
    1.4机器学习处理流程及解决方案架构 

     
    1.5机器学习算法 

     
    1.5.1基于决策树的算法 

     
    1.5.2基于贝叶斯的算法 

     
    1.5.3基于核方法的算法 

     
    1.5.4聚类算法 

     
    1.5.5人工神经网络 

     
    1.5.6降维方法 

     
    1.5.7集成方法 

     
    1.5.8基于实例的算法 

     
    1.5.9基于回归分析的算法 

     
    1.5.10基于关联规则的算法 

     
    1.6机器学习工具与框架 

     
    1.7小结 

     
    第2章机器学习和大规模数据集 

     
    2.1大数据和大规模机器学习 

     
    2.1.1功能与架构:方法论的失配 

     
    2.1.2机器学习的可扩展性和性能 

     
    2.1.3模型选择过程 

     
    2.1.4大规模机器学习的潜在问题 

     
    2.2算法和并发 

     
    2.3垂直扩展的机器学习技术方案 

     
    2.3.1MapReduce编程架构 

     
    2.3.2利用消息传递接口进行高性能计算 

     
    2.3.3LINQ框架 

     
    2.3.4使用LINQ操作数据集 

     
    2.3.5GPU 

     
    2.3.6FPGA 

     
    2.3.7多核或多处理器系统 

     
    2.4小结 

     
    第3章Hadoop架构和生态系统简介 

     
    3.1Apache Hadoop简介 

     
    3.1.1Hadoop的演化 

     
    3.1.2Hadoop及其核心要素 

     
    3.2基于Hadoop的大数据机器学习解决方案架构 

     
    3.2.1数据源层 

     
    3.2.2数据摄入层 

     
    3.2.3Hadoop数据存储层 

     
    3.2.4Hadoop基础设施层 

     
    3.2.5Hadoop平台/处理层 

     
    3.2.6分析层 

     
    3.2.7数据消费层 

     
    3.2.8MapReduce 

     
    3.3Hadoop 2.x 

     
    3.3.1Hadoop生态系统组件 

     
    3.3.2Hadoop安装和配置 

     
    3.3.3Hadoop发行版和供应商 

     
    3.4小结 

     
    第4章机器学习工具、库及框架 

     
    4.1机器学习工具概览 

     
    4.2Apache Mahout 

     
    4.2.1Mahout如何工作 

     
    4.2.2安装和设置Apache Mahout 

     
    4.2.3Mahout软件包详解 

     
    4.2.4Mahout中的vector实现 

     
    4.3R 

     
    4.3.1安装和设置R 

     
    4.3.2R与Apache Hadoop集成 

     
    4.4Julia 

     
    4.4.1安装和设置Julia 

     
    4.4.2在命令行中执行Julia程序 

     
    4.4.3例解Julia 

     
    4.4.4变量与赋值 

     
    4.4.5使用Julia的好处 

     
    4.4.6Julia与Hadoop集成 

     
    4.5Python 

     
    4.5.1Python中工具包的选择 

     
    4.5.2例解Python 

     
    4.6Apache Spark 

     
    4.6.1Scala 

     
    4.6.2RDD编程 

     
    4.7Spring XD 

     
    4.8小结 

     
    第5章基于决策树的学习 

     
    5.1决策树 

     
    5.1.1术语 

     
    5.1.2目标与用途 

     
    5.1.3构造决策树 

     
    5.1.4特殊的决策树 

     
    5.2实现决策树 

     
    5.3小结 

     
    第6章基于实例和核方法的学习 

     
    6.1基于实例的学习 

     
    6.1.1最近邻 

     
    6.1.2实现kNN 

     
    6.2基于核方法的学习 

     
    6.2.1核函数 

     
    6.2.2支持向量机 

     
    6.2.3实现SVM 

     
    6.3小结 

     
    第7章关联规则学习 

     
    7.1关联规则学习 

     
    7.1.1关联规则的定义 

     
    7.1.2Apriori算法 

     
    7.1.3FPgrowth算法 

     
    7.1.4Apriori与FPgrowth 

     
    7.2实现Apriori及FPgrowth算法 

     
    7.3小结 

     
    第8章聚类学习 

     
    8.1聚类学习 

     
    8.2聚类的类型 

     
    8.2.1层次聚类 

     
    8.2.2划分式聚类 

     
    8.3kmeans聚类算法 

     
    8.3.1kmeans算法的收敛性 

     
    8.3.2kmeans算法的优点 

     
    8.3.3kmeans算法的缺点 

     
    8.3.4距离度量 

     
    8.3.5复杂度度量 

     
    8.4实现kmeans聚类 

     
    8.5小结 

     
    第9章贝叶斯学习 

     
    9.1贝叶斯学习 

     
    9.1.1统计学家的视角 

     
    9.1.2贝叶斯定理 

     
    9.1.3朴素贝叶斯分类器 

     
    9.2实现朴素贝叶斯算法 

     
    9.3小结 

     
    第10章基于回归的学习 

     
    10.1回归分析 

     
    10.1.1重温统计学 

     
    10.1.2混杂 

     
    10.1.3效应修饰 

     
    10.2回归方法 

     
    10.2.1简单线性回归 

     
    10.2.2多元线性回归 

     
    10.2.3多项式回归 

     
    10.2.4广义线性模型 

     
    10.2.5逻辑回归(logit连接) 

     
    10.2.6泊松回归 

     
    10.3实现线性回归和逻辑回归 

     
    10.4小结 

     
    第11章深度学习 

     
    11.1背景知识 

     
    11.1.1人类大脑结构 

     
    11.1.2神经网络 

     
    11.1.3反向传播算法 

     
    11.1.4Softmax回归算法 

     
    11.2深度学习类型 

     
    11.2.1卷积神经网络 

     
    11.2.2循环神经网络 

     
    11.2.3受限玻尔兹曼机 

     
    11.2.4深度玻尔兹曼机 

     
    11.2.5自动编码器 

     
    11.3实现ANN和深度学习方法 

     
    11.4小结 

     
    第12章强化学习 

     
    12.1强化学习 

     
    12.1.1强化学习的背景知识 

     
    12.1.2强化学习的主要特点 

     
    12.2强化学习算法 

     
    12.2.1动态规划 

     
    12.2.2蒙特卡罗方法 

     
    12.2.3时序差分学习 

     
    12.2.4Qlearning(异策略TD) 

     
    12.2.5actorcritic方法(同策略) 

     
    12.2.6Rlearning(异策略) 

     
    12.3实现强化学习方法 

     
    12.4小结 

     
    第13章集成学习 

     
    13.1集成学习方法 

     
    13.1.1群体智慧 

     
    13.1.2经典应用 

     
    13.1.3集成方法 

     
    13.2实现集成学习方法 

     
    13.3小结 

     
    第14章下一代机器学习数据架构 

     
    14.1数据架构的演进 

     
    14.2机器学习的现代数据架构 

     
    14.2.1语义数据架构 

     
    14.2.2多模型数据库架构/混合持久化 

     
    14.2.3Lambda架构 

     
    14.3小结 

查看详情
系列丛书 / 更多
实用机器学习
大数据导论
彭智勇 译
实用机器学习
统计学习导论 基于R应用
[美]加雷斯·詹姆斯、丹妮拉·威滕、特雷弗·哈斯帖 著;王星 译
实用机器学习
大数据分析原理与实践
王宏志 著
实用机器学习
Python机器学习
高明、徐莹、陶虎成 译
实用机器学习
机器学习与R语言(原书第2版)
李洪成、许金炜、李舰 译
实用机器学习
Python机器学习(原书第2版)
瓦希德·米 著;塞巴斯蒂安·拉施卡(Sebastian Raschka)、陈斌 译
实用机器学习
基于R语言的自动数据收集:网络抓取和文本挖掘实用指南
[德]西蒙·蒙策尔特 著;吴今朝 译
实用机器学习
机器学习与R语言
[美]Brett Lantz 著;李洪成、许金炜、李舰 译
实用机器学习
基于MPI的大数据高性能计算导论
弗兰克·尼尔森(Frank Nielsen) 著;张伟哲 译
实用机器学习
Python金融数据分析
Weiming 著;杰姆斯·马伟明(James、Ma、高明 译
实用机器学习
统计机器学习导论
[日]杉山将 著;谢宁 译
实用机器学习
Python文本分析
[印度]迪潘简·撒卡尔 著;闫龙川 高德荃 李君婷 译
相关图书 / 更多
实用机器学习
实用胃肠超声诊断学
周艳芳 耿芳径 韩彦文 嵇辉 张占超 孙彩霞
实用机器学习
实用产前及妇女保健超声检查
赵华巍、刘晓红
实用机器学习
实用英语语音教程
田朝霞
实用机器学习
实用颈椎疾病患者指导
何达等
实用机器学习
实用物流英语(第二版)
王淑花 潘爱琳
实用机器学习
实用英语绿宝书:同义词近义词辨析
李长庚 曩洪汉
实用机器学习
实用牙周治疗指南(精)
(美) 托拜厄斯·肯·贝姆(Tobias K. Boehm)、(美) 萨姆·崔(Sam Chui)
实用机器学习
实用英语红宝书:语法活用大全
李长庚 曩洪汉
实用机器学习
实用英语蓝宝书:介词用法大全
李长庚
实用机器学习
实用英语语法
薛永库,刘金明
实用机器学习
实用汉语语法指南
白乐桑,张祖建,金久高静
实用机器学习
实用妇科微创手术图谱:机器人与多孔单孔腹腔镜(原书第2版)
(美)佩德罗·F.埃斯科瓦尔,(英)托马索·法尔科内