Python机器学习案例教程(原书第2版)

Python机器学习案例教程(原书第2版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: (Yuxi Liu)
2021-05
版次: 1
ISBN: 9787111677109
定价: 89.00
装帧: 其他
开本: 16开
纸张: 胶版纸
页数: 248页
字数: 381千字
2人买过
  • 本书包括3部分:第1部分介绍机器学习的基本概念,它们是机器学习的预备知识;第2部分系统介绍几种成熟的机器学习算法和技术;第3部分介绍贯穿整个机器学习工作流程的21个*佳案例,并且讨论具有前瞻性的方法和想法,它们被公认为是机器学习未来的研究重点。本书中的代码均在Python 3中测试通过。
      本书适合高等院校相关专业的大学生、研究生或教师阅读学习,以及不具有机器学习或统计背景但是想要快速补充机器学习算法知识,以便在实际产品或平台中应用的软件工程师。
      Copyright  Packt Publishing 2019
      First published in the English language under the title“Python Machine Learning By Example-Second Edition-(9781789616729)”
      Copyright in the Chinese language(simplified characters) 2021 China Machine Press
      This title is published in China by China Machine Press with license from Packt Publishing Ltd.This edition is authorized for sale in China only, excluding Hong Kong SAR, Macao SAR and Taiwan.Unauthorized export of this edition is a violation of the Copyright Act.Violation of this Law is subject to Civil and Criminal Penalties.
      本书由Packt Publishing Ltd授权机械工业出版社在中华人民共和国境内(不包括香港、澳门特别行政区及台湾地区)出版与发行。未经许可的出口,视为违反著作权法,将受法律制裁。
      北京市版权局著作权合同登记图字:01-2019-5823号。 译者序

    前言

    第1部分机器学习的基础

    第1章机器学习和Python入门

    1.1超高水平的机器学习技术概述

    1.1.1机器学习任务的分类

    1.1.2机器学习算法的发展简史

    1.2机器学习的核心——数据泛化

    1.2.1过拟合、欠拟合和偏差-方差权衡

    1.2.2利用交叉验证避免过拟合

    1.2.3利用正则化避免过拟合

    1.2.4通过特征选择和降维避免过拟合

    1.3预处理、探索和特征工程

    1.3.1缺失值

    1.3.2标签编码

    1.3.3独热编码

    1.3.4缩放

    1.3.5多项式特征

    1.3.6幂变换

    1.3.7分箱

    1.4组合模型

    1.4.1投票法和平均法

    1.4.2装袋法

    1.4.3提升方法

    1.4.4堆叠法

    1.5安装软件和设置

    1.5.1设置Python和环境

    1.5.2安装各种软件包

    本章小结

    习题

    第2部分Python机器学习实例

    第2章使用文本分析技术研究20组新闻数据集

    2.1计算机如何理解语言——NLP

    2.2浏览NLP库并学习NLP基础知识

    2.2.1语料库

    2.2.2标记

    2.2.3词性

    2.2.4命名实体识别

    2.2.5词干提取和词形还原

    2.2.6语义和主题建模

    2.3获取新闻组数据

    2.4研究新闻组数据

    2.5考虑文本数据的特性

    2.5.1计算每个单词表征的出现次数

    2.5.2文本预处理

    2.5.3丢弃停止词

    2.5.4词干提取和词形还原法

    2.6使用t-SNE可视化新闻组数据

    2.6.1什么是降维

    2.6.2用于降维的t-SNE

    本章小结

    习题

    第3章使用聚类和主题建模算法挖掘20组新闻数据集

    3.1没有指导的学习——无监督学习

    3.2使用k均值聚类算法对新闻数据集进行聚类

    3.2.1k均值聚类算法是如何聚类的?

    3.2.2从头实现k均值聚类算法

    3.2.3用机器学习实现k均值聚类算法

    3.2.4k值的选择

    3.2.5使用k均值聚类新闻组数据

    3.3在新闻组中发现基础主题

    3.4使用NMF进行主题建模

    3.5使用LDA进行主题建模

    本章小结

    习题

    第4章使用朴素贝叶斯检测垃圾邮件

    4.1从分类开始

    4.1.1分类算法的类型

    4.1.2文本分类的应用

    4.2探索朴素贝叶斯

    4.2.1通过案例来学习贝叶斯定理

    4.2.2朴素贝叶斯的结构

    4.2.3运用scratch库实现朴素贝叶斯分类器

    4.2.4运用scikit-learn库实现朴素贝叶斯分类器

    4.3分类性能评估

    4.4模型调优和交叉验证

    本章小结

    习题

    第5章使用支持向量机对新闻组主题进行分类

    5.1用支持向量机寻找分离边界

    5.1.1通过不同的示例了解支持向量机如何工作

    5.1.2实现支持向量机

    5.1.3支持向量机的核心

    5.1.4在线性核和RBF核之间进行选择

    5.2使用支持向量机对新闻组主题进行分类

    5.3更多示例——心脏造影的胎儿状态分类

    5.4另一个示例——使用TensorFlow完成基于支持向量机的乳腺癌分类

    本章小结

    习题

    第6章使用基于树的算法预测在线广告点击率

    6.1广告点击率预测概述

    6.2两种类型数据:数值型和分类型

    6.3从根到叶探索决策树

    6.3.1构建决策树

    6.3.2衡量分裂的标准

    6.4从头实现决策树

    6.5用决策树预测广告点击率

    6.6集成决策树——随机森林

    6.6.1使用TensorFlow实现随机森林

    本章小结

    习题

    第7章使用逻辑回归预测在线广告点击率

    7.1将分类特征转换为数字特征——独热编码和顺序编码

    7.2用逻辑回归对数据进行分类

    7.2.1逻辑函数入门

    7.2.2从逻辑函数到逻辑回归

    7.3训练逻辑回归模型

    7.3.1利用梯度下降训练逻辑回归模型

    7.3.2利用梯度下降的逻辑回归模型预测在线广告点击率

    7.3.3利用随机梯度下降训练逻辑回归模型

    7.3.4利用正则化训练逻辑回归模型

    7.4通过在线学习训练大型数据集

    7.5处理多元分类

    7.6使用TensorFlow实现逻辑回归

    7.7使用随机森林进行特征选择

    本章小结

    习题

    第8章将预测扩展到TB级点击日志

    8.1学习Apache Spark的基本知识

    8.1.1了解 Spark

    8.1.2安装Spark

    8.1.3启动和部署Spark程序

    8.2在PySpark中编程

    8.3使用Spark学习大量点击日志

    8.3.1加载点击日志

    8.3.2拆分和缓存数据

    8.3.3对分类特征进行独热编码

    8.3.4训练和测试逻辑回归模型

    8.4使用Spark对分类变量进行特征工程

    8.4.1散列分类特征

    8.4.2组合多个变量——特征交互

    本章小结

    习题

    第9章使用回归算法预测股票价格

    9.1有关股票市场和股票价格的简要概述

    9.2什么是回归

    9.3获取股价数据

    9.3.1开始特征工程

    9.3.2获取数据并生成特征

    9.4使用线性回归来估计

    9.4.1线性回归是如何工作的

    9.4.2实现线性回归

    9.5使用回归树进行预测

    9.5.1从分类树到回归树

    9.5.2实现回归树

    9.5.3实现随机森林

    9.6用支持向量回归机进行评估

    9.6.1实现支持向量回归机

    9.7用神经网络进行估算

    9.7.1揭开神经网络的神秘面纱

    9.7.2实现神经网络

    9.8评估回归性能

    9.9使用四种回归算法预测股票价格

    本章小结

    习题

    第3部分Python机器学习最佳案例

    第10章机器学习最佳案例

    10.1机器学习解决方案流程

    10.2数据准备阶段的最佳案例

    10.2.1最佳案例1——完全理解项目目标

    10.2.2最佳案例2——收集所有相关的特征

    10.2.3最佳案例3——保持特征值的一致性

    10.2.4最佳案例4——处理缺失数据

    10.2.5最佳案例5——存储大规模数据

    10.3训练集生成阶段的最佳案例

    10.3.1最佳案例6——区分分类型特征与数值型特征

    10.3.2最佳案例7——决定是否要对分类型特征进行编码

    10.3.3最佳案例8——决定是否要选择特征和如何选择

    10.3.4最佳案例9——决定是否要降维和如何降维

    10.3.5最佳案例10——决定是否重新调整特征取值

    10.3.6最佳案例11——在拥有专业知识的条件下进行特征工程

    10.3.7最佳案例12——在缺少专业知识的条件下进行特征工程

    10.3.8最佳案例13——记录每个特征是如何生成的

    10.3.9最佳案例14——从文本数据中提取特征

    10.4模型训练、评估和选择阶段的最佳案例

    10.4.1最佳案例15——选择合适的起步算法

    10.4.2最佳案例16——减少过拟合

    10.4.3最佳案例17——识别过拟合与欠拟合

    10.4.4最佳案例18——在大型数据集上建模

    10.5部署和监视阶段的最佳案例

    10.5.1最佳案例19——保存、加载和重用模型

    10.5.2最佳案例20——监控模型性能

    10.5.3最佳案例21——定期更新模型

    本章小结

    习题
  • 内容简介:
    本书包括3部分:第1部分介绍机器学习的基本概念,它们是机器学习的预备知识;第2部分系统介绍几种成熟的机器学习算法和技术;第3部分介绍贯穿整个机器学习工作流程的21个*佳案例,并且讨论具有前瞻性的方法和想法,它们被公认为是机器学习未来的研究重点。本书中的代码均在Python 3中测试通过。
      本书适合高等院校相关专业的大学生、研究生或教师阅读学习,以及不具有机器学习或统计背景但是想要快速补充机器学习算法知识,以便在实际产品或平台中应用的软件工程师。
      Copyright  Packt Publishing 2019
      First published in the English language under the title“Python Machine Learning By Example-Second Edition-(9781789616729)”
      Copyright in the Chinese language(simplified characters) 2021 China Machine Press
      This title is published in China by China Machine Press with license from Packt Publishing Ltd.This edition is authorized for sale in China only, excluding Hong Kong SAR, Macao SAR and Taiwan.Unauthorized export of this edition is a violation of the Copyright Act.Violation of this Law is subject to Civil and Criminal Penalties.
      本书由Packt Publishing Ltd授权机械工业出版社在中华人民共和国境内(不包括香港、澳门特别行政区及台湾地区)出版与发行。未经许可的出口,视为违反著作权法,将受法律制裁。
      北京市版权局著作权合同登记图字:01-2019-5823号。
  • 目录:
    译者序

    前言

    第1部分机器学习的基础

    第1章机器学习和Python入门

    1.1超高水平的机器学习技术概述

    1.1.1机器学习任务的分类

    1.1.2机器学习算法的发展简史

    1.2机器学习的核心——数据泛化

    1.2.1过拟合、欠拟合和偏差-方差权衡

    1.2.2利用交叉验证避免过拟合

    1.2.3利用正则化避免过拟合

    1.2.4通过特征选择和降维避免过拟合

    1.3预处理、探索和特征工程

    1.3.1缺失值

    1.3.2标签编码

    1.3.3独热编码

    1.3.4缩放

    1.3.5多项式特征

    1.3.6幂变换

    1.3.7分箱

    1.4组合模型

    1.4.1投票法和平均法

    1.4.2装袋法

    1.4.3提升方法

    1.4.4堆叠法

    1.5安装软件和设置

    1.5.1设置Python和环境

    1.5.2安装各种软件包

    本章小结

    习题

    第2部分Python机器学习实例

    第2章使用文本分析技术研究20组新闻数据集

    2.1计算机如何理解语言——NLP

    2.2浏览NLP库并学习NLP基础知识

    2.2.1语料库

    2.2.2标记

    2.2.3词性

    2.2.4命名实体识别

    2.2.5词干提取和词形还原

    2.2.6语义和主题建模

    2.3获取新闻组数据

    2.4研究新闻组数据

    2.5考虑文本数据的特性

    2.5.1计算每个单词表征的出现次数

    2.5.2文本预处理

    2.5.3丢弃停止词

    2.5.4词干提取和词形还原法

    2.6使用t-SNE可视化新闻组数据

    2.6.1什么是降维

    2.6.2用于降维的t-SNE

    本章小结

    习题

    第3章使用聚类和主题建模算法挖掘20组新闻数据集

    3.1没有指导的学习——无监督学习

    3.2使用k均值聚类算法对新闻数据集进行聚类

    3.2.1k均值聚类算法是如何聚类的?

    3.2.2从头实现k均值聚类算法

    3.2.3用机器学习实现k均值聚类算法

    3.2.4k值的选择

    3.2.5使用k均值聚类新闻组数据

    3.3在新闻组中发现基础主题

    3.4使用NMF进行主题建模

    3.5使用LDA进行主题建模

    本章小结

    习题

    第4章使用朴素贝叶斯检测垃圾邮件

    4.1从分类开始

    4.1.1分类算法的类型

    4.1.2文本分类的应用

    4.2探索朴素贝叶斯

    4.2.1通过案例来学习贝叶斯定理

    4.2.2朴素贝叶斯的结构

    4.2.3运用scratch库实现朴素贝叶斯分类器

    4.2.4运用scikit-learn库实现朴素贝叶斯分类器

    4.3分类性能评估

    4.4模型调优和交叉验证

    本章小结

    习题

    第5章使用支持向量机对新闻组主题进行分类

    5.1用支持向量机寻找分离边界

    5.1.1通过不同的示例了解支持向量机如何工作

    5.1.2实现支持向量机

    5.1.3支持向量机的核心

    5.1.4在线性核和RBF核之间进行选择

    5.2使用支持向量机对新闻组主题进行分类

    5.3更多示例——心脏造影的胎儿状态分类

    5.4另一个示例——使用TensorFlow完成基于支持向量机的乳腺癌分类

    本章小结

    习题

    第6章使用基于树的算法预测在线广告点击率

    6.1广告点击率预测概述

    6.2两种类型数据:数值型和分类型

    6.3从根到叶探索决策树

    6.3.1构建决策树

    6.3.2衡量分裂的标准

    6.4从头实现决策树

    6.5用决策树预测广告点击率

    6.6集成决策树——随机森林

    6.6.1使用TensorFlow实现随机森林

    本章小结

    习题

    第7章使用逻辑回归预测在线广告点击率

    7.1将分类特征转换为数字特征——独热编码和顺序编码

    7.2用逻辑回归对数据进行分类

    7.2.1逻辑函数入门

    7.2.2从逻辑函数到逻辑回归

    7.3训练逻辑回归模型

    7.3.1利用梯度下降训练逻辑回归模型

    7.3.2利用梯度下降的逻辑回归模型预测在线广告点击率

    7.3.3利用随机梯度下降训练逻辑回归模型

    7.3.4利用正则化训练逻辑回归模型

    7.4通过在线学习训练大型数据集

    7.5处理多元分类

    7.6使用TensorFlow实现逻辑回归

    7.7使用随机森林进行特征选择

    本章小结

    习题

    第8章将预测扩展到TB级点击日志

    8.1学习Apache Spark的基本知识

    8.1.1了解 Spark

    8.1.2安装Spark

    8.1.3启动和部署Spark程序

    8.2在PySpark中编程

    8.3使用Spark学习大量点击日志

    8.3.1加载点击日志

    8.3.2拆分和缓存数据

    8.3.3对分类特征进行独热编码

    8.3.4训练和测试逻辑回归模型

    8.4使用Spark对分类变量进行特征工程

    8.4.1散列分类特征

    8.4.2组合多个变量——特征交互

    本章小结

    习题

    第9章使用回归算法预测股票价格

    9.1有关股票市场和股票价格的简要概述

    9.2什么是回归

    9.3获取股价数据

    9.3.1开始特征工程

    9.3.2获取数据并生成特征

    9.4使用线性回归来估计

    9.4.1线性回归是如何工作的

    9.4.2实现线性回归

    9.5使用回归树进行预测

    9.5.1从分类树到回归树

    9.5.2实现回归树

    9.5.3实现随机森林

    9.6用支持向量回归机进行评估

    9.6.1实现支持向量回归机

    9.7用神经网络进行估算

    9.7.1揭开神经网络的神秘面纱

    9.7.2实现神经网络

    9.8评估回归性能

    9.9使用四种回归算法预测股票价格

    本章小结

    习题

    第3部分Python机器学习最佳案例

    第10章机器学习最佳案例

    10.1机器学习解决方案流程

    10.2数据准备阶段的最佳案例

    10.2.1最佳案例1——完全理解项目目标

    10.2.2最佳案例2——收集所有相关的特征

    10.2.3最佳案例3——保持特征值的一致性

    10.2.4最佳案例4——处理缺失数据

    10.2.5最佳案例5——存储大规模数据

    10.3训练集生成阶段的最佳案例

    10.3.1最佳案例6——区分分类型特征与数值型特征

    10.3.2最佳案例7——决定是否要对分类型特征进行编码

    10.3.3最佳案例8——决定是否要选择特征和如何选择

    10.3.4最佳案例9——决定是否要降维和如何降维

    10.3.5最佳案例10——决定是否重新调整特征取值

    10.3.6最佳案例11——在拥有专业知识的条件下进行特征工程

    10.3.7最佳案例12——在缺少专业知识的条件下进行特征工程

    10.3.8最佳案例13——记录每个特征是如何生成的

    10.3.9最佳案例14——从文本数据中提取特征

    10.4模型训练、评估和选择阶段的最佳案例

    10.4.1最佳案例15——选择合适的起步算法

    10.4.2最佳案例16——减少过拟合

    10.4.3最佳案例17——识别过拟合与欠拟合

    10.4.4最佳案例18——在大型数据集上建模

    10.5部署和监视阶段的最佳案例

    10.5.1最佳案例19——保存、加载和重用模型

    10.5.2最佳案例20——监控模型性能

    10.5.3最佳案例21——定期更新模型

    本章小结

    习题
查看详情
12
相关图书 / 更多
Python机器学习案例教程(原书第2版)
Python和PySpark数据分析
(加)乔纳森·里乌
Python机器学习案例教程(原书第2版)
Python机器学习入门与实践 从深度学习到生成对抗网络GAN 深入浅出GAN生成对抗网络 实战gan TensorFlow与Keras 人工智能技术书籍
(日)大关真之
Python机器学习案例教程(原书第2版)
Python程序设计基础实践教程
任志考;孙劲飞;叶臣
Python机器学习案例教程(原书第2版)
Python语言程序设计
王刚
Python机器学习案例教程(原书第2版)
Python代码编程 学科项目式编程(六年级)
冯建刚
Python机器学习案例教程(原书第2版)
Python机器学习 : 核心技术与开发实战 周志华西瓜书机器学习实战伴侣书
[美]普拉提克·乔希 著;李现伟 译者;颉腾文化 出品;阿尔伯托·阿尔塔桑切斯(美);曾小健
Python机器学习案例教程(原书第2版)
Python数据分析从入门到精通(第2版)
明日科技
Python机器学习案例教程(原书第2版)
Python数据分析与挖掘
齐福利
Python机器学习案例教程(原书第2版)
Python基础与应用(互联网+教育新形态一体化系列教材)
李喆时、谢家立、赵丽 编
Python机器学习案例教程(原书第2版)
Python数据分析与可视化项目实战
王振丽
Python机器学习案例教程(原书第2版)
Python爬虫从菜鸟到高手
李宁
Python机器学习案例教程(原书第2版)
Python程序设计基础教程
\"孙海龙 王济军\
您可能感兴趣 / 更多
Python机器学习案例教程(原书第2版)
Python机器学习实战
刘宇熙(Hayden Liu)