机器学习系统设计

机器学习系统设计
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , , , ,
2014-06
版次: 1
ISBN: 9787115356826
定价: 49.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 210页
字数: 334千字
正文语种: 简体中文
原版书名: Building Machine Learning Systems with Python
111人买过
  • 《机器学习系统设计》是实用的Python机器学习教程,结合大量案例,介绍了机器学习的各方面知识。《机器学习系统设计》不仅告诉你“怎么做”,还会分析“为什么”,力求帮助读者掌握多种多样的机器学习Python库,学习构建基于Python的机器学习系统,并亲身实践和体验机器学习系统的功能。
    《机器学习系统设计》适合需要机器学习技术的Python开发人员、计算机科学研究人员、数据科学家、人工智能程序员,以及统计程序员阅读参考。 WilliRichert,机器学习和机器人学博士,目前任职于微软Bing搜索核心研发团队。他从事多种机器学习领域的研究,包括主动学习和统计机器翻译。

    LuisPedroCoelho,计算生物学家,主要关注生物图像信息学和大规模图像数据的处理,致力于生物标本图像分析中机器学习技术的应用,他还是Python计算机视觉库mahotas的主要开发人员。他于1998年开始开发开源软件,2004年起从事Python开发,并为多个Python开源库贡献了代码。另外,Luis拥有机器学习领域世界前列的卡内基-梅隆大学的博士学位,并发表过多篇科学论文。 目 录

    第1章 Python机器学习入门 1
    1.1 梦之队:机器学习与Python 1
    1.2 这本书将教给你什么(以及不会教什么) 2
    1.3 遇到困难的时候怎么办 3
    1.4 开始 4
    1.4.1 NumPy、SciPy和Matplotlib简介 4
    1.4.2 安装Python 5
    1.4.3 使用NumPy和SciPy智能高效地处理数据 5
    1.4.4 学习NumPy 5
    1.4.5 学习SciPy 9
    1.5 我们第一个(极小的)机器学习应用 10
    1.5.1 读取数据 10
    1.5.2 预处理和清洗数据 11
    1.5.3 选择正确的模型和学习算法 12
    1.6 小结 20

    第2章 如何对真实样本分类 22
    2.1 Iris数据集 22
    2.1.1 第一步是可视化 23
    2.1.2 构建第一个分类模型 24
    2.2 构建更复杂的分类器 28
    2.3 更复杂的数据集和更复杂的分类器 29
    2.3.1 从Seeds数据集中学习 29
    2.3.2 特征和特征工程 30
    2.3.3 最邻近分类 30
    2.4 二分类和多分类 33
    2.5 小结 34

    第3章 聚类:寻找相关的帖子 35
    3.1 评估帖子的关联性 35
    3.1.1 不应该怎样 36
    3.1.2 应该怎样 36
    3.2 预处理:用相近的公共词语个数来衡量相似性 37
    3.2.1 将原始文本转化为词袋 37
    3.2.2 统计词语 38
    3.2.3 词语频次向量的归一化 40
    3.2.4 删除不重要的词语 41
    3.2.5 词干处理 42
    3.2.6 停用词兴奋剂 44
    3.2.7 我们的成果和目标 45
    3.3 聚类 46
    3.3.1 K均值 46
    3.3.2 让测试数据评估我们的想法 49
    3.3.3 对帖子聚类 50
    3.4 解决我们最初的难题 51
    3.5 调整参数 54
    3.6 小结 54

    第4章 主题模型 55
    4.1 潜在狄利克雷分配(LDA) 55
    4.2 在主题空间比较相似度 59
    4.3 选择主题个数 64
    4.4 小结 65

    第5章 分类:检测劣质答案 67
    5.1 路线图概述 67
    5.2 学习如何区分出优秀的答案 68
    5.2.1 调整样本 68
    5.2.2 调整分类器 68
    5.3 获取数据 68
    5.3.1 将数据消减到可处理的程度 69
    5.3.2 对属性进行预选择和处理 70
    5.3.3 定义什么是优质答案 71
    5.4 创建第一个分类器 71
    5.4.1 从k邻近(kNN)算法开始 71
    5.4.2 特征工程 72
    5.4.3 训练分类器 73
    5.4.4 评估分类器的性能 74
    5.4.5 设计更多的特征 74
    5.5 决定怎样提升效果 77
    5.5.1 偏差?方差及其折中 77
    5.5.2 解决高偏差 78
    5.5.3 解决高方差 78
    5.5.4 高偏差或低偏差 78
    5.6 采用逻辑回归 81
    5.6.1 一点数学和一个小例子 81
    5.6.2 在帖子分类问题上应用逻辑回归 83
    5.7 观察正确率的背后:准确率和召回率 84
    5.8 为分类器瘦身 87
    5.9 出货 88
    5.10 小结 88

    第6章 分类II:情感分析 89
    6.1 路线图概述 89
    6.2 获取推特(Twitter)数据 89
    6.3 朴素贝叶斯分类器介绍 90
    6.3.1 了解贝叶斯定理 90
    6.3.2 朴素 91
    6.3.3 使用朴素贝叶斯进行分类 92
    6.3.4 考虑未出现的词语和其他古怪情况 94
    6.3.5 考虑算术下溢 95
    6.4 创建第一个分类器并调优 97
    6.4.1 先解决一个简单问题 97
    6.4.2 使用所有的类 99
    6.4.3 对分类器的参数进行调优 101
    6.5 清洗推文 104
    6.6 将词语类型考虑进去 106
    6.6.1 确定词语的类型 106
    6.6.2 用SentiWordNet成功地作弊 108
    6.6.3 我们第一个估算器 110
    6.6.4 把所有东西融合在一起 111
    6.7 小结 112

    第7章 回归:推荐 113
    7.1 用回归预测房价 113
    7.1.1 多维回归 116
    7.1.2 回归里的交叉验证 116
    7.2 惩罚式回归 117
    7.2.1 L1和L2惩罚 117
    7.2.2 在Scikit-learn中使用Lasso或弹性网 118
    7.3 P大于N的情形 119
    7.3.1 基于文本的例子 120
    7.3.2 巧妙地设置超参数(hyperparameter) 121
    7.3.3 评分预测和推荐 122
    7.4 小结 126

    第8章 回归:改进的推荐 127
    8.1 改进的推荐 127
    8.1.1 使用二值推荐矩阵 127
    8.1.2 审视电影的近邻 129
    8.1.3 组合多种方法 130
    8.2 购物篮分析 132
    8.2.1 获取有用的预测 133
    8.2.2 分析超市购物篮 134
    8.2.3 关联规则挖掘 136
    8.2.4 更多购物篮分析的高级话题 137
    8.3 小结 138

    第9章 分类III:音乐体裁分类 139
    9.1 路线图概述 139
    9.2 获取音乐数据 139
    9.3 观察音乐 140
    9.4 用FFT构建第一个分类器 143
    9.4.1 增加实验敏捷性 143
    9.4.2 训练分类器 144
    9.4.3 在多分类问题中用混淆矩阵评估正确率 144
    9.4.4 另一种方式评估分类器效果:受试者工作特征曲线(ROC) 146
    9.5 用梅尔倒频谱系数(MFCC)提升分类效果 148
    9.6 小结 152

    第10章 计算机视觉:模式识别 154
    10.1 图像处理简介 154
    10.2 读取和显示图像 155
    10.2.1 图像处理基础 156
    10.2.2 加入椒盐噪声 161
    10.2.3 模式识别 163
    10.2.4 计算图像特征 163
    10.2.5 设计你自己的特征 164
    10.3 在更难的数据集上分类 166
    10.4 局部特征表示 167
    10.5 小结 170

    第11章 降维 171
    11.1 路线图 171
    11.2 选择特征 172
    11.2.1 用筛选器检测冗余特征 172
    11.2.2 用封装器让模型选择特征 178
    11.3 其他特征选择方法 180
    11.4 特征抽取 181
    11.4.1 主成分分析(PCA) 181
    11.4.2 PCA的局限性以及LDA会有什么帮助 183
    11.5 多维标度法(MDS) 184
    11.6 小结 187

    第12章 大数据 188
    12.1 了解大数据 188
    12.2 用Jug程序包把你的处理流程分解成几个任务 189
    12.2.1 关于任务 189
    12.2.2 复用部分结果 191
    12.2.3 幕后的工作原理 192
    12.2.4 用Jug分析数据 192
    12.3 使用亚马逊Web服务(AWS) 194
    12.3.1 构建你的第一台机器 195
    12.3.2 用starcluster自动创建集群 199
    12.4 小结 202

    附录A 更多机器学习知识 203
    A.1 在线资源 203
    A.2 参考书 203
    A.2.1 问答网站 203
    A.2.2 博客 204
    A.2.3 数据资源 205
    A.2.4 竞争日益加剧 205
    A.3 还剩下什么 205
    A.4 小结 206

    索引 207
  • 内容简介:
    《机器学习系统设计》是实用的Python机器学习教程,结合大量案例,介绍了机器学习的各方面知识。《机器学习系统设计》不仅告诉你“怎么做”,还会分析“为什么”,力求帮助读者掌握多种多样的机器学习Python库,学习构建基于Python的机器学习系统,并亲身实践和体验机器学习系统的功能。
    《机器学习系统设计》适合需要机器学习技术的Python开发人员、计算机科学研究人员、数据科学家、人工智能程序员,以及统计程序员阅读参考。
  • 作者简介:
    WilliRichert,机器学习和机器人学博士,目前任职于微软Bing搜索核心研发团队。他从事多种机器学习领域的研究,包括主动学习和统计机器翻译。

    LuisPedroCoelho,计算生物学家,主要关注生物图像信息学和大规模图像数据的处理,致力于生物标本图像分析中机器学习技术的应用,他还是Python计算机视觉库mahotas的主要开发人员。他于1998年开始开发开源软件,2004年起从事Python开发,并为多个Python开源库贡献了代码。另外,Luis拥有机器学习领域世界前列的卡内基-梅隆大学的博士学位,并发表过多篇科学论文。
  • 目录:
    目 录

    第1章 Python机器学习入门 1
    1.1 梦之队:机器学习与Python 1
    1.2 这本书将教给你什么(以及不会教什么) 2
    1.3 遇到困难的时候怎么办 3
    1.4 开始 4
    1.4.1 NumPy、SciPy和Matplotlib简介 4
    1.4.2 安装Python 5
    1.4.3 使用NumPy和SciPy智能高效地处理数据 5
    1.4.4 学习NumPy 5
    1.4.5 学习SciPy 9
    1.5 我们第一个(极小的)机器学习应用 10
    1.5.1 读取数据 10
    1.5.2 预处理和清洗数据 11
    1.5.3 选择正确的模型和学习算法 12
    1.6 小结 20

    第2章 如何对真实样本分类 22
    2.1 Iris数据集 22
    2.1.1 第一步是可视化 23
    2.1.2 构建第一个分类模型 24
    2.2 构建更复杂的分类器 28
    2.3 更复杂的数据集和更复杂的分类器 29
    2.3.1 从Seeds数据集中学习 29
    2.3.2 特征和特征工程 30
    2.3.3 最邻近分类 30
    2.4 二分类和多分类 33
    2.5 小结 34

    第3章 聚类:寻找相关的帖子 35
    3.1 评估帖子的关联性 35
    3.1.1 不应该怎样 36
    3.1.2 应该怎样 36
    3.2 预处理:用相近的公共词语个数来衡量相似性 37
    3.2.1 将原始文本转化为词袋 37
    3.2.2 统计词语 38
    3.2.3 词语频次向量的归一化 40
    3.2.4 删除不重要的词语 41
    3.2.5 词干处理 42
    3.2.6 停用词兴奋剂 44
    3.2.7 我们的成果和目标 45
    3.3 聚类 46
    3.3.1 K均值 46
    3.3.2 让测试数据评估我们的想法 49
    3.3.3 对帖子聚类 50
    3.4 解决我们最初的难题 51
    3.5 调整参数 54
    3.6 小结 54

    第4章 主题模型 55
    4.1 潜在狄利克雷分配(LDA) 55
    4.2 在主题空间比较相似度 59
    4.3 选择主题个数 64
    4.4 小结 65

    第5章 分类:检测劣质答案 67
    5.1 路线图概述 67
    5.2 学习如何区分出优秀的答案 68
    5.2.1 调整样本 68
    5.2.2 调整分类器 68
    5.3 获取数据 68
    5.3.1 将数据消减到可处理的程度 69
    5.3.2 对属性进行预选择和处理 70
    5.3.3 定义什么是优质答案 71
    5.4 创建第一个分类器 71
    5.4.1 从k邻近(kNN)算法开始 71
    5.4.2 特征工程 72
    5.4.3 训练分类器 73
    5.4.4 评估分类器的性能 74
    5.4.5 设计更多的特征 74
    5.5 决定怎样提升效果 77
    5.5.1 偏差?方差及其折中 77
    5.5.2 解决高偏差 78
    5.5.3 解决高方差 78
    5.5.4 高偏差或低偏差 78
    5.6 采用逻辑回归 81
    5.6.1 一点数学和一个小例子 81
    5.6.2 在帖子分类问题上应用逻辑回归 83
    5.7 观察正确率的背后:准确率和召回率 84
    5.8 为分类器瘦身 87
    5.9 出货 88
    5.10 小结 88

    第6章 分类II:情感分析 89
    6.1 路线图概述 89
    6.2 获取推特(Twitter)数据 89
    6.3 朴素贝叶斯分类器介绍 90
    6.3.1 了解贝叶斯定理 90
    6.3.2 朴素 91
    6.3.3 使用朴素贝叶斯进行分类 92
    6.3.4 考虑未出现的词语和其他古怪情况 94
    6.3.5 考虑算术下溢 95
    6.4 创建第一个分类器并调优 97
    6.4.1 先解决一个简单问题 97
    6.4.2 使用所有的类 99
    6.4.3 对分类器的参数进行调优 101
    6.5 清洗推文 104
    6.6 将词语类型考虑进去 106
    6.6.1 确定词语的类型 106
    6.6.2 用SentiWordNet成功地作弊 108
    6.6.3 我们第一个估算器 110
    6.6.4 把所有东西融合在一起 111
    6.7 小结 112

    第7章 回归:推荐 113
    7.1 用回归预测房价 113
    7.1.1 多维回归 116
    7.1.2 回归里的交叉验证 116
    7.2 惩罚式回归 117
    7.2.1 L1和L2惩罚 117
    7.2.2 在Scikit-learn中使用Lasso或弹性网 118
    7.3 P大于N的情形 119
    7.3.1 基于文本的例子 120
    7.3.2 巧妙地设置超参数(hyperparameter) 121
    7.3.3 评分预测和推荐 122
    7.4 小结 126

    第8章 回归:改进的推荐 127
    8.1 改进的推荐 127
    8.1.1 使用二值推荐矩阵 127
    8.1.2 审视电影的近邻 129
    8.1.3 组合多种方法 130
    8.2 购物篮分析 132
    8.2.1 获取有用的预测 133
    8.2.2 分析超市购物篮 134
    8.2.3 关联规则挖掘 136
    8.2.4 更多购物篮分析的高级话题 137
    8.3 小结 138

    第9章 分类III:音乐体裁分类 139
    9.1 路线图概述 139
    9.2 获取音乐数据 139
    9.3 观察音乐 140
    9.4 用FFT构建第一个分类器 143
    9.4.1 增加实验敏捷性 143
    9.4.2 训练分类器 144
    9.4.3 在多分类问题中用混淆矩阵评估正确率 144
    9.4.4 另一种方式评估分类器效果:受试者工作特征曲线(ROC) 146
    9.5 用梅尔倒频谱系数(MFCC)提升分类效果 148
    9.6 小结 152

    第10章 计算机视觉:模式识别 154
    10.1 图像处理简介 154
    10.2 读取和显示图像 155
    10.2.1 图像处理基础 156
    10.2.2 加入椒盐噪声 161
    10.2.3 模式识别 163
    10.2.4 计算图像特征 163
    10.2.5 设计你自己的特征 164
    10.3 在更难的数据集上分类 166
    10.4 局部特征表示 167
    10.5 小结 170

    第11章 降维 171
    11.1 路线图 171
    11.2 选择特征 172
    11.2.1 用筛选器检测冗余特征 172
    11.2.2 用封装器让模型选择特征 178
    11.3 其他特征选择方法 180
    11.4 特征抽取 181
    11.4.1 主成分分析(PCA) 181
    11.4.2 PCA的局限性以及LDA会有什么帮助 183
    11.5 多维标度法(MDS) 184
    11.6 小结 187

    第12章 大数据 188
    12.1 了解大数据 188
    12.2 用Jug程序包把你的处理流程分解成几个任务 189
    12.2.1 关于任务 189
    12.2.2 复用部分结果 191
    12.2.3 幕后的工作原理 192
    12.2.4 用Jug分析数据 192
    12.3 使用亚马逊Web服务(AWS) 194
    12.3.1 构建你的第一台机器 195
    12.3.2 用starcluster自动创建集群 199
    12.4 小结 202

    附录A 更多机器学习知识 203
    A.1 在线资源 203
    A.2 参考书 203
    A.2.1 问答网站 203
    A.2.2 博客 204
    A.2.3 数据资源 205
    A.2.4 竞争日益加剧 205
    A.3 还剩下什么 205
    A.4 小结 206

    索引 207
查看详情
其他版本 / 全部 (1)
系列丛书 / 更多
机器学习系统设计
机器学习实战
[美]Peter Harrington 著;李锐、李鹏、曲亚东 译
机器学习系统设计
图灵程序设计丛书:Python基础教程
[挪威]Magnus Lie Hetland 著;司维、曾军崴、谭颖华 译
机器学习系统设计
JavaScript高级程序设计(第3版)
[美]Nicholas C.Zakas 著;李松峰、曹力 译
机器学习系统设计
Python编程:从入门到实践
[美]埃里克·马瑟斯(Eric Matthes) 著;袁国忠 译
机器学习系统设计
R语言实战(第2版)
[美]卡巴科弗(Robert I. Kabacoff) 著;王小宁、刘撷芯、黄俊文 译
机器学习系统设计
算法(第4版)
[美]Robert、[美]Kevin Wayne 著;谢路云 译
机器学习系统设计
大数据:互联网大规模数据挖掘与分布式处理
[美]Anand、[美]Jeffrey David Ullman 著;王斌 译
机器学习系统设计
Spark快速大数据分析
[美]卡劳(Holden Karau)、[美]肯维尼斯科(Andy Konwinski)、[美]温德尔(Patrick Wendell)、[加拿大]扎哈里亚(Matei Zaharia) 著;王道远 译
机器学习系统设计
MySQL必知必会
[英]福塔(Ben Forta) 著;刘晓霞、钟鸣 译
机器学习系统设计
Objective-C基础教程 第2版
[美]Scott、[美]Waqar、[美]Mark Dalrymple 著;周庆成 译
机器学习系统设计
图解HTTP
[日]上野·宣 著;于均良 译
机器学习系统设计
算法图解
袁国忠 译
相关图书 / 更多
机器学习系统设计
机器视觉原理及应用教程
宋丽梅 朱新军 李云鹏 编著
机器学习系统设计
机器学习数学基础
赵建容;顾先明
机器学习系统设计
机器视觉技术:基础及实践
陈思遥 编著;陈兵旗;梁习卉子
机器学习系统设计
机器学习:工业大数据分析
李彦夫
机器学习系统设计
机器人工程基础
徐东 岳昊嵩
机器学习系统设计
机器和生灵:人工智能、动物智慧与人类智识
[美]保罗·萨伽德(Paul;Thagard
机器学习系统设计
机器人操作系统ROS原理及应用
牛杰 余正泓
机器学习系统设计
机器人综合设计与实践
樊泽明
机器学习系统设计
机器视觉与产品检测
宫海兰 著;王珺萩
机器学习系统设计
机器人是怎样工作的(图解版)
[日]濑户文美
机器学习系统设计
机器学习中的统计思维(Python实现)
董平
机器学习系统设计
机器人焊接、激光加工与喷涂工艺及设备(应用型本科规划教材)
荆学东 编著
您可能感兴趣 / 更多
机器学习系统设计
孩子,把你的手给我1:怎么说孩子才爱听,怎么教孩子才肯学?帮助每一位3-12岁孩子的父母结束与孩子的所有冲突!
[美]海姆·G.吉诺特
机器学习系统设计
怎样做成大事
[美]丹·加德纳(Dan Gardner) 著;贾拥民 译;湛庐文化 出品;[丹麦]傅以斌(Bent Flyvbjerg)
机器学习系统设计
1200年希腊罗马神话
[美]伊迪丝·汉密尔顿
机器学习系统设计
爱情心理学(新编本)
[美]罗伯特·J. 斯腾伯格 (美)凯琳·斯腾伯格 倪爱萍 译
机器学习系统设计
黄金圈法则
[美]西蒙·斯涅克 著;磨铁文化 出品
机器学习系统设计
汤姆·索亚历险记 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]马克 吐温
机器学习系统设计
富兰克林自传 名家全译本 改变无数人命运的励志传奇 埃隆马斯克反复推荐 赠富兰克林签名照及精美插图
[美]本杰明·富兰克林 著;李自修 译
机器学习系统设计
意大利文艺复兴新艺术史
[美]迈克尔·韦恩·科尔 著;[美]斯蒂芬·J·坎贝尔;邵亦杨
机器学习系统设计
汤姆素亚历险记:中小学生课外阅读快乐读书吧 儿童文学无障碍有声伴读世界名著童话故事
[美]马克·吐温
机器学习系统设计
老人与海 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]海明威
机器学习系统设计
养育的觉醒:全面激发孩子自驱力,教你如何心平气和做妈妈
[美]凯文·莱曼 著;唐晓璐 译;斯坦威 出品
机器学习系统设计
国际大奖图画书系列 共11册(小老鼠的恐惧的大书,大灰狼,红豆与菲比,别烦我,下雪了 ,穿靴子的猫 ,先有蛋,绿 ,特别快递,如果你想看鲸鱼 ,一个部落的孩子 ) 麦克米伦世纪
[美]莱恩·史密斯 (英)埃米莉·格雷维特 (美)劳拉·瓦卡罗·等/文 (英)埃米莉·格雷维特 等/图 彭懿 杨玲玲 阿甲 孙慧阳 白薇 译