预测分析：Python语言实现

预测分析：Python语言实现

分享

作者: [美] 约瑟夫·巴布科克著 , 余水清译

出版社: 机械工业出版社

出版时间: 2017-08

版次: 1

ISBN: 9787111573890

定价: 59.00

装帧: 平装

开本: 16开

纸张: 胶版纸

页数: 199页

丛书: 数据科学与工程技术丛书

分类: 计算机与互联网

15人买过

本书着重介绍预测性分析技术，先概述了数据分析系统的基本架构和主要处理流程，然后从分类和无监督学习开始，逐一讲解每种机器学习算法的工作原理，并在每一章的后给出了详细的案例讨论。高质量的数据是能够进行正确分析的前提，为了便于后期分析模型的构建，本书还会介绍对于不同类型数据的清洗和过滤等内容。通过学习本书的内容，读者将了解将原始数据转化为重要结论的过程，并掌握快速将其中涉及的模型应用到自有数据中的方法。译者序
关于审稿人
前言
第1章数据转换成决策——从分析应用着手
1.1设计高级分析方案
1.1.1数据层：数据仓库、数据湖和数据流
1.1.2模型层
1.1.3部署层
1.1.4报告层
1.2案例学习：社交媒体数据的情感分析
1.2.1数据输入和转换
1.2.2合理性检查
1.2.3模型开发
1.2.4评分
1.2.5可视化和报告
1.3案例学习：针对性电子邮件活动
1.3.1数据输入和转换
1.3.2合理性检查
1.3.3模型开发
1.3.4评分
1.3.5可视化和报告
1.4总结
第2章Python数据分析和可视化初探
2.1在IPython中探索分类和数值型数据
2.1.1安装IPython notebook
2.1.2notebook的界面
2.1.3加载和检视数据
2.1.4基本操作——分组、过滤、映射以及透视
2.1.5用Matplotlib绘制图表
2.2时间序列分析
2.2.1清洗和转换
2.2.2时间序列诊断
2.2.3连接信号和相关性
2.3操作地理数据
2.3.1加载地理数据
2.3.2工作在云上
2.4PySpark简介
2.4.1创建SparkContext
2.4.2创建RDD
2.4.3创建Spark DataFrame
2.4总结
第3章在噪声中探求模式——聚类和无监督学习
3.1相似性和距离度量
3.1.1数值距离度量
3.1.2相关相似性度量和时间序列
3.1.3分类数据的相似性度量
3.1.4k均值聚类
3.2近邻传播算法——自动选择聚类数量
3.3k中心点算法
3.4凝聚聚类算法
3.5Spark中的数据流聚类
3.6总结
第4章从点到模型——回归方法
4.1线性回归
4.1.1数据准备
4.1.2模型拟合和评价
4.1.3回归输出的显著性差异
4.1.4广义估计方程
4.1.5混合效应模型
4.1.6时间序列数据
4.1.7广义线性模型
4.1.8线性模型的正则化
4.2树方法
4.2.1决策树
4.2.2随机森林
4.3利用PySpark进一步扩展——预测歌曲的发行年份
4.4总结
第5章数据分类——分类方法和分析
5.1逻辑回归
5.1.1多分类逻辑分类器：多元回归
5.1.2分类问题中的数据格式化
5.1.3基于随机梯度下降法的学习逐点更新
5.1.4使用二阶方法联合优化所有参数
5.2拟合模型
5.3评估分类模型
5.4通过支持向量机分离非线性边界
5.4.1人口普查数据的拟合和SVM
5.4.2Boosting:组合小模型以改善准确度
5.4.3梯度提升决策树
5.5分类方法比较
5.6案例学习：在PySpark中拟合分类器模型
5.7总结
第6章词语和像素——非结构化数据分析
6.1文本数据分析
6.1.1文本数据清洗
6.1.2从文本数据中提取特征
6.1.3利用降维来简化数据集
6.2主分量分析
6.2.1隐含狄利克雷分布
6.2.2在预测模型中使用降维
6.3图像
6.3.1图像数据清洗
6.3.2利用图像阈值来突出显示对象
6.3.3图像分析中的降维
6.4案例学习：在PySpark中训练一个推荐系统
6.5总结
第7章自底向上学习——深度网络和无监督特征
7.1使用神经网络学习模式
7.1.1单一感知器构成的网络
7.1.2感知器组合——一个单层神经网络
7.1.3反向传播的参数拟合
7.1.4判别式模型与生成式模型
7.1.5梯度消失及“解去”
7.1.6预训练信念网络（贝叶斯网络）
7.1.7使用dropout来正则化网络
7.1.8卷积网络和纠正单元
7.1.9利用自编码网络压缩数据
7.1.10优化学习速率
7.2TensorFlow库与数字识别
7.2.1MNIST数据
7.2.2构建网络
7.3总结
第8章利用预测服务共享模型
8.1预测服务的架构
8.2客户端和发出请求
8.2.1GET请求
8.2.2POST请求
8.2.3HEAD请求
8.2.4PUT请求
8.2.5DELETE请求
8.3服务器——Web流量控制器
8.4利用数据库系统持久化存储信息
8.5案例学习——逻辑回归服务
8.5.1建立数据库
8.5.2Web服务器
8.5.3Web应用
8.6总结
第9章报告和测试——分析型系统迭代
9.1利用诊断检查模型的健康度
9.1.1评估模型性能的变化
9.1.2特征重要性的变化
9.1.3无监督模型性能的变化
9.2通过A/B测试对模型进行迭代
9.2.1实验分配——将客户分配给实验
9.2.2决定样本大小
9.2.3多重假设检验
9.3沟通指南
9.3.1将术语转换为业务价值
9.3.2可视化结果
9.3.3报告服务器
9.3.4报告应用
9.3.5可视化层
9.4总结
内容简介:
本书着重介绍预测性分析技术，先概述了数据分析系统的基本架构和主要处理流程，然后从分类和无监督学习开始，逐一讲解每种机器学习算法的工作原理，并在每一章的后给出了详细的案例讨论。高质量的数据是能够进行正确分析的前提，为了便于后期分析模型的构建，本书还会介绍对于不同类型数据的清洗和过滤等内容。通过学习本书的内容，读者将了解将原始数据转化为重要结论的过程，并掌握快速将其中涉及的模型应用到自有数据中的方法。
目录:
译者序
关于审稿人
前言
第1章数据转换成决策——从分析应用着手
1.1设计高级分析方案
1.1.1数据层：数据仓库、数据湖和数据流
1.1.2模型层
1.1.3部署层
1.1.4报告层
1.2案例学习：社交媒体数据的情感分析
1.2.1数据输入和转换
1.2.2合理性检查
1.2.3模型开发
1.2.4评分
1.2.5可视化和报告
1.3案例学习：针对性电子邮件活动
1.3.1数据输入和转换
1.3.2合理性检查
1.3.3模型开发
1.3.4评分
1.3.5可视化和报告
1.4总结
第2章Python数据分析和可视化初探
2.1在IPython中探索分类和数值型数据
2.1.1安装IPython notebook
2.1.2notebook的界面
2.1.3加载和检视数据
2.1.4基本操作——分组、过滤、映射以及透视
2.1.5用Matplotlib绘制图表
2.2时间序列分析
2.2.1清洗和转换
2.2.2时间序列诊断
2.2.3连接信号和相关性
2.3操作地理数据
2.3.1加载地理数据
2.3.2工作在云上
2.4PySpark简介
2.4.1创建SparkContext
2.4.2创建RDD
2.4.3创建Spark DataFrame
2.4总结
第3章在噪声中探求模式——聚类和无监督学习
3.1相似性和距离度量
3.1.1数值距离度量
3.1.2相关相似性度量和时间序列
3.1.3分类数据的相似性度量
3.1.4k均值聚类
3.2近邻传播算法——自动选择聚类数量
3.3k中心点算法
3.4凝聚聚类算法
3.5Spark中的数据流聚类
3.6总结
第4章从点到模型——回归方法
4.1线性回归
4.1.1数据准备
4.1.2模型拟合和评价
4.1.3回归输出的显著性差异
4.1.4广义估计方程
4.1.5混合效应模型
4.1.6时间序列数据
4.1.7广义线性模型
4.1.8线性模型的正则化
4.2树方法
4.2.1决策树
4.2.2随机森林
4.3利用PySpark进一步扩展——预测歌曲的发行年份
4.4总结
第5章数据分类——分类方法和分析
5.1逻辑回归
5.1.1多分类逻辑分类器：多元回归
5.1.2分类问题中的数据格式化
5.1.3基于随机梯度下降法的学习逐点更新
5.1.4使用二阶方法联合优化所有参数
5.2拟合模型
5.3评估分类模型
5.4通过支持向量机分离非线性边界
5.4.1人口普查数据的拟合和SVM
5.4.2Boosting:组合小模型以改善准确度
5.4.3梯度提升决策树
5.5分类方法比较
5.6案例学习：在PySpark中拟合分类器模型
5.7总结
第6章词语和像素——非结构化数据分析
6.1文本数据分析
6.1.1文本数据清洗
6.1.2从文本数据中提取特征
6.1.3利用降维来简化数据集
6.2主分量分析
6.2.1隐含狄利克雷分布
6.2.2在预测模型中使用降维
6.3图像
6.3.1图像数据清洗
6.3.2利用图像阈值来突出显示对象
6.3.3图像分析中的降维
6.4案例学习：在PySpark中训练一个推荐系统
6.5总结
第7章自底向上学习——深度网络和无监督特征
7.1使用神经网络学习模式
7.1.1单一感知器构成的网络
7.1.2感知器组合——一个单层神经网络
7.1.3反向传播的参数拟合
7.1.4判别式模型与生成式模型
7.1.5梯度消失及“解去”
7.1.6预训练信念网络（贝叶斯网络）
7.1.7使用dropout来正则化网络
7.1.8卷积网络和纠正单元
7.1.9利用自编码网络压缩数据
7.1.10优化学习速率
7.2TensorFlow库与数字识别
7.2.1MNIST数据
7.2.2构建网络
7.3总结
第8章利用预测服务共享模型
8.1预测服务的架构
8.2客户端和发出请求
8.2.1GET请求
8.2.2POST请求
8.2.3HEAD请求
8.2.4PUT请求
8.2.5DELETE请求
8.3服务器——Web流量控制器
8.4利用数据库系统持久化存储信息
8.5案例学习——逻辑回归服务
8.5.1建立数据库
8.5.2Web服务器
8.5.3Web应用
8.6总结
第9章报告和测试——分析型系统迭代
9.1利用诊断检查模型的健康度
9.1.1评估模型性能的变化
9.1.2特征重要性的变化
9.1.3无监督模型性能的变化
9.2通过A/B测试对模型进行迭代
9.2.1实验分配——将客户分配给实验
9.2.2决定样本大小
9.2.3多重假设检验
9.3沟通指南
9.3.1将术语转换为业务价值
9.3.2可视化结果
9.3.3报告服务器
9.3.4报告应用
9.3.5可视化层
9.4总结

查看详情

相关分类

计算机理论编程与开发操作系统大数据与云计算图形图像/多媒体网站设计与网页开发网络与通讯硬件、嵌入式开发办公软件信息安全辅助设计与工程计算软件工程/开发项目管理

预测分析：Python语言实现正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

新起点书店

北京市海淀区

平均发货23小时成功完成率89.86%

￥22.51

券

100减20

立即购买加入购物车
预测分析：Python语言实现正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

图书-天下的书店

北京市东城区

平均发货25小时成功完成率89.17%

￥22.30

券

100减20

立即购买加入购物车
预测分析：Python语言实现

全新

尚贤文化东营分店

河北省保定市

平均发货32小时成功完成率87.96%

￥23.10

券

100减20

立即购买加入购物车
预测分析

全新

宸轩图书

河北省保定市

平均发货23小时成功完成率86.22%

￥21.68

券

100减20

立即购买加入购物车不属于本条目
预测分析美约瑟夫巴布科克 Joseph Babcock 机械工业出版社 9787111573890

八五品

旧书云旗舰店

四川省成都市

平均发货8小时成功完成率93.63%

￥23.50

券

100减20

立即购买加入购物车不属于本条目
【正版书籍】预测分析正版图书，可开发票。

全新

乐益图书批发

河北省保定市

平均发货22小时成功完成率81.4%

￥30.70

券

100减20

立即购买加入购物车不属于本条目
预测分析：Python语言实现正版二手书，图片套装请联系客服再下单，均有笔记不影响使用，无赠品、光盘、MP149603等

八五品

诚信旧书社

山东省枣庄市

平均发货9小时成功完成率87.97%

￥21.55

券

100减20

立即购买加入购物车
预测分析：Python语言实现正版二手书，图片套装的图书是其中一本，购买前请联系客服

八五品

古籍旧书院

山东省济南市

平均发货8小时成功完成率94.17%

￥26.55

券

100减20

立即购买加入购物车
预测分析：Python语言实现正版

九品

学友图书

湖北省孝感市

平均发货9小时成功完成率85.65%

￥5.00

券

100减20

立即购买加入购物车不属于本条目
预测分析：Python语言实现

全新

第一家的书店

福建省福州市

平均发货5小时成功完成率94.19%

￥26.20

券

100减20

立即购买加入购物车不属于本条目
预测分析：Python语言实现批量上传，套装书可能不全，下单前咨询在线客服！图书都是8-9成新，少量笔记，不影响阅读使用！光盘、学习卡、附件等默认不带，有特殊要求，下单前请咨询客服！

九品

暖冬图书专营店

北京市通州区

平均发货7小时成功完成率90.26%

￥22.60

券

100减20

立即购买加入购物车
预测分析：Python语言实现批量上传，套装书可能不全，下单前咨询在线客服！图书都是8-9成新，少量笔记，不影响阅读使用！光盘、学习卡、附件等默认不带，有特殊要求，下单前请咨询客服！

九品

京城图书城

广东省佛山市

平均发货7小时成功完成率93.1%

￥22.60

券

100减20

立即购买加入购物车
10

预测分析美约瑟夫巴布科克JosephBabcock机械工业9787111573890

八五品

一亩田书院

重庆市沙坪坝区

平均发货8小时成功完成率84.15%

￥15.92

券

100减20

立即购买加入购物车不属于本条目
预测分析：Python语言实现批量上传，套装书可能不全，下单前咨询在线客服！图书都是8-9成新，少量笔记，不影响阅读使用！光盘、学习卡、附件等默认不带，有特殊要求，下单前请咨询客服！

九品

涛闻天下书店

河北省廊坊市

平均发货7小时成功完成率94.54%

￥22.60

券

100减20

立即购买加入购物车
3

预测分析：Python语言实现

八五品

江城凯文书店

湖北省武汉市

平均发货5小时成功完成率96.77%

￥8.00

券

100减20

立即购买加入购物车
7

预测分析：Python语言实现【内页干净实物拍摄】

2017-08 印刷
印次: 1

九品

京师书局

北京市昌平区

平均发货8小时成功完成率97.45%

￥5.00

券

100减20

立即购买加入购物车不属于本条目
6

预测分析：Python语言实现

八五品

林密书店

重庆市九龙坡区

平均发货6小时成功完成率91.69%

￥10.00

券

100减20

立即购买加入购物车
6

预测分析：Python语言实现正版现货：实物拍摄，

九品

县周书店

北京市朝阳区

平均发货7小时成功完成率95.82%

￥20.00

券

100减20

立即购买加入购物车
2

预测分析：Python语言实现

八五品

江城凯文书店

湖北省武汉市

平均发货5小时成功完成率96.77%

￥15.00

券

100减20

立即购买加入购物车
5

预测分析：Python语言实现

九品

亿桥图书

安徽省马鞍山市

平均发货6小时成功完成率96.77%

￥11.90

券

100减20

立即购买加入购物车
6

预测分析：Python语言实现

九品

深夜书店

北京市昌平区

平均发货7小时成功完成率97.67%

￥18.00

券

100减20

立即购买加入购物车
5

预测分析：Python语言实现

2017年印刷

九品

岁月留金藏书阁

广东省惠州市

平均发货24小时成功完成率93.99%

￥18.00

券

100减20

立即购买加入购物车不属于本条目
2

预测分析：Python语言实现

九品

玄伍书店

河北省保定市

平均发货10小时成功完成率94.2%

￥30.00

券

100减20

立即购买加入购物车
预测分析：Python语言实现

九品

帅帅书社

北京市朝阳区

平均发货9小时成功完成率96.28%

￥30.00

券

100减20

立即购买加入购物车
预测分析

九五品

五星书城的书店

北京市东城区

平均发货19小时成功完成率76.39%

￥20.65

券

100减20

立即购买加入购物车不属于本条目
全新正版预测分析：Python语言实现9787111573890 正版书籍，放心下单。绝大部分是新书，个别品相折痕的，我们会主动联系哦

全新

东方宝藏一正版专营店的书店

河北省保定市

平均发货10小时成功完成率85.59%

￥27.80

券

100减20

立即购买加入购物车不属于本条目
【正版书籍】预测分析正版图书，可开发票。

全新

人龙正版图书批发

河北省保定市

平均发货19小时成功完成率82.38%

￥33.00

券

100减20

立即购买加入购物车不属于本条目
4

预测分析：Python语言实现

九品

海明图书社

河南省周口市

平均发货7小时成功完成率94.74%

￥15.00

券

100减20

立即购买加入购物车
【正版书籍】预测分析正版图书，欢迎购买。

全新

尚壹正版书城

河北省保定市

平均发货7小时成功完成率82.04%

￥30.70

券

100减20

立即购买加入购物车不属于本条目
预测分析：Python语言实现正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

诚意正心书店

北京市海淀区

平均发货24小时成功完成率83.23%

￥22.59

券

100减20

立即购买加入购物车
【正版新书】预测分析正版书籍，批量上传以标题为准哦，任何问题可以致电 18250823459

全新

湖街书店

河北省保定市

平均发货7小时成功完成率84.68%

￥36.90

券

100减20

立即购买加入购物车不属于本条目
预测分析：Python语言实现

全新

书籍供应的书店

福建省福州市

平均发货6小时成功完成率94.34%

￥22.00

券

100减20

立即购买加入购物车不属于本条目
预测分析：Python语言实现正版库存

九五品

慧雲阁

江苏省宿迁市

平均发货19小时成功完成率80%

￥59.00

券

100减20

立即购买加入购物车
二手预测分析：Python语言实现约瑟夫巴布科克机械工业出版社 9 二手教材，有少量笔记划线，包正版，多本联系客服

八五品

予歌书屋

江西省南昌市

平均发货12小时成功完成率75.86%

￥28.80

券

100减20

立即购买加入购物车不属于本条目
预测分析：Python语言实现【标题与图片不一致时,请质询，正版有货可开发票】

全新

博雅书库

北京市东城区

平均发货21小时成功完成率85.16%

￥42.00

券

100减20

立即购买加入购物车不属于本条目
预测分析：Python语言实现 9.78711E+12

九品

仟寻书局

北京市朝阳区

平均发货31小时成功完成率85.38%

￥42.00

券

100减20

立即购买加入购物车不属于本条目
二手正版预测分析：Python语言实现约瑟夫巴布科克机械工业出版社 9787111573890

九品

凯旋金融中心书店

江西省吉安市

平均发货48小时成功完成率85.1%

￥78.20

券

100减20

立即购买加入购物车不属于本条目
预测分析

九五品

伴我侗行

江苏省南京市

平均发货23小时成功完成率78.99%

￥14.00

券

100减20

立即购买加入购物车不属于本条目
预测分析：Python语言实现二手预测分析：Python语言实现约瑟夫巴布科克机械工业出版社9787111573890

八五品

红富书店

湖南省长沙市

平均发货14小时成功完成率94.81%

￥19.00

券

100减20

立即购买加入购物车
预测分析：Python语言实现

九五品

qingtianyqs的书摊

北京市朝阳区

￥46.00

券

100减20

立即购买加入购物车