预测分析:Python语言实现

预测分析:Python语言实现
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] ,
2017-08
版次: 1
ISBN: 9787111573890
定价: 59.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 199页
15人买过
  • 本书着重介绍预测性分析技术,先概述了数据分析系统的基本架构和主要处理流程,然后从分类和无监督学习开始,逐一讲解每种机器学习算法的工作原理,并在每一章的后给出了详细的案例讨论。高质量的数据是能够进行正确分析的前提,为了便于后期分析模型的构建,本书还会介绍对于不同类型数据的清洗和过滤等内容。通过学习本书的内容,读者将了解将原始数据转化为重要结论的过程,并掌握快速将其中涉及的模型应用到自有数据中的方法。 译者序 
    关于审稿人 
    前言 
    第1章数据转换成决策——从分析应用着手 
    1.1设计高级分析方案 
    1.1.1数据层:数据仓库、数据湖和数据流 
    1.1.2模型层 
    1.1.3部署层 
    1.1.4报告层 
    1.2案例学习:社交媒体数据的情感分析 
    1.2.1数据输入和转换 
    1.2.2合理性检查 
    1.2.3模型开发 
    1.2.4评分 
    1.2.5可视化和报告 
    1.3案例学习:针对性电子邮件活动 
    1.3.1数据输入和转换 
    1.3.2合理性检查 
    1.3.3模型开发 
    1.3.4评分 
    1.3.5可视化和报告 
    1.4总结 
    第2章Python数据分析和可视化初探 
    2.1在IPython中探索分类和数值型数据 
    2.1.1安装IPython notebook 
    2.1.2notebook的界面 
    2.1.3加载和检视数据 
    2.1.4基本操作——分组、过滤、映射以及透视 
    2.1.5用Matplotlib绘制图表 
    2.2时间序列分析 
    2.2.1清洗和转换 
    2.2.2时间序列诊断 
    2.2.3连接信号和相关性 
    2.3操作地理数据 
    2.3.1加载地理数据 
    2.3.2工作在云上 
    2.4PySpark简介 
    2.4.1创建SparkContext 
    2.4.2创建RDD 
    2.4.3创建Spark DataFrame 
    2.4总结 
    第3章在噪声中探求模式——聚类和无监督学习 
    3.1相似性和距离度量 
    3.1.1数值距离度量 
    3.1.2相关相似性度量和时间序列 
    3.1.3分类数据的相似性度量 
    3.1.4k均值聚类 
    3.2近邻传播算法——自动选择聚类数量 
    3.3k中心点算法 
    3.4凝聚聚类算法 
    3.5Spark中的数据流聚类 
    3.6总结 
    第4章从点到模型——回归方法 
    4.1线性回归 
    4.1.1数据准备 
    4.1.2模型拟合和评价 
    4.1.3回归输出的显著性差异 
    4.1.4广义估计方程 
    4.1.5混合效应模型 
    4.1.6时间序列数据 
    4.1.7广义线性模型 
    4.1.8线性模型的正则化 
    4.2树方法 
    4.2.1决策树 
    4.2.2随机森林 
    4.3利用PySpark进一步扩展——预测歌曲的发行年份 
    4.4总结 
    第5章数据分类——分类方法和分析 
    5.1逻辑回归 
    5.1.1多分类逻辑分类器:多元回归 
    5.1.2分类问题中的数据格式化 
    5.1.3基于随机梯度下降法的学习逐点更新 
    5.1.4使用二阶方法联合优化所有参数 
    5.2拟合模型 
    5.3评估分类模型 
    5.4通过支持向量机分离非线性边界 
    5.4.1人口普查数据的拟合和SVM 
    5.4.2Boosting:组合小模型以改善准确度 
    5.4.3梯度提升决策树 
    5.5分类方法比较 
    5.6案例学习:在PySpark中拟合分类器模型 
    5.7总结 
    第6章词语和像素——非结构化数据分析 
    6.1文本数据分析 
    6.1.1文本数据清洗 
    6.1.2从文本数据中提取特征 
    6.1.3利用降维来简化数据集 
    6.2主分量分析 
    6.2.1隐含狄利克雷分布 
    6.2.2在预测模型中使用降维 
    6.3图像 
    6.3.1图像数据清洗 
    6.3.2利用图像阈值来突出显示对象 
    6.3.3图像分析中的降维 
    6.4案例学习:在PySpark中训练一个推荐系统 
    6.5总结 
    第7章自底向上学习——深度网络和无监督特征 
    7.1使用神经网络学习模式 
    7.1.1单一感知器构成的网络 
    7.1.2感知器组合——一个单层神经网络 
    7.1.3反向传播的参数拟合 
    7.1.4判别式模型与生成式模型 
    7.1.5梯度消失及“解去” 
    7.1.6预训练信念网络(贝叶斯网络) 
    7.1.7使用dropout来正则化网络 
    7.1.8卷积网络和纠正单元 
    7.1.9利用自编码网络压缩数据 
    7.1.10优化学习速率 
    7.2TensorFlow库与数字识别 
    7.2.1MNIST数据 
    7.2.2构建网络 
    7.3总结 
    第8章利用预测服务共享模型 
    8.1预测服务的架构 
    8.2客户端和发出请求 
    8.2.1GET请求 
    8.2.2POST请求 
    8.2.3HEAD请求 
    8.2.4PUT请求 
    8.2.5DELETE请求 
    8.3服务器——Web流量控制器 
    8.4利用数据库系统持久化存储信息 
    8.5案例学习——逻辑回归服务 
    8.5.1建立数据库 
    8.5.2Web服务器 
    8.5.3Web应用 
    8.6总结 
    第9章报告和测试——分析型系统迭代 
    9.1利用诊断检查模型的健康度 
    9.1.1评估模型性能的变化 
    9.1.2特征重要性的变化 
    9.1.3无监督模型性能的变化 
    9.2通过A/B测试对模型进行迭代 
    9.2.1实验分配——将客户分配给实验 
    9.2.2决定样本大小 
    9.2.3多重假设检验 
    9.3沟通指南 
    9.3.1将术语转换为业务价值 
    9.3.2可视化结果 
    9.3.3报告服务器 
    9.3.4报告应用 
    9.3.5可视化层 
    9.4总结
  • 内容简介:
    本书着重介绍预测性分析技术,先概述了数据分析系统的基本架构和主要处理流程,然后从分类和无监督学习开始,逐一讲解每种机器学习算法的工作原理,并在每一章的后给出了详细的案例讨论。高质量的数据是能够进行正确分析的前提,为了便于后期分析模型的构建,本书还会介绍对于不同类型数据的清洗和过滤等内容。通过学习本书的内容,读者将了解将原始数据转化为重要结论的过程,并掌握快速将其中涉及的模型应用到自有数据中的方法。
  • 目录:
    译者序 
    关于审稿人 
    前言 
    第1章数据转换成决策——从分析应用着手 
    1.1设计高级分析方案 
    1.1.1数据层:数据仓库、数据湖和数据流 
    1.1.2模型层 
    1.1.3部署层 
    1.1.4报告层 
    1.2案例学习:社交媒体数据的情感分析 
    1.2.1数据输入和转换 
    1.2.2合理性检查 
    1.2.3模型开发 
    1.2.4评分 
    1.2.5可视化和报告 
    1.3案例学习:针对性电子邮件活动 
    1.3.1数据输入和转换 
    1.3.2合理性检查 
    1.3.3模型开发 
    1.3.4评分 
    1.3.5可视化和报告 
    1.4总结 
    第2章Python数据分析和可视化初探 
    2.1在IPython中探索分类和数值型数据 
    2.1.1安装IPython notebook 
    2.1.2notebook的界面 
    2.1.3加载和检视数据 
    2.1.4基本操作——分组、过滤、映射以及透视 
    2.1.5用Matplotlib绘制图表 
    2.2时间序列分析 
    2.2.1清洗和转换 
    2.2.2时间序列诊断 
    2.2.3连接信号和相关性 
    2.3操作地理数据 
    2.3.1加载地理数据 
    2.3.2工作在云上 
    2.4PySpark简介 
    2.4.1创建SparkContext 
    2.4.2创建RDD 
    2.4.3创建Spark DataFrame 
    2.4总结 
    第3章在噪声中探求模式——聚类和无监督学习 
    3.1相似性和距离度量 
    3.1.1数值距离度量 
    3.1.2相关相似性度量和时间序列 
    3.1.3分类数据的相似性度量 
    3.1.4k均值聚类 
    3.2近邻传播算法——自动选择聚类数量 
    3.3k中心点算法 
    3.4凝聚聚类算法 
    3.5Spark中的数据流聚类 
    3.6总结 
    第4章从点到模型——回归方法 
    4.1线性回归 
    4.1.1数据准备 
    4.1.2模型拟合和评价 
    4.1.3回归输出的显著性差异 
    4.1.4广义估计方程 
    4.1.5混合效应模型 
    4.1.6时间序列数据 
    4.1.7广义线性模型 
    4.1.8线性模型的正则化 
    4.2树方法 
    4.2.1决策树 
    4.2.2随机森林 
    4.3利用PySpark进一步扩展——预测歌曲的发行年份 
    4.4总结 
    第5章数据分类——分类方法和分析 
    5.1逻辑回归 
    5.1.1多分类逻辑分类器:多元回归 
    5.1.2分类问题中的数据格式化 
    5.1.3基于随机梯度下降法的学习逐点更新 
    5.1.4使用二阶方法联合优化所有参数 
    5.2拟合模型 
    5.3评估分类模型 
    5.4通过支持向量机分离非线性边界 
    5.4.1人口普查数据的拟合和SVM 
    5.4.2Boosting:组合小模型以改善准确度 
    5.4.3梯度提升决策树 
    5.5分类方法比较 
    5.6案例学习:在PySpark中拟合分类器模型 
    5.7总结 
    第6章词语和像素——非结构化数据分析 
    6.1文本数据分析 
    6.1.1文本数据清洗 
    6.1.2从文本数据中提取特征 
    6.1.3利用降维来简化数据集 
    6.2主分量分析 
    6.2.1隐含狄利克雷分布 
    6.2.2在预测模型中使用降维 
    6.3图像 
    6.3.1图像数据清洗 
    6.3.2利用图像阈值来突出显示对象 
    6.3.3图像分析中的降维 
    6.4案例学习:在PySpark中训练一个推荐系统 
    6.5总结 
    第7章自底向上学习——深度网络和无监督特征 
    7.1使用神经网络学习模式 
    7.1.1单一感知器构成的网络 
    7.1.2感知器组合——一个单层神经网络 
    7.1.3反向传播的参数拟合 
    7.1.4判别式模型与生成式模型 
    7.1.5梯度消失及“解去” 
    7.1.6预训练信念网络(贝叶斯网络) 
    7.1.7使用dropout来正则化网络 
    7.1.8卷积网络和纠正单元 
    7.1.9利用自编码网络压缩数据 
    7.1.10优化学习速率 
    7.2TensorFlow库与数字识别 
    7.2.1MNIST数据 
    7.2.2构建网络 
    7.3总结 
    第8章利用预测服务共享模型 
    8.1预测服务的架构 
    8.2客户端和发出请求 
    8.2.1GET请求 
    8.2.2POST请求 
    8.2.3HEAD请求 
    8.2.4PUT请求 
    8.2.5DELETE请求 
    8.3服务器——Web流量控制器 
    8.4利用数据库系统持久化存储信息 
    8.5案例学习——逻辑回归服务 
    8.5.1建立数据库 
    8.5.2Web服务器 
    8.5.3Web应用 
    8.6总结 
    第9章报告和测试——分析型系统迭代 
    9.1利用诊断检查模型的健康度 
    9.1.1评估模型性能的变化 
    9.1.2特征重要性的变化 
    9.1.3无监督模型性能的变化 
    9.2通过A/B测试对模型进行迭代 
    9.2.1实验分配——将客户分配给实验 
    9.2.2决定样本大小 
    9.2.3多重假设检验 
    9.3沟通指南 
    9.3.1将术语转换为业务价值 
    9.3.2可视化结果 
    9.3.3报告服务器 
    9.3.4报告应用 
    9.3.5可视化层 
    9.4总结
查看详情
系列丛书 / 更多
预测分析:Python语言实现
大数据导论
彭智勇 译
预测分析:Python语言实现
统计学习导论 基于R应用
[美]加雷斯·詹姆斯、丹妮拉·威滕、特雷弗·哈斯帖 著;王星 译
预测分析:Python语言实现
大数据分析原理与实践
王宏志 著
预测分析:Python语言实现
Python机器学习
高明、徐莹、陶虎成 译
预测分析:Python语言实现
机器学习与R语言(原书第2版)
李洪成、许金炜、李舰 译
预测分析:Python语言实现
Python机器学习(原书第2版)
瓦希德·米 著;塞巴斯蒂安·拉施卡(Sebastian Raschka)、陈斌 译
预测分析:Python语言实现
基于R语言的自动数据收集:网络抓取和文本挖掘实用指南
[德]西蒙·蒙策尔特 著;吴今朝 译
预测分析:Python语言实现
基于MPI的大数据高性能计算导论
弗兰克·尼尔森(Frank Nielsen) 著;张伟哲 译
预测分析:Python语言实现
机器学习与R语言
[美]Brett Lantz 著;李洪成、许金炜、李舰 译
预测分析:Python语言实现
Python金融数据分析
Weiming 著;杰姆斯·马伟明(James、Ma、高明 译
预测分析:Python语言实现
统计机器学习导论
[日]杉山将 著;谢宁 译
预测分析:Python语言实现
Python文本分析
[印度]迪潘简·撒卡尔 著;闫龙川 高德荃 李君婷 译
相关图书 / 更多
预测分析:Python语言实现
预测理论与方法及其MATLAB实现
许国根;贾瑛;黄智勇;沈可可
预测分析:Python语言实现
预测性分析:基于数据科学的方法(原书第2版)
杜尔森·德伦(Dursun Delen)
预测分析:Python语言实现
预测经济、周期与市场泡沫洪灏著中信出版社
洪灝 著
预测分析:Python语言实现
预测模型的优化及应用
吴洁
预测分析:Python语言实现
预测性维护——高端装备数字化转型升级指南
王成城 王金江 王凯
预测分析:Python语言实现
预测毒理学与替代方法
程树军、王慧 编
预测分析:Python语言实现
预测模型实战:基于R、SPSS和Stata(新时代·技术新未来)
武松 著
预测分析:Python语言实现
预测心智
[挪威]雅克布·霍威 著;王静、万舒婵 译
预测分析:Python语言实现
预测算法:具身智能如何应对不确定性
[英]安迪·克拉克(Andy Clark) 著;刘林澍 译
预测分析:Python语言实现
预测死亡的兔子(随书赠送鲁本斯世界名画拼图 无罪谋杀系列作者悬疑新作。沉浸式剧本杀体验,每一局都在生死之间)
宇尘
预测分析:Python语言实现
预测之心/震苑晚晴系列文化丛书·第八辑
中国地震局地震预测研究所、中国地震局离退休干部办公室 编
预测分析:Python语言实现
预测卷化学全国卷全国高中名校名师原创预测卷2021学年适用--天星教育
天星教育研究院 著;杜志建 编
您可能感兴趣 / 更多
预测分析:Python语言实现
归属感:如何通过社群获得商业竞争优势
[美]大卫·斯平克斯(David Spinks) 著;颉腾文化 出品
预测分析:Python语言实现
《城市的夜晚》2024百班千人暑期书目小学生1年级名师推荐全新正版现货速发
[美]朱莉·唐宁 著;冷玉斌 冷念则 译
预测分析:Python语言实现
雪花的故事(用照片展示雪花的秘密,为你揭开冬日奇景的奥秘)
[美]马克·卡西诺[美]乔恩·尼尔森
预测分析:Python语言实现
进阶书系-国际史的技艺
[美] 马克·特拉亨伯格
预测分析:Python语言实现
杜甫传
[美]弗洛伦斯.艾思柯
预测分析:Python语言实现
神奇的数字零:从数字0开始的极简数学史和人类发展史
[美]查尔斯·塞弗(Charles Seife)著 杨杨立汝 译
预测分析:Python语言实现
爵士乐史(精装本)
[美]泰德·乔亚 著
预测分析:Python语言实现
环境的科学 (平装版)
[美]威廉·坎宁安 后浪
预测分析:Python语言实现
美利坚在燃烧:20世纪60年代以来的警察暴力与黑人反抗
[美]伊丽莎白·欣顿 著 胡位钧 译
预测分析:Python语言实现
数学侦探 游乐园里的古怪笑脸
[美]丹尼尔·肯尼 艾米丽·博艾尔 著 刘玙婧、王婧 译;小博集出品
预测分析:Python语言实现
儒教中国及其现代命运(三部曲)
[美]列文森 作者;[中]季剑青 译者
预测分析:Python语言实现
逃家小兔成长绘本系列
[美]玛格丽特.怀兹.布朗