轻松学大数据挖掘：算法、场景与数据产品

作者: 汪榕著

出版社: 电子工业出版社

出版时间: 2018-01

版次: 1

ISBN: 9787121329265

定价: 59.00

装帧: 平装

开本: 16开

纸张: 胶版纸

字数: 230千字

分类: 计算机与互联网

4 张插图图片

27人买过

　　伴随着大数据时代的发展，数据价值的挖掘以及产品化逐渐被重视起来。本书作为该领域的入门教程，打破以往的数据工具与技术的介绍模式，凭借作者在大数据价值探索过程中的所感所悟，以故事的形式和读者分享一个又一个的数据经历，引人深思、耐人寻味。全书共9章，第1～2章介绍数据情怀与数据入门；第3～6章讨论大数据挖掘相关的一系列学习体系；第7～9章为实践应用与数据产品的介绍。让所有学习大数据挖掘的朋友清楚如何落地，以及在整个数据生态圈所需要扮演的角色，全面了解数据的上下游。
　　汪榕（@乐平汪二），一个充满大数据情怀的程序员，致力于分享自己的所感所悟，为数据生态圈的健康发展贡献自己一份力量。拥有6年的业务建模经验，曾率队夺得全国大学生数据建模一等奖，并代表重庆高校队伍与全国优秀名校一起参与深圳夏令营建模比赛。
　　目前从事互联网金融行业，专注于大数据挖掘与数据产品。同时也是大数据挖掘杂谈社区的创建人，汇集了全球各地的数据爱好者，共同探索数据的价值。
第1章数据情怀篇
1.1  数据之禅
1.2  数据情怀
1.2.1  数据情怀这股劲
1.2.2  对数据情怀的理解
1.3  大数据时代的我们
1.4  成为DT时代的先驱者
1.4.1  数据没有寒冬
1.4.2  数据生态问题
1.4.3  健康的数据生态
1.4.4  结尾
第2章数据入门
2.1  快速掌握SQL的基础语法
2.1.1  初识SQL
2.1.2  学会部署环境
2.1.3  常用的SQL语法（上篇）
2.1.4  常用的SQL语法（下篇）
2.2  在Windows 7操作系统上搭建IPython Notebook
2.2.1  学习Python的初衷
2.2.2  搭建IPython Notebook
2.2.3  IPython.exe Notebook的使用说明
2.2.4  配置IPython Notebook远程调用
2.3  快速掌握Python的基本语法
2.4  用Python搭建数据分析体系
2.4.1  构建的初衷
2.4.2  构建思路
2.4.3  开发流程
2.5  Python学习总结
2.5.1  关于Python
2.5.2  Python其他知识点
第3章大数据工具篇
3.1  Hadoop伪分布式的安装配置
3.1.1  部署CentOS环境
3.1.2  部署Java环境
3.1.3  部署Hadoop伪分布式环境
3.2  数据挖掘中的MapReduce编程
3.2.1  学习MapReduce编程的目的
3.2.2  MapReduce的代码规范
3.2.3  简单的案例
3.3  利用MapReduce中的矩阵相乘
3.3.1  矩阵的概念
3.3.2  不同场景下的矩阵相乘
3.4  数据挖掘中的Hive技巧
3.4.1  面试心得
3.4.2  用Python执行HQL命令
3.4.3  必知的HQL知识
3.5  数据挖掘中的HBase技巧
3.5.1  知晓相关依赖包
3.5.2  从HBase中获取数据
3.5.3  往HBase中存储数据
第4章大数据挖掘基础篇
4.1  MapReduce和Spark做大数据挖掘的差异
4.1.1  初识Hadoop生态系统
4.1.2  知晓Spark的特点
4.1.3  编程的差异性
4.1.4  它们之间的灵活转换
4.1.5  选择合适的工具
4.2  搭建大数据挖掘开发环境
4.3  动手实现算法工程
4.3.1  知晓Spark On Yarn的运作模式
4.3.2  创作第一个数据挖掘算法
4.3.3  如何理解“朴素”二字
4.3.4  如何动手实现朴素贝叶斯算法
第5章大数据挖掘认知篇
5.1  理论与实践的差异
5.2  数据挖掘中的数据清洗
5.2.1  数据清洗的那些事
5.2.2  大数据的必杀技
5.2.3  实践中的数据清洗
5.3  数据挖掘中的工具包
5.3.1  业务模型是何物
5.3.2  想做一个好的模型
第6章大数据挖掘算法篇
6.1  时间衰变算法
6.1.1  何为时间衰变
6.1.2  如何理解兴趣和偏好
6.1.3  时间衰变算法的抽象
6.1.4  采用Spark实现模型
6.2  熵值法
6.2.1  何为信息熵
6.2.2  熵值法的实现过程
6.2.3  业务场景的介绍
6.2.4  算法逻辑的抽象
6.3  预测响应算法
6.3.1  业务场景的介绍
6.3.2  构建模型的前期工作
6.3.3  常用的预测模型
6.4  层次分析算法
6.5  工程能力的培养与实践
6.5.1  工程能力的重要性
6.5.2  利用Python实现层次分析法
第7章用户画像实践
7.1  用户画像的应用场景
7.1.1  背景描述
7.1.2  需求调研
7.2  用户画像的标签体系
7.2.1  需求分析
7.2.2  标签的构建
7.3  用户画像的模块化思维
7.3.1  何为模块化思维
7.3.2  用户画像与模块化思维
7.4  用户画像的工程开发
7.4.1  对于开发框架的选择
7.4.2  模块化功能的设计
7.5  用户画像的智能营销
7.5.1  业务营销
7.5.2  营销构思
7.5.3  技术难点
第8章反欺诈实践篇
8.1 “羊毛党”监控的业务
8.1.1 “羊毛党”的定义与特点
8.1.2 “羊毛”存在的必然性
8.1.3 “羊毛党”的进化
8.1.4 “羊毛党”存在的利与弊
8.1.5 “羊毛党”监控平台的意义
8.2 “羊毛党”监控的设备指纹
8.2.1  何为设备指纹
8.2.2  底层参数
8.2.3  应用场景
8.2.4  移动端的数据持久化
8.2.5  设备指纹生成算法
8.3 “羊毛党”监控的数据驱动
8.3.1  监控的目的
8.3.2  数据如何“食用”
8.4 “羊毛党”监控的实践分享
第9章大数据挖掘践行篇
9.1  如何从0到1转型到大数据圈子
9.2  数据挖掘从业者综合能力评估
9.2.1  度量的初衷
9.2.2  综合能力评估
9.2.3  个人指标体系（大数据挖掘）
9.3  给想要进入数据挖掘圈子的新人一点建议
9.3.1  诚信与包装
9.3.2  筹备能力
9.3.3  投好简历
9.3.4  把握面试
9.3.5  结尾
后记数据价值探索与数据产品实践
内容简介:
　　伴随着大数据时代的发展，数据价值的挖掘以及产品化逐渐被重视起来。本书作为该领域的入门教程，打破以往的数据工具与技术的介绍模式，凭借作者在大数据价值探索过程中的所感所悟，以故事的形式和读者分享一个又一个的数据经历，引人深思、耐人寻味。全书共9章，第1～2章介绍数据情怀与数据入门；第3～6章讨论大数据挖掘相关的一系列学习体系；第7～9章为实践应用与数据产品的介绍。让所有学习大数据挖掘的朋友清楚如何落地，以及在整个数据生态圈所需要扮演的角色，全面了解数据的上下游。
作者简介:
　　汪榕（@乐平汪二），一个充满大数据情怀的程序员，致力于分享自己的所感所悟，为数据生态圈的健康发展贡献自己一份力量。拥有6年的业务建模经验，曾率队夺得全国大学生数据建模一等奖，并代表重庆高校队伍与全国优秀名校一起参与深圳夏令营建模比赛。
　　目前从事互联网金融行业，专注于大数据挖掘与数据产品。同时也是大数据挖掘杂谈社区的创建人，汇集了全球各地的数据爱好者，共同探索数据的价值。
目录:
第1章数据情怀篇
1.1  数据之禅
1.2  数据情怀
1.2.1  数据情怀这股劲
1.2.2  对数据情怀的理解
1.3  大数据时代的我们
1.4  成为DT时代的先驱者
1.4.1  数据没有寒冬
1.4.2  数据生态问题
1.4.3  健康的数据生态
1.4.4  结尾
第2章数据入门
2.1  快速掌握SQL的基础语法
2.1.1  初识SQL
2.1.2  学会部署环境
2.1.3  常用的SQL语法（上篇）
2.1.4  常用的SQL语法（下篇）
2.2  在Windows 7操作系统上搭建IPython Notebook
2.2.1  学习Python的初衷
2.2.2  搭建IPython Notebook
2.2.3  IPython.exe Notebook的使用说明
2.2.4  配置IPython Notebook远程调用
2.3  快速掌握Python的基本语法
2.4  用Python搭建数据分析体系
2.4.1  构建的初衷
2.4.2  构建思路
2.4.3  开发流程
2.5  Python学习总结
2.5.1  关于Python
2.5.2  Python其他知识点
第3章大数据工具篇
3.1  Hadoop伪分布式的安装配置
3.1.1  部署CentOS环境
3.1.2  部署Java环境
3.1.3  部署Hadoop伪分布式环境
3.2  数据挖掘中的MapReduce编程
3.2.1  学习MapReduce编程的目的
3.2.2  MapReduce的代码规范
3.2.3  简单的案例
3.3  利用MapReduce中的矩阵相乘
3.3.1  矩阵的概念
3.3.2  不同场景下的矩阵相乘
3.4  数据挖掘中的Hive技巧
3.4.1  面试心得
3.4.2  用Python执行HQL命令
3.4.3  必知的HQL知识
3.5  数据挖掘中的HBase技巧
3.5.1  知晓相关依赖包
3.5.2  从HBase中获取数据
3.5.3  往HBase中存储数据
第4章大数据挖掘基础篇
4.1  MapReduce和Spark做大数据挖掘的差异
4.1.1  初识Hadoop生态系统
4.1.2  知晓Spark的特点
4.1.3  编程的差异性
4.1.4  它们之间的灵活转换
4.1.5  选择合适的工具
4.2  搭建大数据挖掘开发环境
4.3  动手实现算法工程
4.3.1  知晓Spark On Yarn的运作模式
4.3.2  创作第一个数据挖掘算法
4.3.3  如何理解“朴素”二字
4.3.4  如何动手实现朴素贝叶斯算法
第5章大数据挖掘认知篇
5.1  理论与实践的差异
5.2  数据挖掘中的数据清洗
5.2.1  数据清洗的那些事
5.2.2  大数据的必杀技
5.2.3  实践中的数据清洗
5.3  数据挖掘中的工具包
5.3.1  业务模型是何物
5.3.2  想做一个好的模型
第6章大数据挖掘算法篇
6.1  时间衰变算法
6.1.1  何为时间衰变
6.1.2  如何理解兴趣和偏好
6.1.3  时间衰变算法的抽象
6.1.4  采用Spark实现模型
6.2  熵值法
6.2.1  何为信息熵
6.2.2  熵值法的实现过程
6.2.3  业务场景的介绍
6.2.4  算法逻辑的抽象
6.3  预测响应算法
6.3.1  业务场景的介绍
6.3.2  构建模型的前期工作
6.3.3  常用的预测模型
6.4  层次分析算法
6.5  工程能力的培养与实践
6.5.1  工程能力的重要性
6.5.2  利用Python实现层次分析法
第7章用户画像实践
7.1  用户画像的应用场景
7.1.1  背景描述
7.1.2  需求调研
7.2  用户画像的标签体系
7.2.1  需求分析
7.2.2  标签的构建
7.3  用户画像的模块化思维
7.3.1  何为模块化思维
7.3.2  用户画像与模块化思维
7.4  用户画像的工程开发
7.4.1  对于开发框架的选择
7.4.2  模块化功能的设计
7.5  用户画像的智能营销
7.5.1  业务营销
7.5.2  营销构思
7.5.3  技术难点
第8章反欺诈实践篇
8.1 “羊毛党”监控的业务
8.1.1 “羊毛党”的定义与特点
8.1.2 “羊毛”存在的必然性
8.1.3 “羊毛党”的进化
8.1.4 “羊毛党”存在的利与弊
8.1.5 “羊毛党”监控平台的意义
8.2 “羊毛党”监控的设备指纹
8.2.1  何为设备指纹
8.2.2  底层参数
8.2.3  应用场景
8.2.4  移动端的数据持久化
8.2.5  设备指纹生成算法
8.3 “羊毛党”监控的数据驱动
8.3.1  监控的目的
8.3.2  数据如何“食用”
8.4 “羊毛党”监控的实践分享
第9章大数据挖掘践行篇
9.1  如何从0到1转型到大数据圈子
9.2  数据挖掘从业者综合能力评估
9.2.1  度量的初衷
9.2.2  综合能力评估
9.2.3  个人指标体系（大数据挖掘）
9.3  给想要进入数据挖掘圈子的新人一点建议
9.3.1  诚信与包装
9.3.2  筹备能力
9.3.3  投好简历
9.3.4  把握面试
9.3.5  结尾
后记数据价值探索与数据产品实践

查看详情

相关分类

计算机理论编程与开发操作系统大数据与云计算图形图像/多媒体网站设计与网页开发网络与通讯硬件、嵌入式开发办公软件信息安全辅助设计与工程计算软件工程/开发项目管理

3

轻松学大数据挖掘：算法、场景与数据产品内页干净无笔记

九品

温瞳书屋

河北省衡水市

平均发货11小时成功完成率97.15%

￥11.02

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法场景与数据产品

全新

北京九州书店

北京市朝阳区

平均发货24小时成功完成率83.22%

￥21.68

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘算法、场景与数据产品汪榕电子工业出版社 9787121329265

八五品

旧书云旗舰店

四川省成都市

平均发货8小时成功完成率93.64%

￥16.52

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法、场景与数据产品正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

图书-天下的书店

北京市东城区

平均发货25小时成功完成率89.54%

￥14.27

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品正版全新，绝无盗版，可开具图书发票

全新

碧水东乡图书专营店

四川省成都市

平均发货16小时成功完成率89.95%

￥33.10

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品

八品

转转超品的书店

天津市宝坻区

平均发货11小时成功完成率94.57%

￥7.80

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

新起点书店

北京市海淀区

平均发货22小时成功完成率89.93%

￥13.84

券

100减20

立即购买加入购物车
轻松学大数据挖掘(算法场景与数据产品) 9787121329265 全新正版可开票支持7天无理由，不清楚的请咨询客服。

全新

倒爷图书专营店

浙江省嘉兴市

平均发货13小时成功完成率94.76%

￥43.29

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘(算法场景与数据产品) 正版图书，可开发票，请放心购买。

全新

淘书宝店

广东省广州市

平均发货7小时成功完成率93.32%

￥48.28

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法、场景与数据产品数据库新华书店全新正版书籍

全新

新华文轩网络书店

江苏省无锡市

平均发货8小时成功完成率95.98%

￥35.99

券

100减20

立即购买加入购物车
轻松学大数据挖掘正版新书新华官方库房直发可开电子发票

全新

文源文化

江苏省南京市

平均发货6小时成功完成率96.35%

￥40.12

券

100减20

立即购买加入购物车不属于本条目
5

轻松学大数据挖掘数据库汪榕新华书店全新正版书籍支持7天无理由

全新

智胜图书专营店

北京市丰台区

平均发货29小时成功完成率85.91%

￥37.30

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘正版新书新华官方库房直发可开电子发票

全新

问典书店

江苏省南京市

平均发货5小时成功完成率98.24%

￥40.12

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法、场景与数据产品批量上传，套装书可能不全，下单前咨询在线客服！图书都是8-9成新，少量笔记，不影响阅读使用！光盘、学习卡、附件等默认不带，有特殊要求，下单前请咨询客服！

九品

京城图书城

广东省佛山市

平均发货7小时成功完成率92.92%

￥10.30

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品批量上传，套装书可能不全，下单前咨询在线客服！图书都是8-9成新，少量笔记，不影响阅读使用！光盘、学习卡、附件等默认不带，有特殊要求，下单前请咨询客服！

九品

暖冬图书专营店

北京市通州区

平均发货7小时成功完成率90.07%

￥10.30

券

100减20

立即购买加入购物车
轻松学大数据挖掘(算法场景与数据产品) 全新正版极速发货

全新

大智慧小美丽

广东省广州市

平均发货17小时成功完成率93.04%

￥38.59

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘(算法场景与数据产品) 全新正版极速发货

全新

谢岳书店

广东省广州市

平均发货17小时成功完成率94.75%

￥38.59

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘(算法场景与数据产品) 全新正版极速发货

全新

书香美美

广东省广州市

平均发货16小时成功完成率92.45%

￥38.59

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘全新正版假一赔十可开发票

全新

轻阅书店

北京市海淀区

平均发货9小时成功完成率97.72%

￥38.25

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法、场景与数据产品批量上传，套装书可能不全，下单前咨询在线客服！图书都是8-9成新，少量笔记，不影响阅读使用！光盘、学习卡、附件等默认不带，有特殊要求，下单前请咨询客服！

九品

涛闻天下书店

河北省廊坊市

平均发货7小时成功完成率94.43%

￥10.30

券

100减20

立即购买加入购物车
轻松学大数据挖掘:算法、场景与数据产品

九五品

灵感飞驰

北京市通州区

平均发货31小时成功完成率82.7%

￥8.00

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法、场景与数据产品正版品相完好，套书和多封面版本咨询客服后再下单

九品

旧书香书城

北京市昌平区

平均发货23小时成功完成率88.77%

￥13.49

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品新华书店全新正版书籍图书保证_可开发票_极速发货支持7天无理由

全新

學源图书专营店

浙江省嘉兴市

平均发货9小时成功完成率95.42%

￥44.30

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品

全新

百文斋書店

山东省潍坊市

平均发货19小时成功完成率80.09%

￥33.20

券

100减20

立即购买加入购物车
轻松学大数据挖掘正版新书新华官方库房直发可开电子发票

全新

江苏读客文化

江苏省南京市

平均发货14小时成功完成率83.12%

￥40.12

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘(算法场景与数据产品) 9787121329265 汪榕电子工业当天发货，全新正版书。新华书店集团直发，凡是套装书，价格异常时，请咨询后下单。

全新

白湘云书社

北京市通州区

平均发货9小时成功完成率89.9%

￥48.60

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法、场景与数据产品本店书籍，保证正版，多仓库发货，欢迎选购

八五品

再回首书店

重庆市沙坪坝区

平均发货8小时成功完成率90.1%

￥17.11

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品

八五品

上海真实库存12小时发货书店

上海市黄浦区

平均发货8小时成功完成率88.84%

￥8.99

券

100减20

立即购买加入购物车
轻松学大数据挖掘:算法、场景与数据产品汪榕著 9787121329265

九品

现货12小时发货书店

浙江省杭州市

平均发货9小时成功完成率87.73%

￥7.99

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法、场景与数据产品

八五品

南之大旧书店

江苏省苏州市

平均发货8小时成功完成率87.18%

￥9.50

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品

全新

广益书馆

河南省濮阳市

平均发货8小时成功完成率96.61%

￥18.00

券

100减20

立即购买加入购物车
2

轻松学大数据挖掘：算法、场景与数据产品

八五品

boy书店

内蒙古包头市

平均发货18小时成功完成率93.05%

￥7.00

券

100减20

立即购买加入购物车
4

轻松学大数据挖掘：算法、场景与数据产品

九品

恩阳文源书店

北京市丰台区

平均发货4小时成功完成率93.55%

￥5.00

券

100减20

立即购买加入购物车不属于本条目
4

轻松学大数据挖掘：算法、场景与数据产品

九品

双桥书屋

北京市海淀区

平均发货4小时成功完成率94.39%

￥5.00

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法场景与数据产品

全新

鄢陵县然然书店

河北省保定市

平均发货27小时成功完成率77.24%

￥21.68

券

100减20

立即购买加入购物车不属于本条目
【假一罚四】轻松学大数据挖掘(算法场景与数据产品)汪榕集团直发，全新正版书籍，假一罚四，放心选购。24小时内发货。可开发票

全新

朗朗图书书店

浙江省嘉兴市

平均发货11小时成功完成率93.09%

￥46.70

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法、场景与数据产品电子工业出版社【保正版出版社正版新书发货放心订购支持团购】

全新

书山有路图书专营店

北京市朝阳区

平均发货11小时成功完成率92.72%

￥49.00

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法、场景与数据产品汪榕著电子工业出版社9787121329265

八五品

经开未来书店

江西省南昌市

平均发货9小时成功完成率89.84%

￥16.52

券

100减20

立即购买加入购物车不属于本条目
6

轻松学大数据挖掘：算法、场景与数据产品

九品

三匹马的书店的书店

河北省衡水市

平均发货8小时成功完成率98.67%

￥4.00

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

诚意正心书店

北京市海淀区

平均发货24小时成功完成率83.41%

￥14.29

券

100减20

立即购买加入购物车
2

轻松学大数据挖掘：算法、场景与数据产品 3号B4

九品

智慧斋

辽宁省沈阳市

平均发货15小时成功完成率93.67%

￥1.00

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品正版速发带塑封

九五品

转转精品图书店的书店

天津市宝坻区

平均发货14小时成功完成率40.18%

￥13.76

券

100减20

立即购买加入购物车不属于本条目
轻松学大数据挖掘：算法、场景与数据产品

全新

八位图书

北京市房山区

平均发货12小时成功完成率73.62%

￥18.59

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品

全新

万全稀有科技书籍空间

北京市东城区

平均发货20小时成功完成率100%

￥25.00

券

100减20

立即购买加入购物车
轻松学大数据挖掘：算法、场景与数据产品

全新

六堡书摊

四川省成都市

平均发货31小时成功完成率100%

￥10.00

券

100减20

立即购买加入购物车
3

轻松学大数据挖掘：算法、场景与数据产品汪榕著 / 电子工业出版社二手正版无笔记近未阅有印章下单即发

2018-01 印刷
印次: 1

九品

研韵书斋

河北省廊坊市

平均发货11小时成功完成率85.42%

￥15.00

券

100减20

立即购买加入购物车不属于本条目

轻松学大数据挖掘：算法、场景与数据产品

内容简介:

作者简介:

目录: