New Internet:大数据挖掘
出版时间:
2013-03
版次:
1
ISBN:
9787121196706
定价:
69.00
装帧:
平装
开本:
16开
纸张:
胶版纸
页数:
376页
字数:
370千字
正文语种:
简体中文
28人买过
-
《New Internet:大数据挖掘》全面地介绍了如何使用数据挖掘技术从各种结构的(数据库)或非结构(Web)的海量数据中提取和产生业务知识。作者梳理了各种数据挖掘常用算法和信息采集技术,系统地描述了实际应用时如何在互联网日志分析、电子邮件营销、互联网广告和电子商务上进行数据挖掘,着重介绍了数据挖掘的原理和算法在互联网海量数据挖掘中的应用。
《New Internet:大数据挖掘》主要特点:全面介绍了数据挖掘和大数据的基本概念和技术;大量采用了实际案例,实用性强;详细介绍了大数据挖掘领域最新的商业应用。
谭磊,复旦大学计算机学士,美国杜克大学计算机硕士,在美国微软服务时间超过13年,曾经担任多家公司多个层级技术管理岗位,在搜索、互联网广告、数据挖掘、电子商务等方面有丰富的经验,是互联网技术领域资深专家。 第1章绪论——从淘金客到矿山主
1.1大数据时代的“四V”
1.2什么是大数据挖掘
1.2.1从数据分析到数据挖掘
1.2.2Web挖掘
1.2.3大数据挖掘之“大”
1.3大数据挖掘的国内外发展
1.3.1数据挖掘的应用发展
1.3.2数据挖掘研究发展
1.4本书内容
第2章一小时了解数据挖掘
2.1数据挖掘是如何解决问题的
2.1.1尿不湿和啤酒
2.1.2Target和怀孕预测指数
2.1.3电子商务网站流量分析
2.2分类:从人脸识别系统说起
2.2.1分类算法的应用
2.2.2数据挖掘分类技术
2.2.3分类算法的评估
2.3一切为了商业
2.3.1什么是商业智能(BusinessIntelligence)
2.3.2数据挖掘的九大定律
2.4数据挖掘很纠结
2.5数据挖掘的基本流程
2.5.1数据挖掘的一般步骤
2.5.2几个数据挖掘中常用的概念
2.5.3CRISP-DM
2.5.4数据挖掘的评估
2.5.5数据挖掘结果的知识表示
2.6本章相关资源
第3章数据仓库——数据挖掘的基石
3.1存放数据的仓库
3.1.1数据仓库的定义
3.1.2数据仓库和数据库
3.2传统的数据仓库介绍
3.3数据仓库基本结构
3.4OLAP联机分析处理
3.5云存储上的数据仓库
3.5.1Google公司的云架构
3.5.2开源的分布式系统Hadoop
3.5.3Facebook的数据仓库
3.5.4NoSQL
3.6本章相关资源
第4章数据挖掘算法及原理
4.1数据挖掘中的算法
4.2数据挖掘十大经典算法
4.3分类算法(Classification)
4.4聚类算法(Clustering)
4.5关联算法
4.5.1关联算法中的概念
4.5.2关联规则数据挖掘过程
4.5.3关联规则的分类
4.5.4Apriori算法的执行实例
4.5.5关联规则挖掘算法的研究与优化
4.6序列挖掘(SequenceMining)
4.7数据挖掘建模语言PMML
4.8本章相关资源
第5章在进行数据挖掘之前
5.1数据集成
5.2为何要做数据预处理
5.3数据预处理
5.3.1数据清理
5.3.2数据转换
5.3.3数据规约
5.4本章相关资源
第6章R语言和其他数据挖掘工具
6.1R语言的历史
6.1.1R语言的特点
6.1.2R语言和数据挖掘
6.2其他数据挖掘工具
6.2.1MATLAB
6.2.2其他商用数据挖掘工具
6.2.3开源数据挖掘工具Weka
6.3数据挖掘和云
6.4本章相关资源
第7章互联网上的日志分析
7.1网站日志简介
7.2网站日志处理
7.2.1Web日志预处理
7.2.2Web日志分析和数据挖掘
7.3邮件日志
7.4本章相关资源
第8章数据挖掘和电子邮件
8.1邮件营销与垃圾邮件过滤
8.2数据挖掘和邮件营销
8.2.1如何有效地进行邮件营销
8.2.2邮件营销案例分享之一
8.2.3邮件营销案例分享之二
8.2.4运用数据挖掘RFM模型提高邮件营销效果
8.3数据挖掘和垃圾邮件过滤
8.3.1垃圾邮件
8.3.2垃圾邮件过滤技术
8.3.3垃圾邮件过滤案例
8.4本章相关资源
第9章数据挖掘和互联网广告
9.1互联网广告
9.2广告作弊行为
9.3网站联盟广告
9.4网站联盟广告上的数据挖掘
9.4.1数据助力网盟广告
9.4.2如何应对网盟广告作弊
9.5本章相关资源
第10章数据挖掘和电子商务
10.1中国电子商务现状
10.2在互联网上卖米
10.3用数据来掌握客户
10.3.1客户何时来、从哪来
10.3.2客户最喜欢哪种商品
10.3.3竞争与反竞争分析
10.3.4客户还会买什么
10.3.5哪些客户是我们需要的
10.4电子商务案例
10.4.1电子商务企业案例一
10.4.2电子商务企业案例二
10.5本章相关资源
第11章数据挖掘和Web挖掘
11.1互联网上的个性化-Like
11.1.1Like=像
11.1.2Like=喜欢
11.2Web挖掘和SNS
11.2.1SNS上的数据价值
11.2.2SNS上的数据关联关系
11.2.3SNS上的用户关系
11.3数据挖掘和隐私
11.4本章相关资源
第12章数据挖掘和移动互联网
12.1移动互联网的特殊性
12.1.1锁定用户的数据价值
12.1.2移动互联网上数据的形式
12.1.3移动互联网地理位置信息的价值
12.2数据挖掘和LBS
12.2.1用PU学习算法做文本挖掘
12.2.2用相似匹配算法做地点挖掘
12.3移动互联网数据面临的问题
12.4本章相关资源
附录1技术词汇表
附录2英语参考文献表
附录3中文参考文献表
附录4微博
附录5博客和其他网址
-
内容简介:
《New Internet:大数据挖掘》全面地介绍了如何使用数据挖掘技术从各种结构的(数据库)或非结构(Web)的海量数据中提取和产生业务知识。作者梳理了各种数据挖掘常用算法和信息采集技术,系统地描述了实际应用时如何在互联网日志分析、电子邮件营销、互联网广告和电子商务上进行数据挖掘,着重介绍了数据挖掘的原理和算法在互联网海量数据挖掘中的应用。
《New Internet:大数据挖掘》主要特点:全面介绍了数据挖掘和大数据的基本概念和技术;大量采用了实际案例,实用性强;详细介绍了大数据挖掘领域最新的商业应用。
-
作者简介:
谭磊,复旦大学计算机学士,美国杜克大学计算机硕士,在美国微软服务时间超过13年,曾经担任多家公司多个层级技术管理岗位,在搜索、互联网广告、数据挖掘、电子商务等方面有丰富的经验,是互联网技术领域资深专家。
-
目录:
第1章绪论——从淘金客到矿山主
1.1大数据时代的“四V”
1.2什么是大数据挖掘
1.2.1从数据分析到数据挖掘
1.2.2Web挖掘
1.2.3大数据挖掘之“大”
1.3大数据挖掘的国内外发展
1.3.1数据挖掘的应用发展
1.3.2数据挖掘研究发展
1.4本书内容
第2章一小时了解数据挖掘
2.1数据挖掘是如何解决问题的
2.1.1尿不湿和啤酒
2.1.2Target和怀孕预测指数
2.1.3电子商务网站流量分析
2.2分类:从人脸识别系统说起
2.2.1分类算法的应用
2.2.2数据挖掘分类技术
2.2.3分类算法的评估
2.3一切为了商业
2.3.1什么是商业智能(BusinessIntelligence)
2.3.2数据挖掘的九大定律
2.4数据挖掘很纠结
2.5数据挖掘的基本流程
2.5.1数据挖掘的一般步骤
2.5.2几个数据挖掘中常用的概念
2.5.3CRISP-DM
2.5.4数据挖掘的评估
2.5.5数据挖掘结果的知识表示
2.6本章相关资源
第3章数据仓库——数据挖掘的基石
3.1存放数据的仓库
3.1.1数据仓库的定义
3.1.2数据仓库和数据库
3.2传统的数据仓库介绍
3.3数据仓库基本结构
3.4OLAP联机分析处理
3.5云存储上的数据仓库
3.5.1Google公司的云架构
3.5.2开源的分布式系统Hadoop
3.5.3Facebook的数据仓库
3.5.4NoSQL
3.6本章相关资源
第4章数据挖掘算法及原理
4.1数据挖掘中的算法
4.2数据挖掘十大经典算法
4.3分类算法(Classification)
4.4聚类算法(Clustering)
4.5关联算法
4.5.1关联算法中的概念
4.5.2关联规则数据挖掘过程
4.5.3关联规则的分类
4.5.4Apriori算法的执行实例
4.5.5关联规则挖掘算法的研究与优化
4.6序列挖掘(SequenceMining)
4.7数据挖掘建模语言PMML
4.8本章相关资源
第5章在进行数据挖掘之前
5.1数据集成
5.2为何要做数据预处理
5.3数据预处理
5.3.1数据清理
5.3.2数据转换
5.3.3数据规约
5.4本章相关资源
第6章R语言和其他数据挖掘工具
6.1R语言的历史
6.1.1R语言的特点
6.1.2R语言和数据挖掘
6.2其他数据挖掘工具
6.2.1MATLAB
6.2.2其他商用数据挖掘工具
6.2.3开源数据挖掘工具Weka
6.3数据挖掘和云
6.4本章相关资源
第7章互联网上的日志分析
7.1网站日志简介
7.2网站日志处理
7.2.1Web日志预处理
7.2.2Web日志分析和数据挖掘
7.3邮件日志
7.4本章相关资源
第8章数据挖掘和电子邮件
8.1邮件营销与垃圾邮件过滤
8.2数据挖掘和邮件营销
8.2.1如何有效地进行邮件营销
8.2.2邮件营销案例分享之一
8.2.3邮件营销案例分享之二
8.2.4运用数据挖掘RFM模型提高邮件营销效果
8.3数据挖掘和垃圾邮件过滤
8.3.1垃圾邮件
8.3.2垃圾邮件过滤技术
8.3.3垃圾邮件过滤案例
8.4本章相关资源
第9章数据挖掘和互联网广告
9.1互联网广告
9.2广告作弊行为
9.3网站联盟广告
9.4网站联盟广告上的数据挖掘
9.4.1数据助力网盟广告
9.4.2如何应对网盟广告作弊
9.5本章相关资源
第10章数据挖掘和电子商务
10.1中国电子商务现状
10.2在互联网上卖米
10.3用数据来掌握客户
10.3.1客户何时来、从哪来
10.3.2客户最喜欢哪种商品
10.3.3竞争与反竞争分析
10.3.4客户还会买什么
10.3.5哪些客户是我们需要的
10.4电子商务案例
10.4.1电子商务企业案例一
10.4.2电子商务企业案例二
10.5本章相关资源
第11章数据挖掘和Web挖掘
11.1互联网上的个性化-Like
11.1.1Like=像
11.1.2Like=喜欢
11.2Web挖掘和SNS
11.2.1SNS上的数据价值
11.2.2SNS上的数据关联关系
11.2.3SNS上的用户关系
11.3数据挖掘和隐私
11.4本章相关资源
第12章数据挖掘和移动互联网
12.1移动互联网的特殊性
12.1.1锁定用户的数据价值
12.1.2移动互联网上数据的形式
12.1.3移动互联网地理位置信息的价值
12.2数据挖掘和LBS
12.2.1用PU学习算法做文本挖掘
12.2.2用相似匹配算法做地点挖掘
12.3移动互联网数据面临的问题
12.4本章相关资源
附录1技术词汇表
附录2英语参考文献表
附录3中文参考文献表
附录4微博
附录5博客和其他网址
查看详情
-
全新
北京市朝阳区
平均发货15小时
成功完成率85.37%
-
九品
北京市海淀区
平均发货25小时
成功完成率87.51%
-
八五品
北京市通州区
平均发货13小时
成功完成率95.6%
-
九品
北京市东城区
平均发货25小时
成功完成率87.82%
-
八五品
广东省东莞市
平均发货9小时
成功完成率93.56%
-
八五品
广东省东莞市
平均发货9小时
成功完成率93.89%
-
八五品
广东省东莞市
平均发货9小时
成功完成率92.66%
-
九五品
江苏省无锡市
平均发货17小时
成功完成率81.1%
-
New Internet:大数据挖掘
买书,就上二手书海官方企业店,清仓处理,真实库存,特价正版,收藏店铺,优先发货! ps:下午三点之前的订单当天发货,之后明天发货,特殊情况除外。
八五品
河南省鹤壁市
平均发货24小时
成功完成率88.53%
-
八五品
河南省鹤壁市
平均发货20小时
成功完成率90.9%
-
九品
北京市顺义区
平均发货10小时
成功完成率95.12%
-
全新
河北省保定市
平均发货27小时
成功完成率88.26%
-
九品
天津市宝坻区
平均发货15小时
成功完成率95.67%
-
全新
-
九品
北京市昌平区
平均发货10小时
成功完成率97.56%
-
全新
北京市通州区
平均发货22小时
成功完成率81.08%
-
2013-07 印刷
印次: 2
九品
北京市通州区
平均发货10小时
成功完成率96.17%
-
九品
河北省承德市
平均发货8小时
成功完成率97.64%
-
九品
北京市海淀区
平均发货8小时
成功完成率96.77%
-
全新
河北省保定市
平均发货4小时
成功完成率93.2%
-
九品
河北省衡水市
平均发货5小时
成功完成率97.58%
-
九品
江西省南昌市
平均发货20小时
成功完成率86.09%
-
九品
北京市昌平区
平均发货8小时
成功完成率97.41%
-
八五品
湖北省武汉市
平均发货11小时
成功完成率96.33%
-
九品
北京市通州区
平均发货9小时
成功完成率92.9%
-
九品
北京市大兴区
平均发货8小时
成功完成率96.81%
-
八五品
江苏省南京市
平均发货17小时
成功完成率81.75%
-
九品
北京市通州区
平均发货10小时
成功完成率87.79%
-
九品
河北省衡水市
平均发货14小时
成功完成率95.19%
-
九品
河北省衡水市
平均发货14小时
成功完成率95.19%
-
九品
北京市顺义区
平均发货11小时
成功完成率95.18%
-
2013-03 印刷
印次: 1
九品
北京市海淀区
平均发货7小时
成功完成率97.43%
-
九品
北京市朝阳区
平均发货8小时
成功完成率96.78%
-
八五品
河南省周口市
平均发货7小时
成功完成率96.5%
-
九品
北京市顺义区
平均发货10小时
成功完成率95.12%
-
八五品
安徽省滁州市
平均发货19小时
成功完成率88.23%
-
九品
河北省衡水市
平均发货8小时
成功完成率97.87%
-
九品
江西省宜春市
平均发货14小时
成功完成率92.39%
-
九品
北京市西城区
平均发货8小时
成功完成率96.89%
-
九品
北京市房山区
平均发货2小时
成功完成率91.84%
-
九品
北京市海淀区
平均发货10小时
成功完成率90.34%
-
八品
河南省濮阳市
平均发货15小时
成功完成率96.84%
-
九品
山西省太原市
平均发货6小时
成功完成率74.19%
-
九品
山东省菏泽市
平均发货5小时
成功完成率98.36%
-
八五品
山东省济南市
平均发货13小时
成功完成率97.86%
-
2013-03 印刷
印次: 1
八五品
安徽省蚌埠市
平均发货11小时
成功完成率97.65%
-
八五品
北京市朝阳区
平均发货11小时
成功完成率96.72%
-
九品
山东省菏泽市
平均发货6小时
成功完成率97.07%
-
八品
河南省信阳市
平均发货7小时
成功完成率97.64%
-
九品
河北省衡水市
平均发货5小时
成功完成率97.58%