未读消息消息

购物车

我的订单

个人中心

店铺

我的订单收藏商品

拍卖

拍卖交易我的竞拍收藏拍品

我的好友资金账户

卖家中心

客服 |

帮助中心 9:00-20:30 在线留言

客服电话

010-89648155

服务时间

客服咨询 08:00-21:00

纠纷处理

09:00-12:30

13:30-18:00

图书审核 09:00-18:00

监督与建议

请选择

手机孔网

大数据集成

作者: 董欣著 , 王秋月译

出版社: 机械工业出版社

出版时间: 2017-05

版次: 1

ISBN: 9787111559863

定价: 79.00

装帧: 平装

开本: 16开

纸张: 胶版纸

页数: 186页

丛书: 大数据管理丛书

分类: 计算机与互联网

9人买过

本书作者在多年研究传统数据集成的基础上，着重分析了大数据背景下的大数据集成。和传统的数据集成相比，大数据集成具有一些新的挑战，例如数据和数据源的海量性、数据的多样性和数据的动态性等。本书共分6章，包括大数据集成的挑战和机遇、模式对齐、记录链接、数据融合、出现的新问题和结论，系统地讨论了解决大数据集成中关键问题的一些重要研究成果和方法，对大数据集成的研究者和实践者都很有帮助。另外本书也可以作为学生学习该领域的入门读物。 Xin Luna Dong（董欣）， 2013年加入谷歌公司担任高级研究员，研究兴趣包括数据集成、数据清洗和知识管理。在加入谷歌之前，她是AT&T实验室的研究员。董欣博士硕士毕业于北京大学，本科毕业于南开大学。
Divesh Srivastava AT&T实验室数据库领域首席科学家.
丛书前言
译者序
前言
第1章大数据集成的挑战和机遇1
1.1 传统数据集成2
1.1.1 航班示例：数据源2
1.1.2 航班示例：数据集成7
1.1.3 数据集成：体系结构和三个主要步骤10
1.2 大数据集成：挑战12
1.2.1 “V”维度13
1.2.2 案例研究：深网数据量15
1.2.3 案例研究：抽取的领域数据18
1.2.4 案例研究：深网数据的质量22
1.2.5 案例研究：浅网结构化数据25
1.2.6 案例研究：抽取的知识三元组28
1.3 大数据集成：机遇30
1.3.1 数据冗余性31
1.3.2 长数据32
1.3.3 大数据平台33
1.4 章节安排33
第2章模式对齐34
2.1 传统模式对齐：快速导览35
2.1.1 中间模式35
2.1.2 属性匹配36
2.1.3 模式映射37
2.1.4 查询问答38
2.2 应对多样性和高速性的挑战39
2.2.1 概率模式对齐39
2.2.2 按需集成用户反馈52
2.3 应对多样性和海量性的挑战54
2.3.1 集成深网数据55
2.3.2 集成Web表格59
第3章记录链接68
3.1 传统记录链接：快速导览69
3.1.1 两两匹配71
3.1.2 聚类72
3.1.3 分块74
3.2 应对海量性挑战76
3.2.1 使用MapReduce并行分块77
3.2.2 meta-blocking：修剪两两匹配83
3.3 应对高速性挑战88
3.4 应对多样性挑战95
3.5 应对真实性挑战100
3.5.1 时态记录链接100
3.5.2 具有唯一性约束的记录链接107
第4章大数据集成：数据融合113
4.1 传统数据融合：快速导览114
4.2 应对真实性挑战116
4.2.1 数据源的准确度117
4.2.2 值为真的概率118
4.2.3 数据源之间的复制关系121
4.2.4 端到端的解决方案128
4.2.5 扩展性和适应性131
4.3 应对海量性挑战134
4.3.1 基于MapReduce框架做离线融合135
4.3.2 在线数据融合136
4.4 应对高速性挑战142
4.5 应对多样性挑战146
第5章大数据集成：出现的新问题149
5.1 众包的角色149
5.1.1 利用传递关系150
5.1.2 众包端到端的工作流155
5.1.3 未来的工作158
5.2 数据源选择158
5.2.1 静态数据源160
5.2.2 动态数据源162
5.2.3 未来的工作166
5.3 数据源分析166
5.3.1 Bellman系统167
5.3.2 概述数据源170
5.3.3 未来的工作174
第6章结论175
参考文献177
索引184
内容简介:
本书作者在多年研究传统数据集成的基础上，着重分析了大数据背景下的大数据集成。和传统的数据集成相比，大数据集成具有一些新的挑战，例如数据和数据源的海量性、数据的多样性和数据的动态性等。本书共分6章，包括大数据集成的挑战和机遇、模式对齐、记录链接、数据融合、出现的新问题和结论，系统地讨论了解决大数据集成中关键问题的一些重要研究成果和方法，对大数据集成的研究者和实践者都很有帮助。另外本书也可以作为学生学习该领域的入门读物。
作者简介:
Xin Luna Dong（董欣）， 2013年加入谷歌公司担任高级研究员，研究兴趣包括数据集成、数据清洗和知识管理。在加入谷歌之前，她是AT&T实验室的研究员。董欣博士硕士毕业于北京大学，本科毕业于南开大学。
Divesh Srivastava AT&T实验室数据库领域首席科学家.
目录:

丛书前言
译者序
前言
第1章大数据集成的挑战和机遇1
1.1 传统数据集成2
1.1.1 航班示例：数据源2
1.1.2 航班示例：数据集成7
1.1.3 数据集成：体系结构和三个主要步骤10
1.2 大数据集成：挑战12
1.2.1 “V”维度13
1.2.2 案例研究：深网数据量15
1.2.3 案例研究：抽取的领域数据18
1.2.4 案例研究：深网数据的质量22
1.2.5 案例研究：浅网结构化数据25
1.2.6 案例研究：抽取的知识三元组28
1.3 大数据集成：机遇30
1.3.1 数据冗余性31
1.3.2 长数据32
1.3.3 大数据平台33
1.4 章节安排33
第2章模式对齐34
2.1 传统模式对齐：快速导览35
2.1.1 中间模式35
2.1.2 属性匹配36
2.1.3 模式映射37
2.1.4 查询问答38
2.2 应对多样性和高速性的挑战39
2.2.1 概率模式对齐39
2.2.2 按需集成用户反馈52
2.3 应对多样性和海量性的挑战54
2.3.1 集成深网数据55
2.3.2 集成Web表格59
第3章记录链接68
3.1 传统记录链接：快速导览69
3.1.1 两两匹配71
3.1.2 聚类72
3.1.3 分块74
3.2 应对海量性挑战76
3.2.1 使用MapReduce并行分块77
3.2.2 meta-blocking：修剪两两匹配83
3.3 应对高速性挑战88
3.4 应对多样性挑战95
3.5 应对真实性挑战100
3.5.1 时态记录链接100
3.5.2 具有唯一性约束的记录链接107
第4章大数据集成：数据融合113
4.1 传统数据融合：快速导览114
4.2 应对真实性挑战116
4.2.1 数据源的准确度117
4.2.2 值为真的概率118
4.2.3 数据源之间的复制关系121
4.2.4 端到端的解决方案128
4.2.5 扩展性和适应性131
4.3 应对海量性挑战134
4.3.1 基于MapReduce框架做离线融合135
4.3.2 在线数据融合136
4.4 应对高速性挑战142
4.5 应对多样性挑战146
第5章大数据集成：出现的新问题149
5.1 众包的角色149
5.1.1 利用传递关系150
5.1.2 众包端到端的工作流155
5.1.3 未来的工作158
5.2 数据源选择158
5.2.1 静态数据源160
5.2.2 动态数据源162
5.2.3 未来的工作166
5.3 数据源分析166
5.3.1 Bellman系统167
5.3.2 概述数据源170
5.3.3 未来的工作174
第6章结论175
参考文献177
索引184

查看详情

相关分类

计算机理论编程与开发操作系统大数据与云计算图形图像/多媒体网站设计与网页开发网络与通讯硬件、嵌入式开发办公软件信息安全辅助设计与工程计算软件工程/开发项目管理

大数据集成正版速发带塑封

九五品

转转精品图书店的书店

天津市宝坻区

平均发货15小时成功完成率88.48%

￥14.81

券

100减20

立即购买加入购物车不属于本条目
大数据集成正版现货，品相完整，套书只发一本,多版面书籍只对书名

九五品

简简单单-书店的书店

河北省廊坊市

平均发货12小时成功完成率92.51%

￥28.09

券

100减20

立即购买加入购物车
大数据集成正版现货，套书只发一本,多版面书籍只对书名

九品

新起点书店

北京市海淀区

平均发货17小时成功完成率91.03%

￥20.98

券

100减20

立即购买加入购物车
大数据集成(精)/大数据管理丛书

九品

转转图书专营店

天津市宝坻区

平均发货11小时成功完成率95.32%

￥19.70

券

100减20

立即购买加入购物车
大数据集成下午5点前订单，当日发货！超时赔付

九五品

才华有限

四川省成都市

平均发货11小时成功完成率93.63%

￥13.15

券

100减20

立即购买加入购物车
4

大数据集成

八五品

云深旧书店

安徽省蚌埠市

平均发货10小时成功完成率96.29%

￥12.00

券

100减20

立即购买加入购物车
【包邮】大数据集成【正版九新】九品消毒塑封

九五品

文渊文化传媒

天津市宝坻区

平均发货14小时成功完成率86.82%

￥19.50

券

100减20

立即购买加入购物车不属于本条目
大数据集成正版速发带塑封

九五品

旭日精品图书的书店

天津市宝坻区

平均发货16小时成功完成率85.46%

￥14.81

券

100减20

立即购买加入购物车不属于本条目
大数据集成正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

旧书香书城

北京市昌平区

平均发货19小时成功完成率88.41%

￥20.98

券

100减20

立即购买加入购物车
8

大数据集成董欣机械工业9787111559863

八五品

一亩田书院

重庆市沙坪坝区

平均发货8小时成功完成率89.84%

￥22.51

券

100减20

立即购买加入购物车不属于本条目
大数据集成董欣机械工业9787111559863

八五品

一棵树旧书店

重庆市沙坪坝区

平均发货8小时成功完成率90.08%

￥19.36

券

100减20

立即购买加入购物车不属于本条目
6

大数据集成

八五品

西安文汇古旧书店

陕西省西安市

平均发货8小时成功完成率95.92%

￥9.00

券

100减20

立即购买加入购物车
大数据集成正版二手书籍，有少量笔记，套装书先咨询客服再下单，无光盘，无册子

八五品

诚信旧书社

山东省枣庄市

平均发货9小时成功完成率93.3%

￥31.60

券

100减20

立即购买加入购物车
2

大数据集成

全新

中华国泰民安书店的书店

山东省泰安市

平均发货9小时成功完成率94.81%

￥31.00

券

100减20

立即购买加入购物车不属于本条目
大数据集成

九品

万虹书店

河北省衡水市

平均发货11小时成功完成率96.23%

￥14.33

券

100减20

立即购买加入购物车
3

大数据集成【书侧发黄封皮轻微污渍】

2017-05 印刷
印次: 1

八五品

墨香聚书阁

安徽省蚌埠市

平均发货11小时成功完成率98.11%

￥10.00

券

100减20

立即购买加入购物车不属于本条目
大数据集成精装未拆塑封【正版有货可开发票；标题与图片不一致时,请质询】

全新

一叶知秋语的书店

广东省广州市

平均发货10小时成功完成率89.38%

￥33.00

券

100减20

立即购买加入购物车不属于本条目
大数据集成【正版有货可开发票；库存情况请咨询，及标题与图片不一致时】

全新

书香静谧书店

广东省广州市

平均发货11小时成功完成率90.3%

￥38.00

券

100减20

立即购买加入购物车不属于本条目
2

大数据集成未开封

全新

海晏妈精品书店

河北省承德市

平均发货9小时成功完成率95.37%

￥30.00

券

100减20

立即购买加入购物车不属于本条目
大数据集成

八五品

重邮书店

重庆市南岸区

平均发货19小时成功完成率85.48%

￥15.10

券

100减20

立即购买加入购物车
4

大数据集成扫码上未拆封

2017年印刷

全新

开封市龙亭区博宾书刊店

河南省开封市

平均发货12小时成功完成率91.19%

￥20.00

券

100减20

立即购买加入购物车
3

大数据集成实物拍照

2017-05 印刷
印次: 1

九品

欧阳书店

河南省信阳市

平均发货8小时成功完成率97.07%

￥10.00

券

100减20

立即购买加入购物车不属于本条目
大数据集成

全新

小蚂蚁书屋

陕西省西安市

平均发货12小时成功完成率92.5%

￥15.00

券

100减20

立即购买加入购物车
【正版】大数据集成9787111559863

九品

代号永恒图书专营店

天津市宝坻区

平均发货18小时成功完成率90.68%

￥19.40

券

100减20

立即购买加入购物车不属于本条目
6

大数据集成

八五品

新生活书店

陕西省西安市

平均发货11小时成功完成率95.52%

￥9.00

券

100减20

立即购买加入购物车
大数据集成精装未拆塑封【正版库存图书】【可开发票】详情可咨询客服【支持7天无理由退回】

全新

筱雨文库

广东省汕头市

平均发货10小时成功完成率90.93%

￥30.00

券

100减20

立即购买加入购物车不属于本条目
2

大数据集成

九五品

小可以书店

陕西省西安市

平均发货12小时成功完成率93.79%

￥12.00

券

100减20

立即购买加入购物车
大数据集成正版精选旧书，塑封消毒，极速发货

九五品

转转图书的店

河北省保定市

平均发货17小时成功完成率82.48%

￥14.81

券

100减20

立即购买加入购物车
大数据集成

九五品

书香文华阁

河北省廊坊市

平均发货19小时成功完成率84.47%

￥13.88

券

100减20

立即购买加入购物车
大数据集成

九五品

伴我侗行

江苏省南京市

平均发货23小时成功完成率81.98%

￥16.66

券

100减20

立即购买加入购物车不属于本条目
大数据集成

九五品

詩酒年华

河北省廊坊市

平均发货23小时成功完成率76.99%

￥16.55

券

100减20

立即购买加入购物车不属于本条目
大数据集成包售后

全新

绿色苹果的书店

河北省廊坊市

平均发货16小时成功完成率84.65%

￥34.50

券

100减20

立即购买加入购物车
11

大数据集成

八五品

一梦图书

重庆市九龙坡区

平均发货3小时成功完成率100%

￥7.00

券

100减20

立即购买加入购物车
大数据集成

全新

山东新华文海书店

山东省济南市

平均发货10小时成功完成率83.16%

￥52.14

券

100减20

立即购买加入购物车
5

大数据集成

八五品

老齐书屋

湖南省株洲市

平均发货24小时成功完成率100%

￥12.00

券

100减20

立即购买加入购物车不属于本条目
8

大数据集成(没开封)

2017-05 印刷
印次: 1

九五品

静海风云书斋

吉林省长春市

平均发货6小时成功完成率98.27%

￥40.00

券

100减20

立即购买加入购物车

大数据集成

内容简介:

作者简介:

目录: