社交网站的数据挖掘与分析(原书第2版)

社交网站的数据挖掘与分析(原书第2版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , , ,
2015-02
版次: 1
ISBN: 9787111486992
定价: 79.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 388页
正文语种: 简体中文
111人买过
  •   社交网站数据如同深埋地下的“金矿”,如何利用这些数据来发现哪些人正通过社交媒介进行联系?他们正在谈论什么?或者他们在哪儿?本书第2版对上一版内容进行了全面更新和修订,它将揭示回答这些问题的方法与技巧。你将学到如何获取、分析和汇总散落于社交网站(包括Facebook、Twitter、LinkedIn、Google+、 GitHub、邮件、网站和博客等)的数据,以及如何通过可视化找到你一直在社交世界中寻找的内容和你闻所未闻的有用信息。
      ■ 借助IPython Notebook、自然语言工具包、NetworkX和其他科学计算工具挖掘主流社交网站
      ■ 使用高级文本挖掘技术(如聚类和TF-IDF)来提取人类语言数据中有价值的知识
      ■ 通过发现GitHub上人、编程语言和代码工程间的亲密性,构建兴趣图谱
      ■ 利用D3.js进行交互式可视化,充分发挥HTML5和JavaScript工具包的灵活特性
      ■ 以“问题-解决方案-讨论”的方式详细讲解深入挖掘Twitter数据的实用技术,并提供代码示例
      本书的配套代码在公开的GitHub代码库中进行维护,可以通过一站式虚拟机来访问,你只需要使用方便易用的IPython Notebook,即可进入愉快的交互式学习情景。
      Matthew A. Russell,Digital Reasoning Systems公司首席技术官(CTO)、Zaffra公司负责人。作为一名计算机科学家,他热衷于数据挖掘、开源软件开发和创造技术以扩展人类智能。
    前言 1
    第一部分 社交网络导引
    序幕 13
    第1章 挖掘Twitter:探索热门话题、发现人们的谈论内容等 15
    1.1 概述 15
    1.2 Twitter风靡一时的原因 16
    1.3 探索Twitter API 18
    1.4 分析140字的推文 33
    1.5 本章小结 47
    1.6 推荐练习 48
    1.7 在线资源 48
    第2章 挖掘Facebook:分析粉丝页面、查看好友关系等 50
    2.1 概述 51
    2.2 探索Facebook的社交图谱API 51
    2.3 分析社交图谱联系 62
    2.4 本章小结 85
    2.5 推荐练习 86
    2.6 在线资源 86
    第3章 挖掘LinkedIn:分组职位、聚类同行等 88
    3.1 概述 89
    3.2 探索LinkedIn API 89
    3.3 数据聚类速成 94
    3.4 本章小结 124
    3.5 推荐练习 125
    3.6 在线资源 126
    第4章 挖掘Google+:计算文档相似度、提取搭配等 127
    4.1 概述 128
    4.2 探索Google+ API 128
    4.3 TF-IDF简介 138
    4.4 用TF-IDF查询人类语言数据 145
    4.5 本章小结 164
    4.6 推荐练习 165
    4.7 在线资源 165
    第5章 挖掘网页:使用自然语言处理理解人类语言、总结博客内容等 167
    5.1 概述 168
    5.2 抓取、解析、爬取网页 168
    5.3 通过解码语法来探索语义 174
    5.4 以实体为中心的分析:范式转换 192
    5.5 人类语言数据处理分析的质量 200
    5.6 本章小结 203
    5.7 推荐练习 203
    5.8 在线资源 204
    第6章 挖掘邮箱:分析谁和谁说什么以及说的频率等 206
    6.1 概述 207
    6.2 获取和处理邮件语料库 207
    6.3 分析Enron语料库 225
    6.4 探索和可视化时序趋势 241
    6.5 分析你自己的邮件数据 244
    6.6 本章小结 250
    6.7 推荐练习 251
    6.8 在线资源 251
    第7章 挖掘GitHub:检查软件协同习惯、构建兴趣图谱等 253
    7.1 概述 254
    7.2 探索GitHub的API 254
    7.3 使用属性图为数据建模 260
    7.4 分析GitHub兴趣图谱 264
    7.5 本章小结 286
    7.6 推荐练习 287
    7.7 在线资源 287
    第8章 挖掘带标记语义网:提取微格式、推断资源描述框架等 289
    8.1 概述 290
    8.2 微格式:易于实现的元数据 290
    8.3 从语义标记过渡到语义网:一个小插曲 304
    8.4 语义网:发展中的变革 304
    8.5 本章小结 310
    8.6 推荐的练习 311
    8.7 在线资源 311
    第二部分 Twitter实用指南
    第9章 Twitter实用指南 317
    9.1 访问Twitter的API(开发目的) 318
    9.2 使用OAuth访问Twitter的API(产品目的) 319
    9.3 探索流行话题 323
    9.4 查找推文 324
    9.5 构造方便的函数调用 325
    9.6 使用文本文件存储JSON数据 326
    9.7 使用MongoDB存储和访问JSON数据 327
    9.8 使用信息流API对Twitter数据管道抽样 329
    9.9 采集时序数据 330
    9.10 提取推文实体 332
    9.11 特定的推文范围内查找最流行的推文 333
    9.12 特定的推文范围内查找最流行的推文实体 335
    9.13 对频率分析制表 336
    9.14 查找转推了状态的用户 337
    9.15 提取转推的属性 339
    9.16 创建健壮的Twitter请求 340
    9.17 获取用户个人资料信息 343
    9.18 从任意的文本中提取推文实体 344
    9.19 获得用户所有的好友和关注者 345
    9.20 分析用户的好友和关注者 347
    9.21 获取用户的推文 348
    9.22 爬取好友关系图 350
    9.23 分析推文内容 351
    9.24 提取链接目标摘要 353
    9.25 分析用户收藏的推文 356
    9.26 本章小结 357
    9.27 推荐练习 358
    9.28 在线资源 359
    第三部分 附录
    附录A 关于本书虚拟机体验的信息 363
    附录B OAuth入门 364
    附录C Python和IPython Notebook的使用技巧 368
  • 内容简介:
      社交网站数据如同深埋地下的“金矿”,如何利用这些数据来发现哪些人正通过社交媒介进行联系?他们正在谈论什么?或者他们在哪儿?本书第2版对上一版内容进行了全面更新和修订,它将揭示回答这些问题的方法与技巧。你将学到如何获取、分析和汇总散落于社交网站(包括Facebook、Twitter、LinkedIn、Google+、 GitHub、邮件、网站和博客等)的数据,以及如何通过可视化找到你一直在社交世界中寻找的内容和你闻所未闻的有用信息。
      ■ 借助IPython Notebook、自然语言工具包、NetworkX和其他科学计算工具挖掘主流社交网站
      ■ 使用高级文本挖掘技术(如聚类和TF-IDF)来提取人类语言数据中有价值的知识
      ■ 通过发现GitHub上人、编程语言和代码工程间的亲密性,构建兴趣图谱
      ■ 利用D3.js进行交互式可视化,充分发挥HTML5和JavaScript工具包的灵活特性
      ■ 以“问题-解决方案-讨论”的方式详细讲解深入挖掘Twitter数据的实用技术,并提供代码示例
      本书的配套代码在公开的GitHub代码库中进行维护,可以通过一站式虚拟机来访问,你只需要使用方便易用的IPython Notebook,即可进入愉快的交互式学习情景。
  • 作者简介:
      Matthew A. Russell,Digital Reasoning Systems公司首席技术官(CTO)、Zaffra公司负责人。作为一名计算机科学家,他热衷于数据挖掘、开源软件开发和创造技术以扩展人类智能。
  • 目录:
    前言 1
    第一部分 社交网络导引
    序幕 13
    第1章 挖掘Twitter:探索热门话题、发现人们的谈论内容等 15
    1.1 概述 15
    1.2 Twitter风靡一时的原因 16
    1.3 探索Twitter API 18
    1.4 分析140字的推文 33
    1.5 本章小结 47
    1.6 推荐练习 48
    1.7 在线资源 48
    第2章 挖掘Facebook:分析粉丝页面、查看好友关系等 50
    2.1 概述 51
    2.2 探索Facebook的社交图谱API 51
    2.3 分析社交图谱联系 62
    2.4 本章小结 85
    2.5 推荐练习 86
    2.6 在线资源 86
    第3章 挖掘LinkedIn:分组职位、聚类同行等 88
    3.1 概述 89
    3.2 探索LinkedIn API 89
    3.3 数据聚类速成 94
    3.4 本章小结 124
    3.5 推荐练习 125
    3.6 在线资源 126
    第4章 挖掘Google+:计算文档相似度、提取搭配等 127
    4.1 概述 128
    4.2 探索Google+ API 128
    4.3 TF-IDF简介 138
    4.4 用TF-IDF查询人类语言数据 145
    4.5 本章小结 164
    4.6 推荐练习 165
    4.7 在线资源 165
    第5章 挖掘网页:使用自然语言处理理解人类语言、总结博客内容等 167
    5.1 概述 168
    5.2 抓取、解析、爬取网页 168
    5.3 通过解码语法来探索语义 174
    5.4 以实体为中心的分析:范式转换 192
    5.5 人类语言数据处理分析的质量 200
    5.6 本章小结 203
    5.7 推荐练习 203
    5.8 在线资源 204
    第6章 挖掘邮箱:分析谁和谁说什么以及说的频率等 206
    6.1 概述 207
    6.2 获取和处理邮件语料库 207
    6.3 分析Enron语料库 225
    6.4 探索和可视化时序趋势 241
    6.5 分析你自己的邮件数据 244
    6.6 本章小结 250
    6.7 推荐练习 251
    6.8 在线资源 251
    第7章 挖掘GitHub:检查软件协同习惯、构建兴趣图谱等 253
    7.1 概述 254
    7.2 探索GitHub的API 254
    7.3 使用属性图为数据建模 260
    7.4 分析GitHub兴趣图谱 264
    7.5 本章小结 286
    7.6 推荐练习 287
    7.7 在线资源 287
    第8章 挖掘带标记语义网:提取微格式、推断资源描述框架等 289
    8.1 概述 290
    8.2 微格式:易于实现的元数据 290
    8.3 从语义标记过渡到语义网:一个小插曲 304
    8.4 语义网:发展中的变革 304
    8.5 本章小结 310
    8.6 推荐的练习 311
    8.7 在线资源 311
    第二部分 Twitter实用指南
    第9章 Twitter实用指南 317
    9.1 访问Twitter的API(开发目的) 318
    9.2 使用OAuth访问Twitter的API(产品目的) 319
    9.3 探索流行话题 323
    9.4 查找推文 324
    9.5 构造方便的函数调用 325
    9.6 使用文本文件存储JSON数据 326
    9.7 使用MongoDB存储和访问JSON数据 327
    9.8 使用信息流API对Twitter数据管道抽样 329
    9.9 采集时序数据 330
    9.10 提取推文实体 332
    9.11 特定的推文范围内查找最流行的推文 333
    9.12 特定的推文范围内查找最流行的推文实体 335
    9.13 对频率分析制表 336
    9.14 查找转推了状态的用户 337
    9.15 提取转推的属性 339
    9.16 创建健壮的Twitter请求 340
    9.17 获取用户个人资料信息 343
    9.18 从任意的文本中提取推文实体 344
    9.19 获得用户所有的好友和关注者 345
    9.20 分析用户的好友和关注者 347
    9.21 获取用户的推文 348
    9.22 爬取好友关系图 350
    9.23 分析推文内容 351
    9.24 提取链接目标摘要 353
    9.25 分析用户收藏的推文 356
    9.26 本章小结 357
    9.27 推荐练习 358
    9.28 在线资源 359
    第三部分 附录
    附录A 关于本书虚拟机体验的信息 363
    附录B OAuth入门 364
    附录C Python和IPython Notebook的使用技巧 368
查看详情
相关图书 / 更多
社交网站的数据挖掘与分析(原书第2版)
社交边界
谷鹏磊;朱旭东
社交网站的数据挖掘与分析(原书第2版)
社交媒体环境下助残社会组织赋能机制研究
周林刚
社交网站的数据挖掘与分析(原书第2版)
社交这门课,只能父母教著名教育专家唐雯新作
唐雯 著;酷威文化 出品
社交网站的数据挖掘与分析(原书第2版)
社交英语口语,让你自信社交
王甜甜 著;清泉静读 出品
社交网站的数据挖掘与分析(原书第2版)
社交礼仪(第六版)
林友华
社交网站的数据挖掘与分析(原书第2版)
社交媒体用户感知价值研究
张鸣民
社交网站的数据挖掘与分析(原书第2版)
社交营销:传播推动流量
王清 著;清泉静读 出品
社交网站的数据挖掘与分析(原书第2版)
社交网络分析理论与应用
杨良斌
社交网站的数据挖掘与分析(原书第2版)
社交高手
连山 著
社交网站的数据挖掘与分析(原书第2版)
社交媒体时代青年社会化途径研究
蓝刚
社交网站的数据挖掘与分析(原书第2版)
社交礼仪(第二版)
王茂跃 著
社交网站的数据挖掘与分析(原书第2版)
社交礼仪
张丽娜;于春玲;朱美;李洋;褚又君;朱智;李雪霞
您可能感兴趣 / 更多
社交网站的数据挖掘与分析(原书第2版)
无辜者的谎言(相信我!看到结局你一定会头皮发麻;全美读者推荐的悬疑神作,GOODREADS高分作品)
[美]A.R.托雷 著;梁颂宇 译;星文文化 出品
社交网站的数据挖掘与分析(原书第2版)
孩子,把你的手给我1:怎么说孩子才爱听,怎么教孩子才肯学?帮助每一位3-12岁孩子的父母结束与孩子的所有冲突!
[美]海姆·G.吉诺特
社交网站的数据挖掘与分析(原书第2版)
哲学、历史与僭政——重审施特劳斯与科耶夫之争
[美]弗罗斯特(Bryan-Paul Frost) 编;[美]伯恩斯(Timothy W. Burns)
社交网站的数据挖掘与分析(原书第2版)
怎样做成大事
[美]丹·加德纳(Dan Gardner) 著;贾拥民 译;湛庐文化 出品;[丹麦]傅以斌(Bent Flyvbjerg)
社交网站的数据挖掘与分析(原书第2版)
力量训练的科学基础与实践应用(第三版)
[美]弗拉基米尔· M.扎齐奥尔斯基;[美]威廉·J.克雷默;[美]安德鲁· C.弗赖伊
社交网站的数据挖掘与分析(原书第2版)
1200年希腊罗马神话
[美]伊迪丝·汉密尔顿
社交网站的数据挖掘与分析(原书第2版)
爱情心理学(新编本)
[美]罗伯特·J. 斯腾伯格 (美)凯琳·斯腾伯格 倪爱萍 译
社交网站的数据挖掘与分析(原书第2版)
黄金圈法则
[美]西蒙·斯涅克 著;磨铁文化 出品
社交网站的数据挖掘与分析(原书第2版)
最后一章
[美]厄尼·派尔
社交网站的数据挖掘与分析(原书第2版)
汤姆·索亚历险记 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]马克 吐温
社交网站的数据挖掘与分析(原书第2版)
富兰克林自传 名家全译本 改变无数人命运的励志传奇 埃隆马斯克反复推荐 赠富兰克林签名照及精美插图
[美]本杰明·富兰克林 著;李自修 译
社交网站的数据挖掘与分析(原书第2版)
国际大奖图画书系列 共11册(小老鼠的恐惧的大书,大灰狼,红豆与菲比,别烦我,下雪了 ,穿靴子的猫 ,先有蛋,绿 ,特别快递,如果你想看鲸鱼 ,一个部落的孩子 ) 麦克米伦世纪
[美]莱恩·史密斯 (英)埃米莉·格雷维特 (美)劳拉·瓦卡罗·等/文 (英)埃米莉·格雷维特 等/图 彭懿 杨玲玲 阿甲 孙慧阳 白薇 译