集体智慧编程

集体智慧编程
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2009-01
版次: 1
ISBN: 9787121075391
定价: 59.80
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 334页
字数: 554千字
原版书名: Programming Collective Intelligence
97人买过
  • 本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
      
      
      本书是Web开发者、架构师、应用工程师等的绝佳选择。 Toby Segaran是Genstruct公司的软件开发主管,这家公司涉足计算生物领域,他本人的职责是设计算法,并利用数据挖掘技术来辅助了解药品机理。Toby Segaran还为其他几家公司和数个开源项目服务,帮助它们从收集到的数据当中分析并发掘价值。除此以外,TobySegaran还建立了几个 第1章 集体智慧导言

      什么是集体智慧

      什么是机器学习

      机器学习的局限

      真实生活中的例子

      学习型算法的其他用途

    第2章 提供推荐

      协作型过滤

      搜集偏好

      寻找相近的用户

      推荐物品

      匹配商品

      构建一个基于delici0US的链接推荐系统

      基于物品的过滤

      使用MovieLens数据集

      基于用户进行过滤还是基于物品进行过滤

      练习

    第3章 发现群组

      监督学习和无监督学习

      单词向量

      分级聚类

      绘制树状图

      列聚类

      K-均值聚类

      针对偏好的聚类

      以二维形式展现数据

      有关聚类的其他事宜

      练习

    第4章 搜索与排名

      搜索引擎的组成

      一个简单的爬虫程序

      建立索引

      查询

      基于内容的排名

      利用外部回指链接

      从点击行为中学习

      练习

    第5章 优化

      组团旅游

      描述题解

      成本函数

      随机搜索

      爬山法

      模拟退火算法

      遗传算法

      真实的航班搜索

      涉及偏好的优化

      网络可视化

      其他可能的应用场合

      练习

    第6章 文档过滤

      过滤垃圾信息

      文档和单词

      对分类器进行训练

      计算概率

      朴素分类器

      费舍尔方法

      将经过训练的分类器持久化

      过滤博客订阅源

      ……

    第7章 决策树建模

    第8章 构建价格模型

    第9章 高阶分类:核方法与SVM

    第10章 寻找独立特征

    第11章 智能进化

    第12章 算法总结

    附录A:第三方函数库

    附录B:数学公式

    索引
  • 内容简介:
    本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
      
      
      本书是Web开发者、架构师、应用工程师等的绝佳选择。
  • 作者简介:
    Toby Segaran是Genstruct公司的软件开发主管,这家公司涉足计算生物领域,他本人的职责是设计算法,并利用数据挖掘技术来辅助了解药品机理。Toby Segaran还为其他几家公司和数个开源项目服务,帮助它们从收集到的数据当中分析并发掘价值。除此以外,TobySegaran还建立了几个
  • 目录:
    第1章 集体智慧导言

      什么是集体智慧

      什么是机器学习

      机器学习的局限

      真实生活中的例子

      学习型算法的其他用途

    第2章 提供推荐

      协作型过滤

      搜集偏好

      寻找相近的用户

      推荐物品

      匹配商品

      构建一个基于delici0US的链接推荐系统

      基于物品的过滤

      使用MovieLens数据集

      基于用户进行过滤还是基于物品进行过滤

      练习

    第3章 发现群组

      监督学习和无监督学习

      单词向量

      分级聚类

      绘制树状图

      列聚类

      K-均值聚类

      针对偏好的聚类

      以二维形式展现数据

      有关聚类的其他事宜

      练习

    第4章 搜索与排名

      搜索引擎的组成

      一个简单的爬虫程序

      建立索引

      查询

      基于内容的排名

      利用外部回指链接

      从点击行为中学习

      练习

    第5章 优化

      组团旅游

      描述题解

      成本函数

      随机搜索

      爬山法

      模拟退火算法

      遗传算法

      真实的航班搜索

      涉及偏好的优化

      网络可视化

      其他可能的应用场合

      练习

    第6章 文档过滤

      过滤垃圾信息

      文档和单词

      对分类器进行训练

      计算概率

      朴素分类器

      费舍尔方法

      将经过训练的分类器持久化

      过滤博客订阅源

      ……

    第7章 决策树建模

    第8章 构建价格模型

    第9章 高阶分类:核方法与SVM

    第10章 寻找独立特征

    第11章 智能进化

    第12章 算法总结

    附录A:第三方函数库

    附录B:数学公式

    索引
查看详情
您可能感兴趣 / 更多
集体智慧编程
TOBY通勤日记
TOBY 著