智能Web算法

智能Web算法
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] (哈若拉玛·玛若曼尼斯) , [美] (德米特里·巴宾寇) , ,
2015-03
版次: 1
ISBN: 9787121254567
定价: 89.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 400页
字数: 440千字
正文语种: 简体中文
14人买过
  •   《智能Web算法》涵盖了五类重要的智能算法:搜索、推荐、聚类、分类和分类器组合,并结合具体的案例讨论了它们在Web应用中的角色及要注意的问题。除了第1章的概要性介绍以及第7章对所有技术的整合应用外,第2~6章以代码示例的形式分别对这五类算法进行了介绍。   陈钢,计算机博士,华大科技副总裁,香港中文大学兼职助理教授。现主要从事生物数据存储,分析与可视化工作,兴趣包括机器学习,数据可视化,个人基因组等。阿稳,08年于中国科学技术大学研究生毕业后加入豆瓣算法组,从事数据与算法相关工作。五年的豆瓣工作生涯里经历了豆瓣早期几乎所有的数据与算法产品,如图书豆瓣猜、豆瓣FM。后加入阿里,参与过天猫商品推荐算法,及手机淘宝的产品与算法业务。2014年下半年创办移动外贸电商企业Akarat,继续在产品与算法结合的路上探索。 前言
    致谢
    关于本书
    1什么是智能Web
    1.1智能Web应用实例
    1.2智能应用的基本要素
    1.3什么应用会受益于智能
    1.3.1社交网络
    1.3.2Mashup
    1.3.3门户网站
    1.3.4维基
    1.3.5文件分享网站
    1.3.6网络游戏
    1.4如何构建智能应用
    1.4.1检查功能和数据
    1.4.2获取更多的数据
    1.5机器学习、数据挖掘及其他
    1.6智能应用中八个常见的误区
    1.6.1误区1:数据是可靠的
    1.6.2误区2:计算能马上完成
    1.6.3误区3:不用考虑数据规模
    1.6.4误区4:不考虑解决方案的可扩展性
    1.6.5误区5:随处使用同样的方法
    1.6.6误区6:总是能知道计算时间
    1.6.7误区7:复杂的模型更好
    1.6.8误区8:存在无偏见的模型
    1.7小结
    1.8参考资料

    2搜索
    2.1用Lucene实现搜索
    2.1.1理解Lucene代码
    2.1.2搜索的基本步骤
    2.2为什么搜索不仅仅是索引
    2.3用链接分析改进搜索结果
    2.3.1PageRank简介
    2.3.2计算PageRank向量
    2.3.3alpha:网页间跳转的影响
    2.3.4理解幂方法
    2.3.5结合索引分值和PageRank分值
    2.4根据用户点击改进搜索结果
    2.4.1用户点击初探
    2.4.2朴素贝叶斯分类器的使用
    2.4.3整合Lucene索引、PageRank和用户点击
    2.5Word、PDF等无链接文档的排序
    2.5.1DocRank算法简介
    2.5.2DocRank的原理
    2.6大规模实现的有关问题
    2.7用户得到了想要的结果吗?精确度和查全率
    2.8总结
    2.9ToDo
    2.10参考资料

    3推荐系统
    3.1一个在线音乐商店:基本概念
    3.1.1距离与相似度的概念
    3.1.2走近相似度的计算
    3.1.3什么才是最好的相似度计算公式
    3.2推荐引擎是怎么工作的
    3.2.1基于相似用户的推荐
    3.2.2基于相似条目的推荐
    3.2.3基于内容的推荐
    3.3推荐朋友、文章与新闻报道
    3.3.1MyDiggSpace.com简介
    3.3.2发现朋友
    3.3.3DiggDelphi的内部工作机制
    3.4像Netflix.com那样推荐电影
    3.4.1电影数据集的介绍及推荐器
    3.4.2数据标准化与相关系数
    3.5大规模的实现与评估
    3.6总结
    3.7ToDo
    3.8参考资料

    4聚类:事物的分组
    4.1聚类的需求
    4.1.1网站中的用户组:案例研究
    4.1.2用SQLorderby子句分组
    4.1.3用数组排序分组
    4.2聚类算法概述
    4.2.1基于分组结构的聚类算法分类
    4.2.2基于数据类型和结构的聚类算法分类
    4.2.3根据数据规模的聚类算法分类
    4.3基于链接的算法
    4.3.1树状图:基本的聚类数据结构
    4.3.2基于链接的算法概况
    4.3.3单链接算法
    4.3.4平均链接算法
    4.3.5最小生成树算法
    4.4k-means算法
    4.4.1初识k-means算法
    4.4.2k-means的内部原理
    4.5鲁棒的链接型聚类(ROCK)
    4.5.1ROCK简介
    4.5.2为什么ROCK这么强大
    4.6DBSCAN
    4.6.1基于密度的算法简介
    4.6.2DBSCAN的原理
    4.7超大规模数据聚类
    4.7.1计算复杂性
    4.7.2高维度
    4.8总结
    4.9ToDo
    4.10参考资料

    5分类:把事物放到它该在的地方
    5.1对分类的需求
    5.2分类器的概述
    5.2.1结构分类算法
    5.2.2统计分类算法
    5.2.3分类器的生命周期
    5.3邮件的自动归类与垃圾邮件过滤
    5.3.1朴素贝叶斯分类
    5.3.2基于规则的分类
    5.4用神经网络做欺诈检测
    5.4.1交易数据中关于欺诈检测的一个用例
    5.4.2神经网络概览
    5.4.3一个可用的神经网络欺诈检测器
    5.4.4神经网络欺诈检测器剖析
    5.4.5创建通用神经网络的基类
    5.5你的结果可信吗
    5.6大数据集的分类
    5.7总结
    5.8ToDo
    5.9参考资料

    6分类器组合
    6.1信贷价值:分类器组合案例研究
    6.1.1数据的简要说明
    6.1.2为真实问题生成人工数据
    6.2用单分类器做信用评估
    6.2.1朴素贝叶斯的基准线
    6.2.2决策树基准线
    6.2.3神经网络的基准线
    6.3在同一个数据集中比较多个分类器
    6.3.1McNemar检验
    6.3.2差额比例检验
    6.3.3CochranQ检验与F检验
    6.4bagging:bootstrap聚合(bootstrapaggregating)
    6.4.1bagging实例
    6.4.2bagging分类器底层细节
    6.4.3分类器集成
    6.5boosting:一种迭代提高的方法
    6.5.1boosting分类器实例
    6.5.2boosting分类器底层细节
    6.6总结
    6.7ToDo
    6.8参考资料

    7智能技术大汇集:一个智能新闻门户
    7.1功能概览
    7.2获取并清洗内容
    7.2.1各就各位——预备——开抓!
    7.2.2搜索预备知识回顾
    7.2.3一个抓取并处理好的新闻数据集
    7.3搜索新闻
    7.4分配新闻类别
    7.4.1顺序问题
    7.4.2使用NewsProcessor类进行分类
    7.4.3分类器
    7.4.4分类策略:超越底层的分类
    7.5用NewsProcessor类创建新闻分组
    7.5.1聚类全部文章
    7.5.2在一个新闻类别中聚类文章
    7.6基于用户评分的动态内容展示
    7.7总结
    7.8ToDo
    7.9参考资料

    附录ABeanShell简介
    附录B网络采集
    附录C数学知识回顾
    附录D自然语言处理
    附录E神经网络
    索引
  • 内容简介:
      《智能Web算法》涵盖了五类重要的智能算法:搜索、推荐、聚类、分类和分类器组合,并结合具体的案例讨论了它们在Web应用中的角色及要注意的问题。除了第1章的概要性介绍以及第7章对所有技术的整合应用外,第2~6章以代码示例的形式分别对这五类算法进行了介绍。
  • 作者简介:
      陈钢,计算机博士,华大科技副总裁,香港中文大学兼职助理教授。现主要从事生物数据存储,分析与可视化工作,兴趣包括机器学习,数据可视化,个人基因组等。阿稳,08年于中国科学技术大学研究生毕业后加入豆瓣算法组,从事数据与算法相关工作。五年的豆瓣工作生涯里经历了豆瓣早期几乎所有的数据与算法产品,如图书豆瓣猜、豆瓣FM。后加入阿里,参与过天猫商品推荐算法,及手机淘宝的产品与算法业务。2014年下半年创办移动外贸电商企业Akarat,继续在产品与算法结合的路上探索。
  • 目录:
    前言
    致谢
    关于本书
    1什么是智能Web
    1.1智能Web应用实例
    1.2智能应用的基本要素
    1.3什么应用会受益于智能
    1.3.1社交网络
    1.3.2Mashup
    1.3.3门户网站
    1.3.4维基
    1.3.5文件分享网站
    1.3.6网络游戏
    1.4如何构建智能应用
    1.4.1检查功能和数据
    1.4.2获取更多的数据
    1.5机器学习、数据挖掘及其他
    1.6智能应用中八个常见的误区
    1.6.1误区1:数据是可靠的
    1.6.2误区2:计算能马上完成
    1.6.3误区3:不用考虑数据规模
    1.6.4误区4:不考虑解决方案的可扩展性
    1.6.5误区5:随处使用同样的方法
    1.6.6误区6:总是能知道计算时间
    1.6.7误区7:复杂的模型更好
    1.6.8误区8:存在无偏见的模型
    1.7小结
    1.8参考资料

    2搜索
    2.1用Lucene实现搜索
    2.1.1理解Lucene代码
    2.1.2搜索的基本步骤
    2.2为什么搜索不仅仅是索引
    2.3用链接分析改进搜索结果
    2.3.1PageRank简介
    2.3.2计算PageRank向量
    2.3.3alpha:网页间跳转的影响
    2.3.4理解幂方法
    2.3.5结合索引分值和PageRank分值
    2.4根据用户点击改进搜索结果
    2.4.1用户点击初探
    2.4.2朴素贝叶斯分类器的使用
    2.4.3整合Lucene索引、PageRank和用户点击
    2.5Word、PDF等无链接文档的排序
    2.5.1DocRank算法简介
    2.5.2DocRank的原理
    2.6大规模实现的有关问题
    2.7用户得到了想要的结果吗?精确度和查全率
    2.8总结
    2.9ToDo
    2.10参考资料

    3推荐系统
    3.1一个在线音乐商店:基本概念
    3.1.1距离与相似度的概念
    3.1.2走近相似度的计算
    3.1.3什么才是最好的相似度计算公式
    3.2推荐引擎是怎么工作的
    3.2.1基于相似用户的推荐
    3.2.2基于相似条目的推荐
    3.2.3基于内容的推荐
    3.3推荐朋友、文章与新闻报道
    3.3.1MyDiggSpace.com简介
    3.3.2发现朋友
    3.3.3DiggDelphi的内部工作机制
    3.4像Netflix.com那样推荐电影
    3.4.1电影数据集的介绍及推荐器
    3.4.2数据标准化与相关系数
    3.5大规模的实现与评估
    3.6总结
    3.7ToDo
    3.8参考资料

    4聚类:事物的分组
    4.1聚类的需求
    4.1.1网站中的用户组:案例研究
    4.1.2用SQLorderby子句分组
    4.1.3用数组排序分组
    4.2聚类算法概述
    4.2.1基于分组结构的聚类算法分类
    4.2.2基于数据类型和结构的聚类算法分类
    4.2.3根据数据规模的聚类算法分类
    4.3基于链接的算法
    4.3.1树状图:基本的聚类数据结构
    4.3.2基于链接的算法概况
    4.3.3单链接算法
    4.3.4平均链接算法
    4.3.5最小生成树算法
    4.4k-means算法
    4.4.1初识k-means算法
    4.4.2k-means的内部原理
    4.5鲁棒的链接型聚类(ROCK)
    4.5.1ROCK简介
    4.5.2为什么ROCK这么强大
    4.6DBSCAN
    4.6.1基于密度的算法简介
    4.6.2DBSCAN的原理
    4.7超大规模数据聚类
    4.7.1计算复杂性
    4.7.2高维度
    4.8总结
    4.9ToDo
    4.10参考资料

    5分类:把事物放到它该在的地方
    5.1对分类的需求
    5.2分类器的概述
    5.2.1结构分类算法
    5.2.2统计分类算法
    5.2.3分类器的生命周期
    5.3邮件的自动归类与垃圾邮件过滤
    5.3.1朴素贝叶斯分类
    5.3.2基于规则的分类
    5.4用神经网络做欺诈检测
    5.4.1交易数据中关于欺诈检测的一个用例
    5.4.2神经网络概览
    5.4.3一个可用的神经网络欺诈检测器
    5.4.4神经网络欺诈检测器剖析
    5.4.5创建通用神经网络的基类
    5.5你的结果可信吗
    5.6大数据集的分类
    5.7总结
    5.8ToDo
    5.9参考资料

    6分类器组合
    6.1信贷价值:分类器组合案例研究
    6.1.1数据的简要说明
    6.1.2为真实问题生成人工数据
    6.2用单分类器做信用评估
    6.2.1朴素贝叶斯的基准线
    6.2.2决策树基准线
    6.2.3神经网络的基准线
    6.3在同一个数据集中比较多个分类器
    6.3.1McNemar检验
    6.3.2差额比例检验
    6.3.3CochranQ检验与F检验
    6.4bagging:bootstrap聚合(bootstrapaggregating)
    6.4.1bagging实例
    6.4.2bagging分类器底层细节
    6.4.3分类器集成
    6.5boosting:一种迭代提高的方法
    6.5.1boosting分类器实例
    6.5.2boosting分类器底层细节
    6.6总结
    6.7ToDo
    6.8参考资料

    7智能技术大汇集:一个智能新闻门户
    7.1功能概览
    7.2获取并清洗内容
    7.2.1各就各位——预备——开抓!
    7.2.2搜索预备知识回顾
    7.2.3一个抓取并处理好的新闻数据集
    7.3搜索新闻
    7.4分配新闻类别
    7.4.1顺序问题
    7.4.2使用NewsProcessor类进行分类
    7.4.3分类器
    7.4.4分类策略:超越底层的分类
    7.5用NewsProcessor类创建新闻分组
    7.5.1聚类全部文章
    7.5.2在一个新闻类别中聚类文章
    7.6基于用户评分的动态内容展示
    7.7总结
    7.8ToDo
    7.9参考资料

    附录ABeanShell简介
    附录B网络采集
    附录C数学知识回顾
    附录D自然语言处理
    附录E神经网络
    索引
查看详情
您可能感兴趣 / 更多
智能Web算法
无辜者的谎言(相信我!看到结局你一定会头皮发麻;全美读者推荐的悬疑神作,GOODREADS高分作品)
[美]A.R.托雷 著;梁颂宇 译;星文文化 出品
智能Web算法
孩子,把你的手给我1:怎么说孩子才爱听,怎么教孩子才肯学?帮助每一位3-12岁孩子的父母结束与孩子的所有冲突!
[美]海姆·G.吉诺特
智能Web算法
哲学、历史与僭政——重审施特劳斯与科耶夫之争
[美]弗罗斯特(Bryan-Paul Frost) 编;[美]伯恩斯(Timothy W. Burns)
智能Web算法
怎样做成大事
[美]丹·加德纳(Dan Gardner) 著;贾拥民 译;湛庐文化 出品;[丹麦]傅以斌(Bent Flyvbjerg)
智能Web算法
1200年希腊罗马神话
[美]伊迪丝·汉密尔顿
智能Web算法
爱情心理学(新编本)
[美]罗伯特·J. 斯腾伯格 (美)凯琳·斯腾伯格 倪爱萍 译
智能Web算法
黄金圈法则
[美]西蒙·斯涅克 著;磨铁文化 出品
智能Web算法
最后一章
[美]厄尼·派尔
智能Web算法
汤姆·索亚历险记 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]马克 吐温
智能Web算法
富兰克林自传 名家全译本 改变无数人命运的励志传奇 埃隆马斯克反复推荐 赠富兰克林签名照及精美插图
[美]本杰明·富兰克林 著;李自修 译
智能Web算法
汤姆素亚历险记:中小学生课外阅读快乐读书吧 儿童文学无障碍有声伴读世界名著童话故事
[美]马克·吐温
智能Web算法
国际大奖图画书系列 共11册(小老鼠的恐惧的大书,大灰狼,红豆与菲比,别烦我,下雪了 ,穿靴子的猫 ,先有蛋,绿 ,特别快递,如果你想看鲸鱼 ,一个部落的孩子 ) 麦克米伦世纪
[美]莱恩·史密斯 (英)埃米莉·格雷维特 (美)劳拉·瓦卡罗·等/文 (英)埃米莉·格雷维特 等/图 彭懿 杨玲玲 阿甲 孙慧阳 白薇 译