信息检索导论(英文版)

信息检索导论(英文版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , [美] , [德]
2010-01
版次: 1
ISBN: 9787115218247
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 482页
字数: 605千字
正文语种: 英语
24人买过
  • 《信息检索导论(英文版)》是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了最新的讲解。
    书中所有重要的思想都是用示例进行解释,图文并茂。《信息检索导论(英文版)》非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。 ChristopherD.Manning,斯坦福大学语言学博士,现任斯坦福大学计算机科学和语言学副教授,主要研究方向是统计自然语言处理、信息提取与表示、文本理解和文本挖掘等。
    PrabhakarRaghavan,加州大学伯克利分校博士,现任Yahoo!实验室主任,斯坦福大学计算机科学系顾问教授,是ACM和IEEE会士。主要研究兴趣是文本及Web数据挖掘、算法设计等。此前,他曾任Verity公司CTO,并在旧M研究院担任过管理工作。
    HinrichSchuze斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾在施乐PaloAlto研究中心供职,担任过Outride公司(后被Google公司收购)副总裁,做过Novation生物科技公司CTO和Enkata公司首席科学家。 1Booleanretrieval1
    1.1Anexampleinformationretrievalproblem3
    1.2Afirsttakeatbuildinganinvertedindex6
    1.3ProcessingBooleanqueries9
    1.4TheextendedBooleanmodelversusrankedretrieval13
    1.5Referencesandfurtherreading16

    2Thetermvocabularyandpostingslists18
    2.1Documentdelineationandcharactersequencedecoding18
    2.2Determiningthevocabularyofterms21
    2.3Fasterpostingslistintersectionviaskippointers33
    2.4Positionalpostingsandphrasequeries36
    2.5Referencesandfurtherreading43

    3Dictionariesandtolerantretrieval45
    3.1Searchstructuresfordictionaries45
    3.2Wildcardqueries48
    3.3Spellingcorrection52
    3.4Phoneticcorrection58
    3.5Referencesandfurtherreading59

    4Indexconstruction61
    4.1Hardwarebasics62
    4.2Blockedsort-basedindexing63
    4.3Single-passin-memoryindexing66
    4.4Distributedindexing68
    4.5Dynamicindexing71
    4.6Othertypesofindexes73
    4.7Referencesandfurtherreading76

    5Indexcompression78
    5.1Statisticalpropertiesoftermsininformationretrieval79
    5.2Dictionarycompression82
    5.3Postingsfilecompression87
    5.4Referencesandfurtherreading97

    6Scoring,termweighting,andthevectorspacemodel100
    6.1Parametricandzoneindexes101
    6.2Termfrequencyandweighting107
    6.3Thevectorspacemodelforscoring110
    6.4Varianttf–idffunctions116
    6.5Referencesandfurtherreading122

    7Computingscoresinacompletesearchsystem124
    7.1Efficientscoringandranking124
    7.2Componentsofaninformationretrievalsystem132
    7.3Vectorspacescoringandqueryoperatorinteraction136
    7.4Referencesandfurtherreading137

    8Evaluationininformationretrieval139
    8.1Informationretrievalsystemevaluation140
    8.2Standardtestcollections141
    8.3Evaluationofunrankedretrievalsets142
    8.4Evaluationofrankedretrievalresults145
    8.5Assessingrelevance151
    8.6Abroaderperspective:Systemqualityanduserutility154
    8.7Resultssnippets157
    8.8Referencesandfurtherreading159

    9Relevancefeedbackandqueryexpansion162
    9.1Relevancefeedbackandpseudorelevancefeedback163
    9.2Globalmethodsforqueryreformulation173
    9.3Referencesandfurtherreading177

    10XMLretrieval178
    10.1BasicXMLconcepts180
    10.2ChallengesinXMLretrieval183
    10.3AvectorspacemodelforXMLretrieval188
    10.4EvaluationofXMLretrieval192
    10.5Text-centricversusdata-centricXMLretrieval196
    10.6Referencesandfurtherreading198

    11Probabilisticinformationretrieval201
    11.1Reviewofbasicprobabilitytheory202
    11.2Theprobabilityrankingprinciple203
    11.3Thebinaryindependencemodel204
    11.4Anappraisalandsomeextensions212
    11.5Referencesandfurtherreading216

    12Languagemodelsforinformationretrieval218
    12.1Languagemodels218
    12.2Thequerylikelihoodmodel223
    12.3Languagemodelingversusotherapproachesininformationretrieval229
    12.4Extendedlanguagemodelingapproaches230
    12.5Referencesandfurtherreading232

    13TextclassificationandNaiveBayes234
    13.1Thetextclassificationproblem237
    13.2NaiveBayestextclassification238
    13.3TheBernoullimodel243
    13.4PropertiesofNaiveBayes245
    13.5Featureselection251
    13.6Evaluationoftextclassification258
    13.7Referencesandfurtherreading264

    14Vectorspaceclassification266
    14.1Documentrepresentationsandmeasuresofrelatednessinvectorspaces267
    14.2Rocchioclassification269
    14.3knearestneighbor273
    14.4Linearversusnonlinearclassifiers277
    14.5Classificationwithmorethantwoclasses281
    14.6Thebias–variancetradeoff284
    14.7Referencesandfurtherreading291

    15Supportvectormachinesandmachinelearningondocuments293
    15.1Supportvectormachines:Thelinearlyseparablecase294
    15.2Extensionstothesupportvectormachinemodel300
    15.3Issuesintheclassificationoftextdocuments307
    15.4Machine-learningmethodsinadhocinformationretrieval314
    15.5Referencesandfurtherreading318

    16Flatclustering321
    16.1Clusteringininformationretrieval322
    16.2Problemstatement326
    16.3Evaluationofclustering327
    16.4K-means331
    16.5Model-basedclustering338
    16.6Referencesandfurtherreading343

    17Hierarchicalclustering346
    17.1Hierarchicalagglomerativeclustering347
    17.2Single-linkandcomplete-linkclustering350
    17.3Group-averageagglomerativeclustering356
    17.4Centroidclustering358
    17.5Optimalityofhierarchicalagglomerativeclustering360
    17.6Divisiveclustering362
    17.7Clusterlabeling363
    17.8Implementationnotes365
    17.9Referencesandfurtherreading367

    18Matrixdecompositionsandlatentsemanticindexing369
    18.1Linearalgebrareview369
    18.2Term–documentmatricesandsingularvaluedecompositions373
    18.3Low-rankapproximations376
    18.4Latentsemanticindexing378
    18.5Referencesandfurtherreading383

    19Websearchbasics385
    19.1Backgroundandhistory385
    19.2Webcharacteristics387
    19.3Advertisingastheeconomicmodel392
    19.4Thesearchuserexperience395
    19.5Indexsizeandestimation396
    19.6Near-duplicatesandshingling400
    19.7Referencesandfurtherreading404

    20Webcrawlingandindexes405
    20.1Overview405
    20.2Crawling406
    20.3Distributingindexes415
    20.4Connectivityservers416

    21Linkanalysis421
    21.1TheWebasagraph422
    21.2PageRank424
    21.3Hubsandauthorities433
    21.4Referencesandfurtherreading439

    Inde469
    Bibliography441
  • 内容简介:
    《信息检索导论(英文版)》是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了最新的讲解。
    书中所有重要的思想都是用示例进行解释,图文并茂。《信息检索导论(英文版)》非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。
  • 作者简介:
    ChristopherD.Manning,斯坦福大学语言学博士,现任斯坦福大学计算机科学和语言学副教授,主要研究方向是统计自然语言处理、信息提取与表示、文本理解和文本挖掘等。
    PrabhakarRaghavan,加州大学伯克利分校博士,现任Yahoo!实验室主任,斯坦福大学计算机科学系顾问教授,是ACM和IEEE会士。主要研究兴趣是文本及Web数据挖掘、算法设计等。此前,他曾任Verity公司CTO,并在旧M研究院担任过管理工作。
    HinrichSchuze斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾在施乐PaloAlto研究中心供职,担任过Outride公司(后被Google公司收购)副总裁,做过Novation生物科技公司CTO和Enkata公司首席科学家。
  • 目录:
    1Booleanretrieval1
    1.1Anexampleinformationretrievalproblem3
    1.2Afirsttakeatbuildinganinvertedindex6
    1.3ProcessingBooleanqueries9
    1.4TheextendedBooleanmodelversusrankedretrieval13
    1.5Referencesandfurtherreading16

    2Thetermvocabularyandpostingslists18
    2.1Documentdelineationandcharactersequencedecoding18
    2.2Determiningthevocabularyofterms21
    2.3Fasterpostingslistintersectionviaskippointers33
    2.4Positionalpostingsandphrasequeries36
    2.5Referencesandfurtherreading43

    3Dictionariesandtolerantretrieval45
    3.1Searchstructuresfordictionaries45
    3.2Wildcardqueries48
    3.3Spellingcorrection52
    3.4Phoneticcorrection58
    3.5Referencesandfurtherreading59

    4Indexconstruction61
    4.1Hardwarebasics62
    4.2Blockedsort-basedindexing63
    4.3Single-passin-memoryindexing66
    4.4Distributedindexing68
    4.5Dynamicindexing71
    4.6Othertypesofindexes73
    4.7Referencesandfurtherreading76

    5Indexcompression78
    5.1Statisticalpropertiesoftermsininformationretrieval79
    5.2Dictionarycompression82
    5.3Postingsfilecompression87
    5.4Referencesandfurtherreading97

    6Scoring,termweighting,andthevectorspacemodel100
    6.1Parametricandzoneindexes101
    6.2Termfrequencyandweighting107
    6.3Thevectorspacemodelforscoring110
    6.4Varianttf–idffunctions116
    6.5Referencesandfurtherreading122

    7Computingscoresinacompletesearchsystem124
    7.1Efficientscoringandranking124
    7.2Componentsofaninformationretrievalsystem132
    7.3Vectorspacescoringandqueryoperatorinteraction136
    7.4Referencesandfurtherreading137

    8Evaluationininformationretrieval139
    8.1Informationretrievalsystemevaluation140
    8.2Standardtestcollections141
    8.3Evaluationofunrankedretrievalsets142
    8.4Evaluationofrankedretrievalresults145
    8.5Assessingrelevance151
    8.6Abroaderperspective:Systemqualityanduserutility154
    8.7Resultssnippets157
    8.8Referencesandfurtherreading159

    9Relevancefeedbackandqueryexpansion162
    9.1Relevancefeedbackandpseudorelevancefeedback163
    9.2Globalmethodsforqueryreformulation173
    9.3Referencesandfurtherreading177

    10XMLretrieval178
    10.1BasicXMLconcepts180
    10.2ChallengesinXMLretrieval183
    10.3AvectorspacemodelforXMLretrieval188
    10.4EvaluationofXMLretrieval192
    10.5Text-centricversusdata-centricXMLretrieval196
    10.6Referencesandfurtherreading198

    11Probabilisticinformationretrieval201
    11.1Reviewofbasicprobabilitytheory202
    11.2Theprobabilityrankingprinciple203
    11.3Thebinaryindependencemodel204
    11.4Anappraisalandsomeextensions212
    11.5Referencesandfurtherreading216

    12Languagemodelsforinformationretrieval218
    12.1Languagemodels218
    12.2Thequerylikelihoodmodel223
    12.3Languagemodelingversusotherapproachesininformationretrieval229
    12.4Extendedlanguagemodelingapproaches230
    12.5Referencesandfurtherreading232

    13TextclassificationandNaiveBayes234
    13.1Thetextclassificationproblem237
    13.2NaiveBayestextclassification238
    13.3TheBernoullimodel243
    13.4PropertiesofNaiveBayes245
    13.5Featureselection251
    13.6Evaluationoftextclassification258
    13.7Referencesandfurtherreading264

    14Vectorspaceclassification266
    14.1Documentrepresentationsandmeasuresofrelatednessinvectorspaces267
    14.2Rocchioclassification269
    14.3knearestneighbor273
    14.4Linearversusnonlinearclassifiers277
    14.5Classificationwithmorethantwoclasses281
    14.6Thebias–variancetradeoff284
    14.7Referencesandfurtherreading291

    15Supportvectormachinesandmachinelearningondocuments293
    15.1Supportvectormachines:Thelinearlyseparablecase294
    15.2Extensionstothesupportvectormachinemodel300
    15.3Issuesintheclassificationoftextdocuments307
    15.4Machine-learningmethodsinadhocinformationretrieval314
    15.5Referencesandfurtherreading318

    16Flatclustering321
    16.1Clusteringininformationretrieval322
    16.2Problemstatement326
    16.3Evaluationofclustering327
    16.4K-means331
    16.5Model-basedclustering338
    16.6Referencesandfurtherreading343

    17Hierarchicalclustering346
    17.1Hierarchicalagglomerativeclustering347
    17.2Single-linkandcomplete-linkclustering350
    17.3Group-averageagglomerativeclustering356
    17.4Centroidclustering358
    17.5Optimalityofhierarchicalagglomerativeclustering360
    17.6Divisiveclustering362
    17.7Clusterlabeling363
    17.8Implementationnotes365
    17.9Referencesandfurtherreading367

    18Matrixdecompositionsandlatentsemanticindexing369
    18.1Linearalgebrareview369
    18.2Term–documentmatricesandsingularvaluedecompositions373
    18.3Low-rankapproximations376
    18.4Latentsemanticindexing378
    18.5Referencesandfurtherreading383

    19Websearchbasics385
    19.1Backgroundandhistory385
    19.2Webcharacteristics387
    19.3Advertisingastheeconomicmodel392
    19.4Thesearchuserexperience395
    19.5Indexsizeandestimation396
    19.6Near-duplicatesandshingling400
    19.7Referencesandfurtherreading404

    20Webcrawlingandindexes405
    20.1Overview405
    20.2Crawling406
    20.3Distributingindexes415
    20.4Connectivityservers416

    21Linkanalysis421
    21.1TheWebasagraph422
    21.2PageRank424
    21.3Hubsandauthorities433
    21.4Referencesandfurtherreading439

    Inde469
    Bibliography441
查看详情
系列丛书 / 更多
信息检索导论(英文版)
算法(英文版•第4版)
[美]塞奇威克(Robert Sedgewick)、[美]韦恩(Kevin Wayne) 著
信息检索导论(英文版)
计算机程序设计艺术(第2卷 英文版·第3版):半数值算法
[美]高德纳 著
信息检索导论(英文版)
计算机程序设计艺术,卷4A:组合算法(一)(英文版)
[美]Donald E.Knuth 著
信息检索导论(英文版)
计算机程序设计艺术(第3卷 英文版·第2版):排序与查找
[美]高德纳(Knuth D.E) 著
信息检索导论(英文版)
C++Primer(英文版)(第4版)
李普曼 著
信息检索导论(英文版)
信息检索:算法与启发式方法(英文版·第2版)
[美]格罗斯曼、[美]弗里德 著
信息检索导论(英文版)
数据结构与算法分析:C++描述(英文版)(第3版)
[美]维斯 著
信息检索导论(英文版)
UNIX环境高级编程
史蒂文斯、拉戈 著
信息检索导论(英文版)
文本挖掘
[以色列]费尔德曼、[美]桑格 著
信息检索导论(英文版)
Web数据挖掘:超文本数据的知识发现
[印]查凯莱巴蒂 著
信息检索导论(英文版)
算法
[美]塞奇威克(Robert Sedgewick)、[美]韦恩(Kevin Wayne) 著
信息检索导论(英文版)
IPv6详解,第1卷,核心协议实现:IPv6时代的《TCP/IP详解》!
[美]李清、[日]神明达哉、[日]岛庆一 著
相关图书 / 更多
信息检索导论(英文版)
信息系统监理师教程(第2版)
贾卓生、张树玲、李京、吕小刚、陈兵
信息检索导论(英文版)
信息论基础
翟明岳
信息检索导论(英文版)
信息系统分析与设计
熊伟、陈浩、陈荦
信息检索导论(英文版)
信息系统项目管理师案例分析一本通(第二版)
王树文
信息检索导论(英文版)
信息差:看透大数据背后的底层逻辑
(英) 保罗·古德温 著,文通天下 出品
信息检索导论(英文版)
信息安全法研究(第二版)
马民虎 方婷著
信息检索导论(英文版)
信息可视化设计
周承君、姜朝阳、王之娇 著
信息检索导论(英文版)
信息检索与深度学习
郭嘉丰 兰艳艳 程学旗
信息检索导论(英文版)
信息系统监理师考试大纲
全国计算机专业技术资格考试办公室
信息检索导论(英文版)
信息处理技术员考试32小时通关
薛大龙 编
信息检索导论(英文版)
信息助推,或适得其反--为什么知道的并非越多越好?
(美) 卡斯·R.桑斯坦 著,杨帅华 译
信息检索导论(英文版)
信息学竞赛宝典 动态规划
张新华 胡向荣 伍婉秋
您可能感兴趣 / 更多
信息检索导论(英文版)
亚拉山大的读心术(数学大师的逻辑课) 伦理学、逻辑学 [美]雷蒙德·m.斯穆里安(raymondm.smullyan)
[美]雷蒙德·m.斯穆里安(raymondm.smullyan)
信息检索导论(英文版)
纳博科夫精选集第五辑
[美]弗拉基米尔·纳博科夫著
信息检索导论(英文版)
九桃盘(美国二十世纪重要女诗人玛丽安·摩尔诗歌精选集,由知名女诗人和女性诗学研究者倪志娟倾情翻译)
[美]玛丽安•摩尔
信息检索导论(英文版)
全新正版图书 制造德·戴维尼浙江教育出版社9787572276880
[美]理查德·戴维尼
信息检索导论(英文版)
血泪之泣
[美]希瑟·丘·麦克亚当
信息检索导论(英文版)
小学生趣味心理学(培养执行技能的40个练习,发展共情能力的46个练习,学会应对焦虑的40个练习 共3册) (美)莎伦·格兰德 王佳妮译
[美]莎伦·格兰德(sharon grand)
信息检索导论(英文版)
(当代学术棱镜译丛)艺术批评入门:历史、策略与声音
[美]克尔·休斯顿
信息检索导论(英文版)
金钱游戏(划时代增订版):深层透析金融游戏表象之下的规则与黑箱 长达60年盘踞金融畅销榜的现象级作品
[美]亚当·史密斯(Adam Smith) 著;刘寅龙 译
信息检索导论(英文版)
矿王谷的黎明:塞拉俱乐部诉莫顿案与美国环境法的转变(精装典藏版)
[美]丹尼尔·P.塞尔米,(Daniel,P.Selmi)
信息检索导论(英文版)
体式神话:瑜伽传统故事精粹(第二版) (从30个体式古老起源中汲取灵感与力量,内附精美插图)
[美]阿兰娜·凯瓦娅(Alanna Kaivalya)[荷]阿诸那·范德·库伊(Arjuna van der Kooij)
信息检索导论(英文版)
诺奖作家给孩子的阅读课·生命教育(3-9年级,莫言余华的文学启蒙,垫高阅读起点,提升作文能力)
[美]海明威等
信息检索导论(英文版)
蚯蚓的日记(全4册)【平装版】
[美]朵琳·克罗宁