信息检索导论(英文版)

信息检索导论(英文版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] [美] [德]
出版社: 人民邮电出版社
2010-01
版次: 1
ISBN: 9787115218247
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 482页
字数: 605千字
正文语种: 英语
  • 《信息检索导论(英文版)》是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了最新的讲解。
    书中所有重要的思想都是用示例进行解释,图文并茂。《信息检索导论(英文版)》非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。 ChristopherD.Manning,斯坦福大学语言学博士,现任斯坦福大学计算机科学和语言学副教授,主要研究方向是统计自然语言处理、信息提取与表示、文本理解和文本挖掘等。
    PrabhakarRaghavan,加州大学伯克利分校博士,现任Yahoo!实验室主任,斯坦福大学计算机科学系顾问教授,是ACM和IEEE会士。主要研究兴趣是文本及Web数据挖掘、算法设计等。此前,他曾任Verity公司CTO,并在旧M研究院担任过管理工作。
    HinrichSchuze斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾在施乐PaloAlto研究中心供职,担任过Outride公司(后被Google公司收购)副总裁,做过Novation生物科技公司CTO和Enkata公司首席科学家。 1Booleanretrieval1
    1.1Anexampleinformationretrievalproblem3
    1.2Afirsttakeatbuildinganinvertedindex6
    1.3ProcessingBooleanqueries9
    1.4TheextendedBooleanmodelversusrankedretrieval13
    1.5Referencesandfurtherreading16

    2Thetermvocabularyandpostingslists18
    2.1Documentdelineationandcharactersequencedecoding18
    2.2Determiningthevocabularyofterms21
    2.3Fasterpostingslistintersectionviaskippointers33
    2.4Positionalpostingsandphrasequeries36
    2.5Referencesandfurtherreading43

    3Dictionariesandtolerantretrieval45
    3.1Searchstructuresfordictionaries45
    3.2Wildcardqueries48
    3.3Spellingcorrection52
    3.4Phoneticcorrection58
    3.5Referencesandfurtherreading59

    4Indexconstruction61
    4.1Hardwarebasics62
    4.2Blockedsort-basedindexing63
    4.3Single-passin-memoryindexing66
    4.4Distributedindexing68
    4.5Dynamicindexing71
    4.6Othertypesofindexes73
    4.7Referencesandfurtherreading76

    5Indexcompression78
    5.1Statisticalpropertiesoftermsininformationretrieval79
    5.2Dictionarycompression82
    5.3Postingsfilecompression87
    5.4Referencesandfurtherreading97

    6Scoring,termweighting,andthevectorspacemodel100
    6.1Parametricandzoneindexes101
    6.2Termfrequencyandweighting107
    6.3Thevectorspacemodelforscoring110
    6.4Varianttf–idffunctions116
    6.5Referencesandfurtherreading122

    7Computingscoresinacompletesearchsystem124
    7.1Efficientscoringandranking124
    7.2Componentsofaninformationretrievalsystem132
    7.3Vectorspacescoringandqueryoperatorinteraction136
    7.4Referencesandfurtherreading137

    8Evaluationininformationretrieval139
    8.1Informationretrievalsystemevaluation140
    8.2Standardtestcollections141
    8.3Evaluationofunrankedretrievalsets142
    8.4Evaluationofrankedretrievalresults145
    8.5Assessingrelevance151
    8.6Abroaderperspective:Systemqualityanduserutility154
    8.7Resultssnippets157
    8.8Referencesandfurtherreading159

    9Relevancefeedbackandqueryexpansion162
    9.1Relevancefeedbackandpseudorelevancefeedback163
    9.2Globalmethodsforqueryreformulation173
    9.3Referencesandfurtherreading177

    10XMLretrieval178
    10.1BasicXMLconcepts180
    10.2ChallengesinXMLretrieval183
    10.3AvectorspacemodelforXMLretrieval188
    10.4EvaluationofXMLretrieval192
    10.5Text-centricversusdata-centricXMLretrieval196
    10.6Referencesandfurtherreading198

    11Probabilisticinformationretrieval201
    11.1Reviewofbasicprobabilitytheory202
    11.2Theprobabilityrankingprinciple203
    11.3Thebinaryindependencemodel204
    11.4Anappraisalandsomeextensions212
    11.5Referencesandfurtherreading216

    12Languagemodelsforinformationretrieval218
    12.1Languagemodels218
    12.2Thequerylikelihoodmodel223
    12.3Languagemodelingversusotherapproachesininformationretrieval229
    12.4Extendedlanguagemodelingapproaches230
    12.5Referencesandfurtherreading232

    13TextclassificationandNaiveBayes234
    13.1Thetextclassificationproblem237
    13.2NaiveBayestextclassification238
    13.3TheBernoullimodel243
    13.4PropertiesofNaiveBayes245
    13.5Featureselection251
    13.6Evaluationoftextclassification258
    13.7Referencesandfurtherreading264

    14Vectorspaceclassification266
    14.1Documentrepresentationsandmeasuresofrelatednessinvectorspaces267
    14.2Rocchioclassification269
    14.3knearestneighbor273
    14.4Linearversusnonlinearclassifiers277
    14.5Classificationwithmorethantwoclasses281
    14.6Thebias–variancetradeoff284
    14.7Referencesandfurtherreading291

    15Supportvectormachinesandmachinelearningondocuments293
    15.1Supportvectormachines:Thelinearlyseparablecase294
    15.2Extensionstothesupportvectormachinemodel300
    15.3Issuesintheclassificationoftextdocuments307
    15.4Machine-learningmethodsinadhocinformationretrieval314
    15.5Referencesandfurtherreading318

    16Flatclustering321
    16.1Clusteringininformationretrieval322
    16.2Problemstatement326
    16.3Evaluationofclustering327
    16.4K-means331
    16.5Model-basedclustering338
    16.6Referencesandfurtherreading343

    17Hierarchicalclustering346
    17.1Hierarchicalagglomerativeclustering347
    17.2Single-linkandcomplete-linkclustering350
    17.3Group-averageagglomerativeclustering356
    17.4Centroidclustering358
    17.5Optimalityofhierarchicalagglomerativeclustering360
    17.6Divisiveclustering362
    17.7Clusterlabeling363
    17.8Implementationnotes365
    17.9Referencesandfurtherreading367

    18Matrixdecompositionsandlatentsemanticindexing369
    18.1Linearalgebrareview369
    18.2Term–documentmatricesandsingularvaluedecompositions373
    18.3Low-rankapproximations376
    18.4Latentsemanticindexing378
    18.5Referencesandfurtherreading383

    19Websearchbasics385
    19.1Backgroundandhistory385
    19.2Webcharacteristics387
    19.3Advertisingastheeconomicmodel392
    19.4Thesearchuserexperience395
    19.5Indexsizeandestimation396
    19.6Near-duplicatesandshingling400
    19.7Referencesandfurtherreading404

    20Webcrawlingandindexes405
    20.1Overview405
    20.2Crawling406
    20.3Distributingindexes415
    20.4Connectivityservers416

    21Linkanalysis421
    21.1TheWebasagraph422
    21.2PageRank424
    21.3Hubsandauthorities433
    21.4Referencesandfurtherreading439

    Inde469
    Bibliography441
  • 内容简介:
    《信息检索导论(英文版)》是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了最新的讲解。
    书中所有重要的思想都是用示例进行解释,图文并茂。《信息检索导论(英文版)》非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。
  • 作者简介:
    ChristopherD.Manning,斯坦福大学语言学博士,现任斯坦福大学计算机科学和语言学副教授,主要研究方向是统计自然语言处理、信息提取与表示、文本理解和文本挖掘等。
    PrabhakarRaghavan,加州大学伯克利分校博士,现任Yahoo!实验室主任,斯坦福大学计算机科学系顾问教授,是ACM和IEEE会士。主要研究兴趣是文本及Web数据挖掘、算法设计等。此前,他曾任Verity公司CTO,并在旧M研究院担任过管理工作。
    HinrichSchuze斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾在施乐PaloAlto研究中心供职,担任过Outride公司(后被Google公司收购)副总裁,做过Novation生物科技公司CTO和Enkata公司首席科学家。
  • 目录:
    1Booleanretrieval1
    1.1Anexampleinformationretrievalproblem3
    1.2Afirsttakeatbuildinganinvertedindex6
    1.3ProcessingBooleanqueries9
    1.4TheextendedBooleanmodelversusrankedretrieval13
    1.5Referencesandfurtherreading16

    2Thetermvocabularyandpostingslists18
    2.1Documentdelineationandcharactersequencedecoding18
    2.2Determiningthevocabularyofterms21
    2.3Fasterpostingslistintersectionviaskippointers33
    2.4Positionalpostingsandphrasequeries36
    2.5Referencesandfurtherreading43

    3Dictionariesandtolerantretrieval45
    3.1Searchstructuresfordictionaries45
    3.2Wildcardqueries48
    3.3Spellingcorrection52
    3.4Phoneticcorrection58
    3.5Referencesandfurtherreading59

    4Indexconstruction61
    4.1Hardwarebasics62
    4.2Blockedsort-basedindexing63
    4.3Single-passin-memoryindexing66
    4.4Distributedindexing68
    4.5Dynamicindexing71
    4.6Othertypesofindexes73
    4.7Referencesandfurtherreading76

    5Indexcompression78
    5.1Statisticalpropertiesoftermsininformationretrieval79
    5.2Dictionarycompression82
    5.3Postingsfilecompression87
    5.4Referencesandfurtherreading97

    6Scoring,termweighting,andthevectorspacemodel100
    6.1Parametricandzoneindexes101
    6.2Termfrequencyandweighting107
    6.3Thevectorspacemodelforscoring110
    6.4Varianttf–idffunctions116
    6.5Referencesandfurtherreading122

    7Computingscoresinacompletesearchsystem124
    7.1Efficientscoringandranking124
    7.2Componentsofaninformationretrievalsystem132
    7.3Vectorspacescoringandqueryoperatorinteraction136
    7.4Referencesandfurtherreading137

    8Evaluationininformationretrieval139
    8.1Informationretrievalsystemevaluation140
    8.2Standardtestcollections141
    8.3Evaluationofunrankedretrievalsets142
    8.4Evaluationofrankedretrievalresults145
    8.5Assessingrelevance151
    8.6Abroaderperspective:Systemqualityanduserutility154
    8.7Resultssnippets157
    8.8Referencesandfurtherreading159

    9Relevancefeedbackandqueryexpansion162
    9.1Relevancefeedbackandpseudorelevancefeedback163
    9.2Globalmethodsforqueryreformulation173
    9.3Referencesandfurtherreading177

    10XMLretrieval178
    10.1BasicXMLconcepts180
    10.2ChallengesinXMLretrieval183
    10.3AvectorspacemodelforXMLretrieval188
    10.4EvaluationofXMLretrieval192
    10.5Text-centricversusdata-centricXMLretrieval196
    10.6Referencesandfurtherreading198

    11Probabilisticinformationretrieval201
    11.1Reviewofbasicprobabilitytheory202
    11.2Theprobabilityrankingprinciple203
    11.3Thebinaryindependencemodel204
    11.4Anappraisalandsomeextensions212
    11.5Referencesandfurtherreading216

    12Languagemodelsforinformationretrieval218
    12.1Languagemodels218
    12.2Thequerylikelihoodmodel223
    12.3Languagemodelingversusotherapproachesininformationretrieval229
    12.4Extendedlanguagemodelingapproaches230
    12.5Referencesandfurtherreading232

    13TextclassificationandNaiveBayes234
    13.1Thetextclassificationproblem237
    13.2NaiveBayestextclassification238
    13.3TheBernoullimodel243
    13.4PropertiesofNaiveBayes245
    13.5Featureselection251
    13.6Evaluationoftextclassification258
    13.7Referencesandfurtherreading264

    14Vectorspaceclassification266
    14.1Documentrepresentationsandmeasuresofrelatednessinvectorspaces267
    14.2Rocchioclassification269
    14.3knearestneighbor273
    14.4Linearversusnonlinearclassifiers277
    14.5Classificationwithmorethantwoclasses281
    14.6Thebias–variancetradeoff284
    14.7Referencesandfurtherreading291

    15Supportvectormachinesandmachinelearningondocuments293
    15.1Supportvectormachines:Thelinearlyseparablecase294
    15.2Extensionstothesupportvectormachinemodel300
    15.3Issuesintheclassificationoftextdocuments307
    15.4Machine-learningmethodsinadhocinformationretrieval314
    15.5Referencesandfurtherreading318

    16Flatclustering321
    16.1Clusteringininformationretrieval322
    16.2Problemstatement326
    16.3Evaluationofclustering327
    16.4K-means331
    16.5Model-basedclustering338
    16.6Referencesandfurtherreading343

    17Hierarchicalclustering346
    17.1Hierarchicalagglomerativeclustering347
    17.2Single-linkandcomplete-linkclustering350
    17.3Group-averageagglomerativeclustering356
    17.4Centroidclustering358
    17.5Optimalityofhierarchicalagglomerativeclustering360
    17.6Divisiveclustering362
    17.7Clusterlabeling363
    17.8Implementationnotes365
    17.9Referencesandfurtherreading367

    18Matrixdecompositionsandlatentsemanticindexing369
    18.1Linearalgebrareview369
    18.2Term–documentmatricesandsingularvaluedecompositions373
    18.3Low-rankapproximations376
    18.4Latentsemanticindexing378
    18.5Referencesandfurtherreading383

    19Websearchbasics385
    19.1Backgroundandhistory385
    19.2Webcharacteristics387
    19.3Advertisingastheeconomicmodel392
    19.4Thesearchuserexperience395
    19.5Indexsizeandestimation396
    19.6Near-duplicatesandshingling400
    19.7Referencesandfurtherreading404

    20Webcrawlingandindexes405
    20.1Overview405
    20.2Crawling406
    20.3Distributingindexes415
    20.4Connectivityservers416

    21Linkanalysis421
    21.1TheWebasagraph422
    21.2PageRank424
    21.3Hubsandauthorities433
    21.4Referencesandfurtherreading439

    Inde469
    Bibliography441
查看详情
好书推荐 / 更多
信息检索导论(英文版)
暂坐
贾平凹 著
信息检索导论(英文版)
曾彦修回忆录:平生六记
曾彦修 著
信息检索导论(英文版)
量子与生活:重新认识自我、他人与世界的关系
[英]丹娜·左哈尔 著
信息检索导论(英文版)
工业革命(1760-1830)
[英]T.S.阿什顿 著;李冠杰 译
信息检索导论(英文版)
正午之魔:抑郁是你我共有的秘密
[英]安德鲁·所罗门 著
信息检索导论(英文版)
情感的演化:20世纪情绪心理学简史
[英]露丝·雷斯
信息检索导论(英文版)
托克维尔之钥
[美]詹姆斯·T.施莱费尔· 著;盛仁杰 · 译
信息检索导论(英文版)
图像学:形象、文本、意识形态
W.J.T.米歇尔
信息检索导论(英文版)
少女的沉默:以女性视角重述《伊利亚特》英雄史诗的背后是女人无声的悲怆!
[英]派特巴克 著
信息检索导论(英文版)
好的经济学 2019诺贝尔奖贫穷的本质作者新作
[美]阿比吉特·班纳吉;[法]埃斯特·迪弗洛
信息检索导论(英文版)
中国政治思想史
刘泽华 著
信息检索导论(英文版)
美国怎么了:绝望的死亡与资本主义的未来
安妮·凯斯(Anne Case);安格斯·迪顿(AngusDeaton)