信息检索导论(英文版)

信息检索导论(英文版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] [美] [德]
出版社: 人民邮电出版社
2010-01
版次: 1
ISBN: 9787115218247
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 482页
字数: 605千字
正文语种: 英语
  • 《信息检索导论(英文版)》是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了最新的讲解。
    书中所有重要的思想都是用示例进行解释,图文并茂。《信息检索导论(英文版)》非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。 ChristopherD.Manning,斯坦福大学语言学博士,现任斯坦福大学计算机科学和语言学副教授,主要研究方向是统计自然语言处理、信息提取与表示、文本理解和文本挖掘等。
    PrabhakarRaghavan,加州大学伯克利分校博士,现任Yahoo!实验室主任,斯坦福大学计算机科学系顾问教授,是ACM和IEEE会士。主要研究兴趣是文本及Web数据挖掘、算法设计等。此前,他曾任Verity公司CTO,并在旧M研究院担任过管理工作。
    HinrichSchuze斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾在施乐PaloAlto研究中心供职,担任过Outride公司(后被Google公司收购)副总裁,做过Novation生物科技公司CTO和Enkata公司首席科学家。 1Booleanretrieval1
    1.1Anexampleinformationretrievalproblem3
    1.2Afirsttakeatbuildinganinvertedindex6
    1.3ProcessingBooleanqueries9
    1.4TheextendedBooleanmodelversusrankedretrieval13
    1.5Referencesandfurtherreading16

    2Thetermvocabularyandpostingslists18
    2.1Documentdelineationandcharactersequencedecoding18
    2.2Determiningthevocabularyofterms21
    2.3Fasterpostingslistintersectionviaskippointers33
    2.4Positionalpostingsandphrasequeries36
    2.5Referencesandfurtherreading43

    3Dictionariesandtolerantretrieval45
    3.1Searchstructuresfordictionaries45
    3.2Wildcardqueries48
    3.3Spellingcorrection52
    3.4Phoneticcorrection58
    3.5Referencesandfurtherreading59

    4Indexconstruction61
    4.1Hardwarebasics62
    4.2Blockedsort-basedindexing63
    4.3Single-passin-memoryindexing66
    4.4Distributedindexing68
    4.5Dynamicindexing71
    4.6Othertypesofindexes73
    4.7Referencesandfurtherreading76

    5Indexcompression78
    5.1Statisticalpropertiesoftermsininformationretrieval79
    5.2Dictionarycompression82
    5.3Postingsfilecompression87
    5.4Referencesandfurtherreading97

    6Scoring,termweighting,andthevectorspacemodel100
    6.1Parametricandzoneindexes101
    6.2Termfrequencyandweighting107
    6.3Thevectorspacemodelforscoring110
    6.4Varianttf–idffunctions116
    6.5Referencesandfurtherreading122

    7Computingscoresinacompletesearchsystem124
    7.1Efficientscoringandranking124
    7.2Componentsofaninformationretrievalsystem132
    7.3Vectorspacescoringandqueryoperatorinteraction136
    7.4Referencesandfurtherreading137

    8Evaluationininformationretrieval139
    8.1Informationretrievalsystemevaluation140
    8.2Standardtestcollections141
    8.3Evaluationofunrankedretrievalsets142
    8.4Evaluationofrankedretrievalresults145
    8.5Assessingrelevance151
    8.6Abroaderperspective:Systemqualityanduserutility154
    8.7Resultssnippets157
    8.8Referencesandfurtherreading159

    9Relevancefeedbackandqueryexpansion162
    9.1Relevancefeedbackandpseudorelevancefeedback163
    9.2Globalmethodsforqueryreformulation173
    9.3Referencesandfurtherreading177

    10XMLretrieval178
    10.1BasicXMLconcepts180
    10.2ChallengesinXMLretrieval183
    10.3AvectorspacemodelforXMLretrieval188
    10.4EvaluationofXMLretrieval192
    10.5Text-centricversusdata-centricXMLretrieval196
    10.6Referencesandfurtherreading198

    11Probabilisticinformationretrieval201
    11.1Reviewofbasicprobabilitytheory202
    11.2Theprobabilityrankingprinciple203
    11.3Thebinaryindependencemodel204
    11.4Anappraisalandsomeextensions212
    11.5Referencesandfurtherreading216

    12Languagemodelsforinformationretrieval218
    12.1Languagemodels218
    12.2Thequerylikelihoodmodel223
    12.3Languagemodelingversusotherapproachesininformationretrieval229
    12.4Extendedlanguagemodelingapproaches230
    12.5Referencesandfurtherreading232

    13TextclassificationandNaiveBayes234
    13.1Thetextclassificationproblem237
    13.2NaiveBayestextclassification238
    13.3TheBernoullimodel243
    13.4PropertiesofNaiveBayes245
    13.5Featureselection251
    13.6Evaluationoftextclassification258
    13.7Referencesandfurtherreading264

    14Vectorspaceclassification266
    14.1Documentrepresentationsandmeasuresofrelatednessinvectorspaces267
    14.2Rocchioclassification269
    14.3knearestneighbor273
    14.4Linearversusnonlinearclassifiers277
    14.5Classificationwithmorethantwoclasses281
    14.6Thebias–variancetradeoff284
    14.7Referencesandfurtherreading291

    15Supportvectormachinesandmachinelearningondocuments293
    15.1Supportvectormachines:Thelinearlyseparablecase294
    15.2Extensionstothesupportvectormachinemodel300
    15.3Issuesintheclassificationoftextdocuments307
    15.4Machine-learningmethodsinadhocinformationretrieval314
    15.5Referencesandfurtherreading318

    16Flatclustering321
    16.1Clusteringininformationretrieval322
    16.2Problemstatement326
    16.3Evaluationofclustering327
    16.4K-means331
    16.5Model-basedclustering338
    16.6Referencesandfurtherreading343

    17Hierarchicalclustering346
    17.1Hierarchicalagglomerativeclustering347
    17.2Single-linkandcomplete-linkclustering350
    17.3Group-averageagglomerativeclustering356
    17.4Centroidclustering358
    17.5Optimalityofhierarchicalagglomerativeclustering360
    17.6Divisiveclustering362
    17.7Clusterlabeling363
    17.8Implementationnotes365
    17.9Referencesandfurtherreading367

    18Matrixdecompositionsandlatentsemanticindexing369
    18.1Linearalgebrareview369
    18.2Term–documentmatricesandsingularvaluedecompositions373
    18.3Low-rankapproximations376
    18.4Latentsemanticindexing378
    18.5Referencesandfurtherreading383

    19Websearchbasics385
    19.1Backgroundandhistory385
    19.2Webcharacteristics387
    19.3Advertisingastheeconomicmodel392
    19.4Thesearchuserexperience395
    19.5Indexsizeandestimation396
    19.6Near-duplicatesandshingling400
    19.7Referencesandfurtherreading404

    20Webcrawlingandindexes405
    20.1Overview405
    20.2Crawling406
    20.3Distributingindexes415
    20.4Connectivityservers416

    21Linkanalysis421
    21.1TheWebasagraph422
    21.2PageRank424
    21.3Hubsandauthorities433
    21.4Referencesandfurtherreading439

    Inde469
    Bibliography441
  • 内容简介:
    《信息检索导论(英文版)》是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了最新的讲解。
    书中所有重要的思想都是用示例进行解释,图文并茂。《信息检索导论(英文版)》非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。
  • 作者简介:
    ChristopherD.Manning,斯坦福大学语言学博士,现任斯坦福大学计算机科学和语言学副教授,主要研究方向是统计自然语言处理、信息提取与表示、文本理解和文本挖掘等。
    PrabhakarRaghavan,加州大学伯克利分校博士,现任Yahoo!实验室主任,斯坦福大学计算机科学系顾问教授,是ACM和IEEE会士。主要研究兴趣是文本及Web数据挖掘、算法设计等。此前,他曾任Verity公司CTO,并在旧M研究院担任过管理工作。
    HinrichSchuze斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾在施乐PaloAlto研究中心供职,担任过Outride公司(后被Google公司收购)副总裁,做过Novation生物科技公司CTO和Enkata公司首席科学家。
  • 目录:
    1Booleanretrieval1
    1.1Anexampleinformationretrievalproblem3
    1.2Afirsttakeatbuildinganinvertedindex6
    1.3ProcessingBooleanqueries9
    1.4TheextendedBooleanmodelversusrankedretrieval13
    1.5Referencesandfurtherreading16

    2Thetermvocabularyandpostingslists18
    2.1Documentdelineationandcharactersequencedecoding18
    2.2Determiningthevocabularyofterms21
    2.3Fasterpostingslistintersectionviaskippointers33
    2.4Positionalpostingsandphrasequeries36
    2.5Referencesandfurtherreading43

    3Dictionariesandtolerantretrieval45
    3.1Searchstructuresfordictionaries45
    3.2Wildcardqueries48
    3.3Spellingcorrection52
    3.4Phoneticcorrection58
    3.5Referencesandfurtherreading59

    4Indexconstruction61
    4.1Hardwarebasics62
    4.2Blockedsort-basedindexing63
    4.3Single-passin-memoryindexing66
    4.4Distributedindexing68
    4.5Dynamicindexing71
    4.6Othertypesofindexes73
    4.7Referencesandfurtherreading76

    5Indexcompression78
    5.1Statisticalpropertiesoftermsininformationretrieval79
    5.2Dictionarycompression82
    5.3Postingsfilecompression87
    5.4Referencesandfurtherreading97

    6Scoring,termweighting,andthevectorspacemodel100
    6.1Parametricandzoneindexes101
    6.2Termfrequencyandweighting107
    6.3Thevectorspacemodelforscoring110
    6.4Varianttf–idffunctions116
    6.5Referencesandfurtherreading122

    7Computingscoresinacompletesearchsystem124
    7.1Efficientscoringandranking124
    7.2Componentsofaninformationretrievalsystem132
    7.3Vectorspacescoringandqueryoperatorinteraction136
    7.4Referencesandfurtherreading137

    8Evaluationininformationretrieval139
    8.1Informationretrievalsystemevaluation140
    8.2Standardtestcollections141
    8.3Evaluationofunrankedretrievalsets142
    8.4Evaluationofrankedretrievalresults145
    8.5Assessingrelevance151
    8.6Abroaderperspective:Systemqualityanduserutility154
    8.7Resultssnippets157
    8.8Referencesandfurtherreading159

    9Relevancefeedbackandqueryexpansion162
    9.1Relevancefeedbackandpseudorelevancefeedback163
    9.2Globalmethodsforqueryreformulation173
    9.3Referencesandfurtherreading177

    10XMLretrieval178
    10.1BasicXMLconcepts180
    10.2ChallengesinXMLretrieval183
    10.3AvectorspacemodelforXMLretrieval188
    10.4EvaluationofXMLretrieval192
    10.5Text-centricversusdata-centricXMLretrieval196
    10.6Referencesandfurtherreading198

    11Probabilisticinformationretrieval201
    11.1Reviewofbasicprobabilitytheory202
    11.2Theprobabilityrankingprinciple203
    11.3Thebinaryindependencemodel204
    11.4Anappraisalandsomeextensions212
    11.5Referencesandfurtherreading216

    12Languagemodelsforinformationretrieval218
    12.1Languagemodels218
    12.2Thequerylikelihoodmodel223
    12.3Languagemodelingversusotherapproachesininformationretrieval229
    12.4Extendedlanguagemodelingapproaches230
    12.5Referencesandfurtherreading232

    13TextclassificationandNaiveBayes234
    13.1Thetextclassificationproblem237
    13.2NaiveBayestextclassification238
    13.3TheBernoullimodel243
    13.4PropertiesofNaiveBayes245
    13.5Featureselection251
    13.6Evaluationoftextclassification258
    13.7Referencesandfurtherreading264

    14Vectorspaceclassification266
    14.1Documentrepresentationsandmeasuresofrelatednessinvectorspaces267
    14.2Rocchioclassification269
    14.3knearestneighbor273
    14.4Linearversusnonlinearclassifiers277
    14.5Classificationwithmorethantwoclasses281
    14.6Thebias–variancetradeoff284
    14.7Referencesandfurtherreading291

    15Supportvectormachinesandmachinelearningondocuments293
    15.1Supportvectormachines:Thelinearlyseparablecase294
    15.2Extensionstothesupportvectormachinemodel300
    15.3Issuesintheclassificationoftextdocuments307
    15.4Machine-learningmethodsinadhocinformationretrieval314
    15.5Referencesandfurtherreading318

    16Flatclustering321
    16.1Clusteringininformationretrieval322
    16.2Problemstatement326
    16.3Evaluationofclustering327
    16.4K-means331
    16.5Model-basedclustering338
    16.6Referencesandfurtherreading343

    17Hierarchicalclustering346
    17.1Hierarchicalagglomerativeclustering347
    17.2Single-linkandcomplete-linkclustering350
    17.3Group-averageagglomerativeclustering356
    17.4Centroidclustering358
    17.5Optimalityofhierarchicalagglomerativeclustering360
    17.6Divisiveclustering362
    17.7Clusterlabeling363
    17.8Implementationnotes365
    17.9Referencesandfurtherreading367

    18Matrixdecompositionsandlatentsemanticindexing369
    18.1Linearalgebrareview369
    18.2Term–documentmatricesandsingularvaluedecompositions373
    18.3Low-rankapproximations376
    18.4Latentsemanticindexing378
    18.5Referencesandfurtherreading383

    19Websearchbasics385
    19.1Backgroundandhistory385
    19.2Webcharacteristics387
    19.3Advertisingastheeconomicmodel392
    19.4Thesearchuserexperience395
    19.5Indexsizeandestimation396
    19.6Near-duplicatesandshingling400
    19.7Referencesandfurtherreading404

    20Webcrawlingandindexes405
    20.1Overview405
    20.2Crawling406
    20.3Distributingindexes415
    20.4Connectivityservers416

    21Linkanalysis421
    21.1TheWebasagraph422
    21.2PageRank424
    21.3Hubsandauthorities433
    21.4Referencesandfurtherreading439

    Inde469
    Bibliography441
查看详情
好书推荐 / 更多
信息检索导论(英文版)
大家小书·译馆-独异之物:建筑与哲学
让·努维尔、[法]让·鲍德里亚、周莽 译
信息检索导论(英文版)
新民说·深蓝SOS:我们和海洋在一起
[美]西尔维娅·A.厄尔 著;吕雅鑫、吴文智 译
信息检索导论(英文版)
昨日之我与今日之我:当代史学的反思与阐释/论世衡史丛书
杨念群 著
信息检索导论(英文版)
走进中国城市内部:从社会的最底层看历史
王笛 著
信息检索导论(英文版)
市场机制与社会变迁——18世纪广东米价分析(增订本)
陈春声 著
信息检索导论(英文版)
什么是文化史(第三版)
[英]彼得·伯克(Peter Burke)
信息检索导论(英文版)
狼蛛(诺奖得主鲍勃·迪伦生平唯一实验文本)
[美]鲍勃·迪伦 译者;罗池
信息检索导论(英文版)
设计异国格调:地理、全球化与欧洲近代早期的世界
本杰明·施密特 著;吴莉苇 译
信息检索导论(英文版)
刺猬、狐狸与博士的印痕:弥合科学与人文学科间的裂隙(自然文库)
Stephen、Jay、Gould 著
信息检索导论(英文版)
人的疆域:卡内蒂笔记1942—1985
埃利亚斯·卡内蒂 著;李佳川 季冲 胡烨 译
信息检索导论(英文版)
天下·霸权的黄昏:大国的衰退和收缩
[美]约瑟夫·M.培伦特 著;郭晓梦 译;[美]保罗·K.麦克唐纳;武雅斌
信息检索导论(英文版)
牛津通识读本:幸福(中英双语)
丹尼尔·M.海布伦 著;肖舒 译