信息检索导论(英文版)

信息检索导论(英文版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] [美] [德]
出版社: 人民邮电出版社
2010-01
版次: 1
ISBN: 9787115218247
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 482页
字数: 605千字
正文语种: 英语
  • 《信息检索导论(英文版)》是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了最新的讲解。
    书中所有重要的思想都是用示例进行解释,图文并茂。《信息检索导论(英文版)》非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。 ChristopherD.Manning,斯坦福大学语言学博士,现任斯坦福大学计算机科学和语言学副教授,主要研究方向是统计自然语言处理、信息提取与表示、文本理解和文本挖掘等。
    PrabhakarRaghavan,加州大学伯克利分校博士,现任Yahoo!实验室主任,斯坦福大学计算机科学系顾问教授,是ACM和IEEE会士。主要研究兴趣是文本及Web数据挖掘、算法设计等。此前,他曾任Verity公司CTO,并在旧M研究院担任过管理工作。
    HinrichSchuze斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾在施乐PaloAlto研究中心供职,担任过Outride公司(后被Google公司收购)副总裁,做过Novation生物科技公司CTO和Enkata公司首席科学家。 1Booleanretrieval1
    1.1Anexampleinformationretrievalproblem3
    1.2Afirsttakeatbuildinganinvertedindex6
    1.3ProcessingBooleanqueries9
    1.4TheextendedBooleanmodelversusrankedretrieval13
    1.5Referencesandfurtherreading16

    2Thetermvocabularyandpostingslists18
    2.1Documentdelineationandcharactersequencedecoding18
    2.2Determiningthevocabularyofterms21
    2.3Fasterpostingslistintersectionviaskippointers33
    2.4Positionalpostingsandphrasequeries36
    2.5Referencesandfurtherreading43

    3Dictionariesandtolerantretrieval45
    3.1Searchstructuresfordictionaries45
    3.2Wildcardqueries48
    3.3Spellingcorrection52
    3.4Phoneticcorrection58
    3.5Referencesandfurtherreading59

    4Indexconstruction61
    4.1Hardwarebasics62
    4.2Blockedsort-basedindexing63
    4.3Single-passin-memoryindexing66
    4.4Distributedindexing68
    4.5Dynamicindexing71
    4.6Othertypesofindexes73
    4.7Referencesandfurtherreading76

    5Indexcompression78
    5.1Statisticalpropertiesoftermsininformationretrieval79
    5.2Dictionarycompression82
    5.3Postingsfilecompression87
    5.4Referencesandfurtherreading97

    6Scoring,termweighting,andthevectorspacemodel100
    6.1Parametricandzoneindexes101
    6.2Termfrequencyandweighting107
    6.3Thevectorspacemodelforscoring110
    6.4Varianttf–idffunctions116
    6.5Referencesandfurtherreading122

    7Computingscoresinacompletesearchsystem124
    7.1Efficientscoringandranking124
    7.2Componentsofaninformationretrievalsystem132
    7.3Vectorspacescoringandqueryoperatorinteraction136
    7.4Referencesandfurtherreading137

    8Evaluationininformationretrieval139
    8.1Informationretrievalsystemevaluation140
    8.2Standardtestcollections141
    8.3Evaluationofunrankedretrievalsets142
    8.4Evaluationofrankedretrievalresults145
    8.5Assessingrelevance151
    8.6Abroaderperspective:Systemqualityanduserutility154
    8.7Resultssnippets157
    8.8Referencesandfurtherreading159

    9Relevancefeedbackandqueryexpansion162
    9.1Relevancefeedbackandpseudorelevancefeedback163
    9.2Globalmethodsforqueryreformulation173
    9.3Referencesandfurtherreading177

    10XMLretrieval178
    10.1BasicXMLconcepts180
    10.2ChallengesinXMLretrieval183
    10.3AvectorspacemodelforXMLretrieval188
    10.4EvaluationofXMLretrieval192
    10.5Text-centricversusdata-centricXMLretrieval196
    10.6Referencesandfurtherreading198

    11Probabilisticinformationretrieval201
    11.1Reviewofbasicprobabilitytheory202
    11.2Theprobabilityrankingprinciple203
    11.3Thebinaryindependencemodel204
    11.4Anappraisalandsomeextensions212
    11.5Referencesandfurtherreading216

    12Languagemodelsforinformationretrieval218
    12.1Languagemodels218
    12.2Thequerylikelihoodmodel223
    12.3Languagemodelingversusotherapproachesininformationretrieval229
    12.4Extendedlanguagemodelingapproaches230
    12.5Referencesandfurtherreading232

    13TextclassificationandNaiveBayes234
    13.1Thetextclassificationproblem237
    13.2NaiveBayestextclassification238
    13.3TheBernoullimodel243
    13.4PropertiesofNaiveBayes245
    13.5Featureselection251
    13.6Evaluationoftextclassification258
    13.7Referencesandfurtherreading264

    14Vectorspaceclassification266
    14.1Documentrepresentationsandmeasuresofrelatednessinvectorspaces267
    14.2Rocchioclassification269
    14.3knearestneighbor273
    14.4Linearversusnonlinearclassifiers277
    14.5Classificationwithmorethantwoclasses281
    14.6Thebias–variancetradeoff284
    14.7Referencesandfurtherreading291

    15Supportvectormachinesandmachinelearningondocuments293
    15.1Supportvectormachines:Thelinearlyseparablecase294
    15.2Extensionstothesupportvectormachinemodel300
    15.3Issuesintheclassificationoftextdocuments307
    15.4Machine-learningmethodsinadhocinformationretrieval314
    15.5Referencesandfurtherreading318

    16Flatclustering321
    16.1Clusteringininformationretrieval322
    16.2Problemstatement326
    16.3Evaluationofclustering327
    16.4K-means331
    16.5Model-basedclustering338
    16.6Referencesandfurtherreading343

    17Hierarchicalclustering346
    17.1Hierarchicalagglomerativeclustering347
    17.2Single-linkandcomplete-linkclustering350
    17.3Group-averageagglomerativeclustering356
    17.4Centroidclustering358
    17.5Optimalityofhierarchicalagglomerativeclustering360
    17.6Divisiveclustering362
    17.7Clusterlabeling363
    17.8Implementationnotes365
    17.9Referencesandfurtherreading367

    18Matrixdecompositionsandlatentsemanticindexing369
    18.1Linearalgebrareview369
    18.2Term–documentmatricesandsingularvaluedecompositions373
    18.3Low-rankapproximations376
    18.4Latentsemanticindexing378
    18.5Referencesandfurtherreading383

    19Websearchbasics385
    19.1Backgroundandhistory385
    19.2Webcharacteristics387
    19.3Advertisingastheeconomicmodel392
    19.4Thesearchuserexperience395
    19.5Indexsizeandestimation396
    19.6Near-duplicatesandshingling400
    19.7Referencesandfurtherreading404

    20Webcrawlingandindexes405
    20.1Overview405
    20.2Crawling406
    20.3Distributingindexes415
    20.4Connectivityservers416

    21Linkanalysis421
    21.1TheWebasagraph422
    21.2PageRank424
    21.3Hubsandauthorities433
    21.4Referencesandfurtherreading439

    Inde469
    Bibliography441
  • 内容简介:
    《信息检索导论(英文版)》是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了最新的讲解。
    书中所有重要的思想都是用示例进行解释,图文并茂。《信息检索导论(英文版)》非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。
  • 作者简介:
    ChristopherD.Manning,斯坦福大学语言学博士,现任斯坦福大学计算机科学和语言学副教授,主要研究方向是统计自然语言处理、信息提取与表示、文本理解和文本挖掘等。
    PrabhakarRaghavan,加州大学伯克利分校博士,现任Yahoo!实验室主任,斯坦福大学计算机科学系顾问教授,是ACM和IEEE会士。主要研究兴趣是文本及Web数据挖掘、算法设计等。此前,他曾任Verity公司CTO,并在旧M研究院担任过管理工作。
    HinrichSchuze斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾在施乐PaloAlto研究中心供职,担任过Outride公司(后被Google公司收购)副总裁,做过Novation生物科技公司CTO和Enkata公司首席科学家。
  • 目录:
    1Booleanretrieval1
    1.1Anexampleinformationretrievalproblem3
    1.2Afirsttakeatbuildinganinvertedindex6
    1.3ProcessingBooleanqueries9
    1.4TheextendedBooleanmodelversusrankedretrieval13
    1.5Referencesandfurtherreading16

    2Thetermvocabularyandpostingslists18
    2.1Documentdelineationandcharactersequencedecoding18
    2.2Determiningthevocabularyofterms21
    2.3Fasterpostingslistintersectionviaskippointers33
    2.4Positionalpostingsandphrasequeries36
    2.5Referencesandfurtherreading43

    3Dictionariesandtolerantretrieval45
    3.1Searchstructuresfordictionaries45
    3.2Wildcardqueries48
    3.3Spellingcorrection52
    3.4Phoneticcorrection58
    3.5Referencesandfurtherreading59

    4Indexconstruction61
    4.1Hardwarebasics62
    4.2Blockedsort-basedindexing63
    4.3Single-passin-memoryindexing66
    4.4Distributedindexing68
    4.5Dynamicindexing71
    4.6Othertypesofindexes73
    4.7Referencesandfurtherreading76

    5Indexcompression78
    5.1Statisticalpropertiesoftermsininformationretrieval79
    5.2Dictionarycompression82
    5.3Postingsfilecompression87
    5.4Referencesandfurtherreading97

    6Scoring,termweighting,andthevectorspacemodel100
    6.1Parametricandzoneindexes101
    6.2Termfrequencyandweighting107
    6.3Thevectorspacemodelforscoring110
    6.4Varianttf–idffunctions116
    6.5Referencesandfurtherreading122

    7Computingscoresinacompletesearchsystem124
    7.1Efficientscoringandranking124
    7.2Componentsofaninformationretrievalsystem132
    7.3Vectorspacescoringandqueryoperatorinteraction136
    7.4Referencesandfurtherreading137

    8Evaluationininformationretrieval139
    8.1Informationretrievalsystemevaluation140
    8.2Standardtestcollections141
    8.3Evaluationofunrankedretrievalsets142
    8.4Evaluationofrankedretrievalresults145
    8.5Assessingrelevance151
    8.6Abroaderperspective:Systemqualityanduserutility154
    8.7Resultssnippets157
    8.8Referencesandfurtherreading159

    9Relevancefeedbackandqueryexpansion162
    9.1Relevancefeedbackandpseudorelevancefeedback163
    9.2Globalmethodsforqueryreformulation173
    9.3Referencesandfurtherreading177

    10XMLretrieval178
    10.1BasicXMLconcepts180
    10.2ChallengesinXMLretrieval183
    10.3AvectorspacemodelforXMLretrieval188
    10.4EvaluationofXMLretrieval192
    10.5Text-centricversusdata-centricXMLretrieval196
    10.6Referencesandfurtherreading198

    11Probabilisticinformationretrieval201
    11.1Reviewofbasicprobabilitytheory202
    11.2Theprobabilityrankingprinciple203
    11.3Thebinaryindependencemodel204
    11.4Anappraisalandsomeextensions212
    11.5Referencesandfurtherreading216

    12Languagemodelsforinformationretrieval218
    12.1Languagemodels218
    12.2Thequerylikelihoodmodel223
    12.3Languagemodelingversusotherapproachesininformationretrieval229
    12.4Extendedlanguagemodelingapproaches230
    12.5Referencesandfurtherreading232

    13TextclassificationandNaiveBayes234
    13.1Thetextclassificationproblem237
    13.2NaiveBayestextclassification238
    13.3TheBernoullimodel243
    13.4PropertiesofNaiveBayes245
    13.5Featureselection251
    13.6Evaluationoftextclassification258
    13.7Referencesandfurtherreading264

    14Vectorspaceclassification266
    14.1Documentrepresentationsandmeasuresofrelatednessinvectorspaces267
    14.2Rocchioclassification269
    14.3knearestneighbor273
    14.4Linearversusnonlinearclassifiers277
    14.5Classificationwithmorethantwoclasses281
    14.6Thebias–variancetradeoff284
    14.7Referencesandfurtherreading291

    15Supportvectormachinesandmachinelearningondocuments293
    15.1Supportvectormachines:Thelinearlyseparablecase294
    15.2Extensionstothesupportvectormachinemodel300
    15.3Issuesintheclassificationoftextdocuments307
    15.4Machine-learningmethodsinadhocinformationretrieval314
    15.5Referencesandfurtherreading318

    16Flatclustering321
    16.1Clusteringininformationretrieval322
    16.2Problemstatement326
    16.3Evaluationofclustering327
    16.4K-means331
    16.5Model-basedclustering338
    16.6Referencesandfurtherreading343

    17Hierarchicalclustering346
    17.1Hierarchicalagglomerativeclustering347
    17.2Single-linkandcomplete-linkclustering350
    17.3Group-averageagglomerativeclustering356
    17.4Centroidclustering358
    17.5Optimalityofhierarchicalagglomerativeclustering360
    17.6Divisiveclustering362
    17.7Clusterlabeling363
    17.8Implementationnotes365
    17.9Referencesandfurtherreading367

    18Matrixdecompositionsandlatentsemanticindexing369
    18.1Linearalgebrareview369
    18.2Term–documentmatricesandsingularvaluedecompositions373
    18.3Low-rankapproximations376
    18.4Latentsemanticindexing378
    18.5Referencesandfurtherreading383

    19Websearchbasics385
    19.1Backgroundandhistory385
    19.2Webcharacteristics387
    19.3Advertisingastheeconomicmodel392
    19.4Thesearchuserexperience395
    19.5Indexsizeandestimation396
    19.6Near-duplicatesandshingling400
    19.7Referencesandfurtherreading404

    20Webcrawlingandindexes405
    20.1Overview405
    20.2Crawling406
    20.3Distributingindexes415
    20.4Connectivityservers416

    21Linkanalysis421
    21.1TheWebasagraph422
    21.2PageRank424
    21.3Hubsandauthorities433
    21.4Referencesandfurtherreading439

    Inde469
    Bibliography441
查看详情
好书推荐 / 更多
信息检索导论(英文版)
北平学人访问记(上)(碎金文丛5)
贺逸文
信息检索导论(英文版)
文青之死
赖香吟 ;后浪
信息检索导论(英文版)
立马上菜
M.F.K.费雪
信息检索导论(英文版)
自愈之路:开创癌症免疫疗法的科学家们
[美]尼尔·卡纳万(Neil Canavan)
信息检索导论(英文版)
哲思与海:一部诗意的哲学随笔
[美]戴维·法雷尔·克雷尔 著;陈瑾 译
信息检索导论(英文版)
锥形帐篷的起源
乔尼·休斯
信息检索导论(英文版)
事邦国之神祇:唐至北宋吉礼变迁研究
朱溢 著
信息检索导论(英文版)
《剑桥非洲史·20世纪卷(1905—1940)》 《剑桥非洲史·20世纪卷(1940—1975)》(丛书2册)
安德鲁·罗伯茨;迈克尔·克劳德
信息检索导论(英文版)
面具与乌托邦:墨西哥人民及其文化剪影
[墨]萨穆埃尔·拉莫斯
信息检索导论(英文版)
苏联的外宾商店:为了工业化所需的黄金
[俄罗斯]叶列娜·亚历山德罗夫娜·奥金娜
信息检索导论(英文版)
警治的终结
[英]亚历克斯·S.维塔莱 著;王飞、张鹏瀚 译
信息检索导论(英文版)
用电影燃尽欲望
[【日】]园子温;余梦娇