信息检索导论(英文版)

信息检索导论(英文版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , [美] , [德]
2010-01
版次: 1
ISBN: 9787115218247
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 482页
字数: 605千字
正文语种: 英语
24人买过
  • 《信息检索导论(英文版)》是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了最新的讲解。
    书中所有重要的思想都是用示例进行解释,图文并茂。《信息检索导论(英文版)》非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。 ChristopherD.Manning,斯坦福大学语言学博士,现任斯坦福大学计算机科学和语言学副教授,主要研究方向是统计自然语言处理、信息提取与表示、文本理解和文本挖掘等。
    PrabhakarRaghavan,加州大学伯克利分校博士,现任Yahoo!实验室主任,斯坦福大学计算机科学系顾问教授,是ACM和IEEE会士。主要研究兴趣是文本及Web数据挖掘、算法设计等。此前,他曾任Verity公司CTO,并在旧M研究院担任过管理工作。
    HinrichSchuze斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾在施乐PaloAlto研究中心供职,担任过Outride公司(后被Google公司收购)副总裁,做过Novation生物科技公司CTO和Enkata公司首席科学家。 1Booleanretrieval1
    1.1Anexampleinformationretrievalproblem3
    1.2Afirsttakeatbuildinganinvertedindex6
    1.3ProcessingBooleanqueries9
    1.4TheextendedBooleanmodelversusrankedretrieval13
    1.5Referencesandfurtherreading16

    2Thetermvocabularyandpostingslists18
    2.1Documentdelineationandcharactersequencedecoding18
    2.2Determiningthevocabularyofterms21
    2.3Fasterpostingslistintersectionviaskippointers33
    2.4Positionalpostingsandphrasequeries36
    2.5Referencesandfurtherreading43

    3Dictionariesandtolerantretrieval45
    3.1Searchstructuresfordictionaries45
    3.2Wildcardqueries48
    3.3Spellingcorrection52
    3.4Phoneticcorrection58
    3.5Referencesandfurtherreading59

    4Indexconstruction61
    4.1Hardwarebasics62
    4.2Blockedsort-basedindexing63
    4.3Single-passin-memoryindexing66
    4.4Distributedindexing68
    4.5Dynamicindexing71
    4.6Othertypesofindexes73
    4.7Referencesandfurtherreading76

    5Indexcompression78
    5.1Statisticalpropertiesoftermsininformationretrieval79
    5.2Dictionarycompression82
    5.3Postingsfilecompression87
    5.4Referencesandfurtherreading97

    6Scoring,termweighting,andthevectorspacemodel100
    6.1Parametricandzoneindexes101
    6.2Termfrequencyandweighting107
    6.3Thevectorspacemodelforscoring110
    6.4Varianttf–idffunctions116
    6.5Referencesandfurtherreading122

    7Computingscoresinacompletesearchsystem124
    7.1Efficientscoringandranking124
    7.2Componentsofaninformationretrievalsystem132
    7.3Vectorspacescoringandqueryoperatorinteraction136
    7.4Referencesandfurtherreading137

    8Evaluationininformationretrieval139
    8.1Informationretrievalsystemevaluation140
    8.2Standardtestcollections141
    8.3Evaluationofunrankedretrievalsets142
    8.4Evaluationofrankedretrievalresults145
    8.5Assessingrelevance151
    8.6Abroaderperspective:Systemqualityanduserutility154
    8.7Resultssnippets157
    8.8Referencesandfurtherreading159

    9Relevancefeedbackandqueryexpansion162
    9.1Relevancefeedbackandpseudorelevancefeedback163
    9.2Globalmethodsforqueryreformulation173
    9.3Referencesandfurtherreading177

    10XMLretrieval178
    10.1BasicXMLconcepts180
    10.2ChallengesinXMLretrieval183
    10.3AvectorspacemodelforXMLretrieval188
    10.4EvaluationofXMLretrieval192
    10.5Text-centricversusdata-centricXMLretrieval196
    10.6Referencesandfurtherreading198

    11Probabilisticinformationretrieval201
    11.1Reviewofbasicprobabilitytheory202
    11.2Theprobabilityrankingprinciple203
    11.3Thebinaryindependencemodel204
    11.4Anappraisalandsomeextensions212
    11.5Referencesandfurtherreading216

    12Languagemodelsforinformationretrieval218
    12.1Languagemodels218
    12.2Thequerylikelihoodmodel223
    12.3Languagemodelingversusotherapproachesininformationretrieval229
    12.4Extendedlanguagemodelingapproaches230
    12.5Referencesandfurtherreading232

    13TextclassificationandNaiveBayes234
    13.1Thetextclassificationproblem237
    13.2NaiveBayestextclassification238
    13.3TheBernoullimodel243
    13.4PropertiesofNaiveBayes245
    13.5Featureselection251
    13.6Evaluationoftextclassification258
    13.7Referencesandfurtherreading264

    14Vectorspaceclassification266
    14.1Documentrepresentationsandmeasuresofrelatednessinvectorspaces267
    14.2Rocchioclassification269
    14.3knearestneighbor273
    14.4Linearversusnonlinearclassifiers277
    14.5Classificationwithmorethantwoclasses281
    14.6Thebias–variancetradeoff284
    14.7Referencesandfurtherreading291

    15Supportvectormachinesandmachinelearningondocuments293
    15.1Supportvectormachines:Thelinearlyseparablecase294
    15.2Extensionstothesupportvectormachinemodel300
    15.3Issuesintheclassificationoftextdocuments307
    15.4Machine-learningmethodsinadhocinformationretrieval314
    15.5Referencesandfurtherreading318

    16Flatclustering321
    16.1Clusteringininformationretrieval322
    16.2Problemstatement326
    16.3Evaluationofclustering327
    16.4K-means331
    16.5Model-basedclustering338
    16.6Referencesandfurtherreading343

    17Hierarchicalclustering346
    17.1Hierarchicalagglomerativeclustering347
    17.2Single-linkandcomplete-linkclustering350
    17.3Group-averageagglomerativeclustering356
    17.4Centroidclustering358
    17.5Optimalityofhierarchicalagglomerativeclustering360
    17.6Divisiveclustering362
    17.7Clusterlabeling363
    17.8Implementationnotes365
    17.9Referencesandfurtherreading367

    18Matrixdecompositionsandlatentsemanticindexing369
    18.1Linearalgebrareview369
    18.2Term–documentmatricesandsingularvaluedecompositions373
    18.3Low-rankapproximations376
    18.4Latentsemanticindexing378
    18.5Referencesandfurtherreading383

    19Websearchbasics385
    19.1Backgroundandhistory385
    19.2Webcharacteristics387
    19.3Advertisingastheeconomicmodel392
    19.4Thesearchuserexperience395
    19.5Indexsizeandestimation396
    19.6Near-duplicatesandshingling400
    19.7Referencesandfurtherreading404

    20Webcrawlingandindexes405
    20.1Overview405
    20.2Crawling406
    20.3Distributingindexes415
    20.4Connectivityservers416

    21Linkanalysis421
    21.1TheWebasagraph422
    21.2PageRank424
    21.3Hubsandauthorities433
    21.4Referencesandfurtherreading439

    Inde469
    Bibliography441
  • 内容简介:
    《信息检索导论(英文版)》是信息检索的教材,旨在从计算机科学的视角提供一种现代的信息检索方法。书中从基本概念讲解网络搜索以及文本分类和文本聚类等,对收集、索引和搜索文档系统的设计和实现的方方面面、评估系统的方法、机器学习方法在文本收集中的应用等给出了最新的讲解。
    书中所有重要的思想都是用示例进行解释,图文并茂。《信息检索导论(英文版)》非常适合作为计算机科学及相关专业的高年级本科生和研究生的“信息检索”课程的入门教材,当然也同样适合研究人员和专业人士阅读。
  • 作者简介:
    ChristopherD.Manning,斯坦福大学语言学博士,现任斯坦福大学计算机科学和语言学副教授,主要研究方向是统计自然语言处理、信息提取与表示、文本理解和文本挖掘等。
    PrabhakarRaghavan,加州大学伯克利分校博士,现任Yahoo!实验室主任,斯坦福大学计算机科学系顾问教授,是ACM和IEEE会士。主要研究兴趣是文本及Web数据挖掘、算法设计等。此前,他曾任Verity公司CTO,并在旧M研究院担任过管理工作。
    HinrichSchuze斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾在施乐PaloAlto研究中心供职,担任过Outride公司(后被Google公司收购)副总裁,做过Novation生物科技公司CTO和Enkata公司首席科学家。
  • 目录:
    1Booleanretrieval1
    1.1Anexampleinformationretrievalproblem3
    1.2Afirsttakeatbuildinganinvertedindex6
    1.3ProcessingBooleanqueries9
    1.4TheextendedBooleanmodelversusrankedretrieval13
    1.5Referencesandfurtherreading16

    2Thetermvocabularyandpostingslists18
    2.1Documentdelineationandcharactersequencedecoding18
    2.2Determiningthevocabularyofterms21
    2.3Fasterpostingslistintersectionviaskippointers33
    2.4Positionalpostingsandphrasequeries36
    2.5Referencesandfurtherreading43

    3Dictionariesandtolerantretrieval45
    3.1Searchstructuresfordictionaries45
    3.2Wildcardqueries48
    3.3Spellingcorrection52
    3.4Phoneticcorrection58
    3.5Referencesandfurtherreading59

    4Indexconstruction61
    4.1Hardwarebasics62
    4.2Blockedsort-basedindexing63
    4.3Single-passin-memoryindexing66
    4.4Distributedindexing68
    4.5Dynamicindexing71
    4.6Othertypesofindexes73
    4.7Referencesandfurtherreading76

    5Indexcompression78
    5.1Statisticalpropertiesoftermsininformationretrieval79
    5.2Dictionarycompression82
    5.3Postingsfilecompression87
    5.4Referencesandfurtherreading97

    6Scoring,termweighting,andthevectorspacemodel100
    6.1Parametricandzoneindexes101
    6.2Termfrequencyandweighting107
    6.3Thevectorspacemodelforscoring110
    6.4Varianttf–idffunctions116
    6.5Referencesandfurtherreading122

    7Computingscoresinacompletesearchsystem124
    7.1Efficientscoringandranking124
    7.2Componentsofaninformationretrievalsystem132
    7.3Vectorspacescoringandqueryoperatorinteraction136
    7.4Referencesandfurtherreading137

    8Evaluationininformationretrieval139
    8.1Informationretrievalsystemevaluation140
    8.2Standardtestcollections141
    8.3Evaluationofunrankedretrievalsets142
    8.4Evaluationofrankedretrievalresults145
    8.5Assessingrelevance151
    8.6Abroaderperspective:Systemqualityanduserutility154
    8.7Resultssnippets157
    8.8Referencesandfurtherreading159

    9Relevancefeedbackandqueryexpansion162
    9.1Relevancefeedbackandpseudorelevancefeedback163
    9.2Globalmethodsforqueryreformulation173
    9.3Referencesandfurtherreading177

    10XMLretrieval178
    10.1BasicXMLconcepts180
    10.2ChallengesinXMLretrieval183
    10.3AvectorspacemodelforXMLretrieval188
    10.4EvaluationofXMLretrieval192
    10.5Text-centricversusdata-centricXMLretrieval196
    10.6Referencesandfurtherreading198

    11Probabilisticinformationretrieval201
    11.1Reviewofbasicprobabilitytheory202
    11.2Theprobabilityrankingprinciple203
    11.3Thebinaryindependencemodel204
    11.4Anappraisalandsomeextensions212
    11.5Referencesandfurtherreading216

    12Languagemodelsforinformationretrieval218
    12.1Languagemodels218
    12.2Thequerylikelihoodmodel223
    12.3Languagemodelingversusotherapproachesininformationretrieval229
    12.4Extendedlanguagemodelingapproaches230
    12.5Referencesandfurtherreading232

    13TextclassificationandNaiveBayes234
    13.1Thetextclassificationproblem237
    13.2NaiveBayestextclassification238
    13.3TheBernoullimodel243
    13.4PropertiesofNaiveBayes245
    13.5Featureselection251
    13.6Evaluationoftextclassification258
    13.7Referencesandfurtherreading264

    14Vectorspaceclassification266
    14.1Documentrepresentationsandmeasuresofrelatednessinvectorspaces267
    14.2Rocchioclassification269
    14.3knearestneighbor273
    14.4Linearversusnonlinearclassifiers277
    14.5Classificationwithmorethantwoclasses281
    14.6Thebias–variancetradeoff284
    14.7Referencesandfurtherreading291

    15Supportvectormachinesandmachinelearningondocuments293
    15.1Supportvectormachines:Thelinearlyseparablecase294
    15.2Extensionstothesupportvectormachinemodel300
    15.3Issuesintheclassificationoftextdocuments307
    15.4Machine-learningmethodsinadhocinformationretrieval314
    15.5Referencesandfurtherreading318

    16Flatclustering321
    16.1Clusteringininformationretrieval322
    16.2Problemstatement326
    16.3Evaluationofclustering327
    16.4K-means331
    16.5Model-basedclustering338
    16.6Referencesandfurtherreading343

    17Hierarchicalclustering346
    17.1Hierarchicalagglomerativeclustering347
    17.2Single-linkandcomplete-linkclustering350
    17.3Group-averageagglomerativeclustering356
    17.4Centroidclustering358
    17.5Optimalityofhierarchicalagglomerativeclustering360
    17.6Divisiveclustering362
    17.7Clusterlabeling363
    17.8Implementationnotes365
    17.9Referencesandfurtherreading367

    18Matrixdecompositionsandlatentsemanticindexing369
    18.1Linearalgebrareview369
    18.2Term–documentmatricesandsingularvaluedecompositions373
    18.3Low-rankapproximations376
    18.4Latentsemanticindexing378
    18.5Referencesandfurtherreading383

    19Websearchbasics385
    19.1Backgroundandhistory385
    19.2Webcharacteristics387
    19.3Advertisingastheeconomicmodel392
    19.4Thesearchuserexperience395
    19.5Indexsizeandestimation396
    19.6Near-duplicatesandshingling400
    19.7Referencesandfurtherreading404

    20Webcrawlingandindexes405
    20.1Overview405
    20.2Crawling406
    20.3Distributingindexes415
    20.4Connectivityservers416

    21Linkanalysis421
    21.1TheWebasagraph422
    21.2PageRank424
    21.3Hubsandauthorities433
    21.4Referencesandfurtherreading439

    Inde469
    Bibliography441
查看详情
系列丛书 / 更多
信息检索导论(英文版)
算法(英文版•第4版)
[美]塞奇威克(Robert Sedgewick)、[美]韦恩(Kevin Wayne) 著
信息检索导论(英文版)
计算机程序设计艺术(第2卷 英文版·第3版):半数值算法
[美]高德纳 著
信息检索导论(英文版)
计算机程序设计艺术,卷4A:组合算法(一)(英文版)
[美]Donald E.Knuth 著
信息检索导论(英文版)
计算机程序设计艺术(第3卷 英文版·第2版):排序与查找
[美]高德纳(Knuth D.E) 著
信息检索导论(英文版)
C++Primer(英文版)(第4版)
李普曼 著
信息检索导论(英文版)
数据结构与算法分析:C++描述(英文版)(第3版)
[美]维斯 著
信息检索导论(英文版)
UNIX环境高级编程
史蒂文斯、拉戈 著
信息检索导论(英文版)
信息检索:算法与启发式方法(英文版·第2版)
[美]格罗斯曼、[美]弗里德 著
信息检索导论(英文版)
Web数据挖掘:超文本数据的知识发现
[印]查凯莱巴蒂 著
信息检索导论(英文版)
TCP/IP 详解(卷2):实现(英文版)
[美]赖特(Gary R.Wright)、[美]史蒂文斯(W.Richard Stevens) 著
信息检索导论(英文版)
IPv6详解,第1卷,核心协议实现:IPv6时代的《TCP/IP详解》!
[美]李清、[日]神明达哉、[日]岛庆一 著
信息检索导论(英文版)
UNIX网络编程 卷1
[美]史蒂文斯、[美]芬纳、[美]鲁道夫 著
相关图书 / 更多
信息检索导论(英文版)
信息技术导论
刘念
信息检索导论(英文版)
信息技术与课程整合
魏雪峰 王济军
信息检索导论(英文版)
信息技术基础(Windows 10+WPS Office)(微课版)
苏丹、唐永华
信息检索导论(英文版)
信息技术(拓展篇)
王瑜琳 牟刚 刘学虎
信息检索导论(英文版)
信息技术基础
汤发俊 王清
信息检索导论(英文版)
信息系统项目管理师章节习题与考点特训(第二版)
薛大龙
信息检索导论(英文版)
信息技术与幼儿外语教育整合模式及其应用研究
马之成
信息检索导论(英文版)
信息产品设计基础
孙凌云 尤伟涛 编著
信息检索导论(英文版)
信息系统开发综合实训——指导、实践及案例
王梅源
信息检索导论(英文版)
信息技术及应用英语教程
李玉华
信息检索导论(英文版)
信息技术基础模块(下册)
刘洪海、彭艳平、罗静 编
信息检索导论(英文版)
信息技术背景下的英语翻译与教学实践
曾宇钧
您可能感兴趣 / 更多
信息检索导论(英文版)
宇宙视觉史:从宇宙大爆炸到时间的尽头
[美]查尔斯·刘 著;高爽 译者;[美]马克西姆· 马洛维奇科 绘;未读 出品
信息检索导论(英文版)
写出我心 普通人如何通过写作表达自己(平装本)
[美]娜塔莉·戈德堡(Natalie Goldberg)
信息检索导论(英文版)
写出我心3 写作疗愈的真正秘密
[美]娜塔莉·戈德堡(Natalie Goldberg)
信息检索导论(英文版)
神套路:为什么我们总被带节奏(狂热与网红时代醍醐灌顶之作,教给普通人安身立命的不二法门!)
[美]阿里·阿莫萨维 著;[哥伦比亚]亚历杭德罗·希拉尔多 绘
信息检索导论(英文版)
阿伦森自传
[美]埃利奥特·阿伦森(Elliot Aronson) 著;沈捷 译;湛庐文化 出品
信息检索导论(英文版)
街头官僚:公共服务中的个人困境
[美]迈克尔·李普斯基(Michael Lipsky)
信息检索导论(英文版)
史前至蒙古帝国时期的内欧亚大陆史
[美]大卫·克里斯蒂安 著;潘玲 译;杨建华 校
信息检索导论(英文版)
意大利文艺复兴新艺术史
[美]迈克尔·韦恩·科尔 著;[美]斯蒂芬·J·坎贝尔;邵亦杨
信息检索导论(英文版)
老人与海 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]海明威
信息检索导论(英文版)
养育的觉醒:全面激发孩子自驱力,教你如何心平气和做妈妈
[美]凯文·莱曼 著;唐晓璐 译;斯坦威 出品
信息检索导论(英文版)
自律我也能做到(全9册)
[美]康妮·科维尔·米勒 著;[阿根廷]维多利亚·阿萨纳利 绘
信息检索导论(英文版)
你在等什么?
[美]斯科特·明钦 著;[中]易万 译;[美]马特 ·斐兰 绘