搜索引擎:信息检索实践

搜索引擎:信息检索实践
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美]
2009-10
版次: 1
ISBN: 9787111282471
定价: 45.00
装帧: 平装
开本: 大32开
纸张: 胶版纸
页数: 520页
正文语种: 英语
原版书名: 英文版
82人买过
  •   《搜索引擎:信息检索实践(英文版)》介绍了信息检索(1R)中的关键问题。以及这些问题如何影响搜索引擎的设计与实现,并且用数学模型强化了重要的概念。对于网络搜索引擎这一重要的话题,书中主要涵盖了在网络上广泛使用的搜索技术。
      《搜索引擎:信息检索实践(英文版)》适用于高等院校计算机科学或计算机工程专业的本科生、研究生,对于专业人士而言,《搜索引擎:信息检索实践(英文版)》也不失为一本理想的入门教材。   W.BruceCroft,马萨诸塞大学阿默斯特分校计算机科学特聘教授、ACM会士。他创建了智能信息检索研究中心,发表了200余篇论文,多次获奖,其中包括2003年由ACMSIGIR颁发的GerardSalton奖。
      DonaldMetzler马萨诸塞大学阿默斯特分校博士,是位于加州SantaClara的雅虎研究中心搜索与计算广告组的研究科学家。
      TrevorStrohman马萨诸塞大学阿默斯特分校博士,是Google公司搜索质量部门的软件工程师。他开发了Galago搜索引擎,也是Indri搜索引擎的主要开发者。 1SearchEnginesandInformationRetrieval
    1.1WhatIsInformationRetrieval?
    1.2TheBigIssues
    1.3SearchEngines
    1.4SearchEngineers

    2ArchitectureofaSearchEngine
    2.1WhatIsanArchitecture
    2.2BasicBuildingBlocks
    2.3BreakingItDown
    2.3.1TextAcquisition
    2.3.2TextTransformation
    2.3.3IndexCreation
    2.3.4UserInteraction
    2.3.5Ranking
    2.3.6Evaluation
    2.4HowDoesItReallyWork?

    3CrawlsandFeeds
    3.1DecidingWhattoSearch
    3.2CrawlingtheWeb
    3.2.1RetrievingWebPages
    3.2.2TheWebCrawler
    3.2.3Freshness
    3.2.4FocusedCrawling
    3.2.5DeepWeb
    3.2.6Sitemaps
    3.2.7DistributedCrawling
    3.3CrawlingDocumentsandEmail
    3.4DocumentFeeds
    3.5TheConversionProblem
    3.5.1CharacterEncodings
    3.6StoringtheDocuments
    3.6,1UsingaDatabaseSystem
    3.6.2RandomAccess
    3.6.3CompressionandLargeFiles
    3.6.4Update
    3.6.5BigTable
    3.7DetectingDuplicates
    3.8RemovingNoise

    4ProcessingText
    4.1FromWordstoTerms
    4.2TextStatistics
    4.2.1VocabularyGrowth
    4.2.2EstimatingCollectionandResultSetSizes
    4.3DocumentParsing
    4.3.1Overview
    4.3.2Tokenizing
    4.3.3Stopping
    4.3.4Stemming
    4.3.5PhrasesandN-grams
    4.4DocumentStructureandMarkup
    4.5LinkAnalysis
    4.5.1AnchorText
    4.5.2PageRank
    4.5.3LinkQuality
    4.6InformationExtraction
    4.6.1HiddenMarkovModelsforExtraction
    4.7Internationalization

    5RankingwithIndexes
    5.1Overview
    5.2AbstractModelofRanking
    5.3InvertedIndexes
    5.3.1Documents
    5.3.2Counts
    5.3.3Positions
    5.3AFieldsandExtents
    5.3.5Scores
    5.3.6Ordering
    5.4Compression
    5.4.1EntropyandAmbiguity
    5.4.2DeltaEncoding
    5.4.3Bit-AlignedCodes
    5.4.4Byte-AlignedCodes
    5.4.5CompressioninPractice
    5.4.6LookingAhead
    5.4.7SkippingandSkipPointers
    5.5AuxiliaryStructures
    5.6IndexConstruction
    5.6.1SimpleConstruction
    5.6.2Merging
    5.6.3ParallelismandDistribution
    5.6.4Update
    5.7QueryProcessing
    5.7.1Document-at-a-timeEvaluation
    5.7.2Term-at-a-timeEvaluation
    5.7.3OptimizationTechniques
    5.7.4StructuredQueries
    5.7.5DistributedEvaluation
    5.7.6Caching

    6QueriesandInterfaces
    6.1InformationNeedsandQueries
    6.2QueryTransformationandRefinement
    6.2.1StoppingandStemmingRevisited
    6.2.2SpellCheckingandSuggestions
    6.2.3QueryExpansion
    6.2.4RelevanceFeedback
    6.2.5ContextandPersonalization
    6.3ShowingtheResults
    6.3.1ResultPagesandSnippets
    6.3.2AdvertisingandSearch
    6.3.3ClusteringtheResults
    6.4Cross-LanguageSearch

    7RetrievalModels
    7.1OverviewofRetrievalModels
    7.1.1BooleanRetrieval
    7.1.2TheVectorSpaceModel
    7.2ProbabilisticModels
    7.2.1InformationRetrievalasClassification
    7.2.2TheBM25RankingAlgorithm
    7.3RankingBasedonLanguageModels
    7.3.1QueryLikelihoodRanking
    7.3.2RelevanceModelsandPseudo-RelevanceFeedback
    7.4ComplexQueriesandCombiningEvidence
    7.4.1TheInferenceNetworkModel
    7.4.2TheGalagoQueryLanguage
    7.5WebSearch
    7.6MachineLearningandInformationRetrieval
    7.6.1LearningtoRank
    7.6.2TopicModelsandVocabularyMismatch
    7.7Application-BasedModels

    8EvaluatingSearchEngines
    8.1WhyEvaluate?
    8.2TheEvaluationCorpus
    8.3Logging
    8.4EffectivenessMetrics
    8.4.1RecallandPrecision
    8.4.2AveragingandInterpolation
    8.4.3FocusingontheTopDocuments
    8.4.4UsingPreferences
    ……
    9ClassificationandClustering
    10SocialSearch
    11BeyondBagofWords
    Reverences
    Index
  • 内容简介:
      《搜索引擎:信息检索实践(英文版)》介绍了信息检索(1R)中的关键问题。以及这些问题如何影响搜索引擎的设计与实现,并且用数学模型强化了重要的概念。对于网络搜索引擎这一重要的话题,书中主要涵盖了在网络上广泛使用的搜索技术。
      《搜索引擎:信息检索实践(英文版)》适用于高等院校计算机科学或计算机工程专业的本科生、研究生,对于专业人士而言,《搜索引擎:信息检索实践(英文版)》也不失为一本理想的入门教材。
  • 作者简介:
      W.BruceCroft,马萨诸塞大学阿默斯特分校计算机科学特聘教授、ACM会士。他创建了智能信息检索研究中心,发表了200余篇论文,多次获奖,其中包括2003年由ACMSIGIR颁发的GerardSalton奖。
      DonaldMetzler马萨诸塞大学阿默斯特分校博士,是位于加州SantaClara的雅虎研究中心搜索与计算广告组的研究科学家。
      TrevorStrohman马萨诸塞大学阿默斯特分校博士,是Google公司搜索质量部门的软件工程师。他开发了Galago搜索引擎,也是Indri搜索引擎的主要开发者。
  • 目录:
    1SearchEnginesandInformationRetrieval
    1.1WhatIsInformationRetrieval?
    1.2TheBigIssues
    1.3SearchEngines
    1.4SearchEngineers

    2ArchitectureofaSearchEngine
    2.1WhatIsanArchitecture
    2.2BasicBuildingBlocks
    2.3BreakingItDown
    2.3.1TextAcquisition
    2.3.2TextTransformation
    2.3.3IndexCreation
    2.3.4UserInteraction
    2.3.5Ranking
    2.3.6Evaluation
    2.4HowDoesItReallyWork?

    3CrawlsandFeeds
    3.1DecidingWhattoSearch
    3.2CrawlingtheWeb
    3.2.1RetrievingWebPages
    3.2.2TheWebCrawler
    3.2.3Freshness
    3.2.4FocusedCrawling
    3.2.5DeepWeb
    3.2.6Sitemaps
    3.2.7DistributedCrawling
    3.3CrawlingDocumentsandEmail
    3.4DocumentFeeds
    3.5TheConversionProblem
    3.5.1CharacterEncodings
    3.6StoringtheDocuments
    3.6,1UsingaDatabaseSystem
    3.6.2RandomAccess
    3.6.3CompressionandLargeFiles
    3.6.4Update
    3.6.5BigTable
    3.7DetectingDuplicates
    3.8RemovingNoise

    4ProcessingText
    4.1FromWordstoTerms
    4.2TextStatistics
    4.2.1VocabularyGrowth
    4.2.2EstimatingCollectionandResultSetSizes
    4.3DocumentParsing
    4.3.1Overview
    4.3.2Tokenizing
    4.3.3Stopping
    4.3.4Stemming
    4.3.5PhrasesandN-grams
    4.4DocumentStructureandMarkup
    4.5LinkAnalysis
    4.5.1AnchorText
    4.5.2PageRank
    4.5.3LinkQuality
    4.6InformationExtraction
    4.6.1HiddenMarkovModelsforExtraction
    4.7Internationalization

    5RankingwithIndexes
    5.1Overview
    5.2AbstractModelofRanking
    5.3InvertedIndexes
    5.3.1Documents
    5.3.2Counts
    5.3.3Positions
    5.3AFieldsandExtents
    5.3.5Scores
    5.3.6Ordering
    5.4Compression
    5.4.1EntropyandAmbiguity
    5.4.2DeltaEncoding
    5.4.3Bit-AlignedCodes
    5.4.4Byte-AlignedCodes
    5.4.5CompressioninPractice
    5.4.6LookingAhead
    5.4.7SkippingandSkipPointers
    5.5AuxiliaryStructures
    5.6IndexConstruction
    5.6.1SimpleConstruction
    5.6.2Merging
    5.6.3ParallelismandDistribution
    5.6.4Update
    5.7QueryProcessing
    5.7.1Document-at-a-timeEvaluation
    5.7.2Term-at-a-timeEvaluation
    5.7.3OptimizationTechniques
    5.7.4StructuredQueries
    5.7.5DistributedEvaluation
    5.7.6Caching

    6QueriesandInterfaces
    6.1InformationNeedsandQueries
    6.2QueryTransformationandRefinement
    6.2.1StoppingandStemmingRevisited
    6.2.2SpellCheckingandSuggestions
    6.2.3QueryExpansion
    6.2.4RelevanceFeedback
    6.2.5ContextandPersonalization
    6.3ShowingtheResults
    6.3.1ResultPagesandSnippets
    6.3.2AdvertisingandSearch
    6.3.3ClusteringtheResults
    6.4Cross-LanguageSearch

    7RetrievalModels
    7.1OverviewofRetrievalModels
    7.1.1BooleanRetrieval
    7.1.2TheVectorSpaceModel
    7.2ProbabilisticModels
    7.2.1InformationRetrievalasClassification
    7.2.2TheBM25RankingAlgorithm
    7.3RankingBasedonLanguageModels
    7.3.1QueryLikelihoodRanking
    7.3.2RelevanceModelsandPseudo-RelevanceFeedback
    7.4ComplexQueriesandCombiningEvidence
    7.4.1TheInferenceNetworkModel
    7.4.2TheGalagoQueryLanguage
    7.5WebSearch
    7.6MachineLearningandInformationRetrieval
    7.6.1LearningtoRank
    7.6.2TopicModelsandVocabularyMismatch
    7.7Application-BasedModels

    8EvaluatingSearchEngines
    8.1WhyEvaluate?
    8.2TheEvaluationCorpus
    8.3Logging
    8.4EffectivenessMetrics
    8.4.1RecallandPrecision
    8.4.2AveragingandInterpolation
    8.4.3FocusingontheTopDocuments
    8.4.4UsingPreferences
    ……
    9ClassificationandClustering
    10SocialSearch
    11BeyondBagofWords
    Reverences
    Index
查看详情
系列丛书 / 更多
搜索引擎:信息检索实践
计算机网络
[荷兰]塔嫩鲍姆(Tanenbaum A.S.) 著
搜索引擎:信息检索实践
Java编程思想:英文版·第4版
[美]埃克尔 著
搜索引擎:信息检索实践
编译原理(英文版·第2版)
[美]阿霍 著
搜索引擎:信息检索实践
计算机科学概论(英文版·第5版)
[美]Nell、John Lewis 著
搜索引擎:信息检索实践
经典原版书库:电子商务(英文精编版·第10版)
[美]施内德(Gary P. Schneider) 著
搜索引擎:信息检索实践
计算机组成与设计:硬件/软件接口(英文版•第5版•亚洲版)
[美]David、John L.Hennessy 著
搜索引擎:信息检索实践
现代操作系统(英文版·第4版)
[美]Andrew S. Tanenbaum、Herbert Bos 著
搜索引擎:信息检索实践
离散数学及其应用(英文版)(第7版)
[美]罗森 著
搜索引擎:信息检索实践
Java语言程序设计:基础篇(英文版)(第8版)
[美]梁(Y.Daniel Liang) 著
搜索引擎:信息检索实践
计算机科学引论(2017英文精编版)
[美]蒂莫西、J.、奥利里(Timothy、J.、O\\\\\\\'Leary) 著
搜索引擎:信息检索实践
软件工程:实践者的研究方法(英文精编版 第8版)
[美]罗杰、[美]布鲁斯 R.马克西姆 著
搜索引擎:信息检索实践
计算机文化:(英文版·第15版)
[美]帕森斯(June Jamrich Parsons)、[美]奥贾(Dan Oja) 著
相关图书 / 更多
您可能感兴趣 / 更多
搜索引擎:信息检索实践
归属感:如何通过社群获得商业竞争优势
[美]大卫·斯平克斯(David Spinks) 著;颉腾文化 出品
搜索引擎:信息检索实践
雪花的故事(用照片展示雪花的秘密,为你揭开冬日奇景的奥秘)
[美]马克·卡西诺[美]乔恩·尼尔森
搜索引擎:信息检索实践
进阶书系-国际史的技艺
[美] 马克·特拉亨伯格
搜索引擎:信息检索实践
杜甫传
[美]弗洛伦斯.艾思柯
搜索引擎:信息检索实践
神奇的数字零:从数字0开始的极简数学史和人类发展史
[美]查尔斯·塞弗(Charles Seife)著 杨杨立汝 译
搜索引擎:信息检索实践
爵士乐史(精装本)
[美]泰德·乔亚 著
搜索引擎:信息检索实践
环境的科学 (平装版)
[美]威廉·坎宁安 后浪
搜索引擎:信息检索实践
美利坚在燃烧:20世纪60年代以来的警察暴力与黑人反抗
[美]伊丽莎白·欣顿 著 胡位钧 译
搜索引擎:信息检索实践
数学侦探 游乐园里的古怪笑脸
[美]丹尼尔·肯尼 艾米丽·博艾尔 著 刘玙婧、王婧 译;小博集出品
搜索引擎:信息检索实践
读懂经济学:提升“财商”、塑造价值观念的经济学读本,一本书参破瞬息万变的经济世界底层逻辑!
[美]霍华德·亚鲁斯 著;赵善江 译;斯坦威 出品
搜索引擎:信息检索实践
儒教中国及其现代命运(三部曲)
[美]列文森 作者;[中]季剑青 译者
搜索引擎:信息检索实践
逃家小兔成长绘本系列
[美]玛格丽特.怀兹.布朗