文本挖掘

文本挖掘
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [以色列] [美]
出版社: 人民邮电出版社
2009-08
版次: 1
ISBN: 9787115205353
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 410页
字数: 506千字
正文语种: 英语
  •   《文本挖掘(英文版)》是一部文本挖掘领域名著,作者为世界知名的权威学者。书中涵盖了核心文本挖掘操作、文本挖掘预处理技术、分类、聚类、信息提取、信息提取的概率模型、预处理应用、可视化方法、链接分析、文本挖掘应用等内容,很好地结合了文本挖掘的理论和实践。《文本挖掘(英文版)》非常适合文本挖掘、信息检索领域的研究人员和实践者阅读,也适合作为高等院校计算机及相关专业研究生的数据挖掘和知识发现等课程的教材。   RonenFeIdmarl,机器学习、数据挖掘和非结构化数据管理的先驱人物。以色列Bar一liarl大学数学与计算机科学系高级讲师、数据挖掘实验室主任,Clearforest公司(主要为企业和政府机构开发下一代文本挖掘应用)合作创始人、董事长,现在还是纽约大学Stern商学院的副教授。
      JamesSanger风险投资家,商业数据解决方案、因特网应用和IT安全产品领域公认的行业专家。他于1982年与人合伙创立了ABSVetllures公司。此前,他是DBCapital纽约公司的常务董事他本科毕业于宾夕法尼亚大学,研究生就读于牛津大学和利物浦大学他是IEEE和美国人工智能协会(AAAI)会员。 I.IntroductiontoTextMining1
    I.1DefiningTextMining1
    I.2GeneralArchitectureofTextMiningSystems13

    II.CoreTextMiningOperations19
    II.1CoreTextMiningOperations19
    II.2UsingBackgroundKnowledgeforTextMining41
    II.3TextMiningQueryLanguages51

    III.TextMiningPreprocessingTechniques57
    III.1Task-OrientedApproaches58
    III.2FurtherReading62

    IV.Categorization64
    IV.1ApplicationsofTextCategorization65
    IV.2DefinitionoftheProblem66
    IV.3DocumentRepresentation68
    IV.4KnowledgeEngineeringApproachtoTC70
    IV.5MachineLearningApproachtoTC70
    IV.6UsingUnlabeledDatatoImproveClassification78
    IV.7EvaluationofTextClassifiers79
    IV.8CitationsandNotes80

    V.Clustering82
    V.1ClusteringTasksinTextAnalysis82
    V.2TheGeneralClusteringProblem84
    V.3ClusteringAlgorithms85
    V.4ClusteringofTextualData88
    V.5CitationsandNotes92

    VI.InformationExtraction94
    VI.1IntroductiontoInformationExtraction94
    VI.2HistoricalEvolutionofIE:TheMessageUnderstandingConferencesandTipster96
    VI.3IEExamples101
    VI.4ArchitectureofIESystems104
    VI.5AnaphoraResolution109
    VI.6InductiveAlgorithmsforIE119
    VI.7StructuralIE122
    VI.8FurtherReading129

    VII.ProbabilisticModelsforInformationExtraction131
    VII.1HiddenMarkovModels131
    VII.2StochasticContext-FreeGrammars137
    VII.3MaximalEntropyModeling138
    VII.4MaximalEntropyMarkovModels140
    VII.5ConditionalRandomFields142
    VII.6FurtherReading145

    VIII.PreprocessingApplicationsUsingProbabilisticandHybridApproaches146
    VIII.1ApplicationsofHMMtoTextualAnalysis146
    VIII.2UsingMEMMforInformationExtraction152
    VIII.3ApplicationsofCRFstoTextualAnalysis153
    VIII.4TEG:UsingSCFGRulesforHybridStatistical–Knowledge-BasedIE155
    VIII.5Bootstrapping166
    VIII.6FurtherReading175

    IX.Presentation-LayerConsiderationsforBrowsingandQueryRefinement177
    IX.1Browsing177
    IX.2AccessingConstraintsandSimpleSpecificationFiltersatthePresentationLayer185
    IX.3AccessingtheUnderlyingQueryLanguage186
    IX.4CitationsandNotes187

    X.VisualizationApproaches189
    X.1Introduction189
    X.2ArchitecturalConsiderations192
    X.3CommonVisualizationApproachesforTextMining194
    X.4VisualizationTechniquesinLinkAnalysis225
    X.5Real-WorldExample:TheDocumentExplorerSystem235

    XI.LinkAnalysis244
    XI.1Preliminaries244
    XI.2AutomaticLayoutofNetworks246
    XI.3PathsandCyclesinGraphs250
    XI.4Centrality251
    XI.5PartitioningofNetworks259
    XI.6PatternMatchinginNetworks272
    XI.7SoftwarePackagesforLinkAnalysis273
    XI.8CitationsandNotes274

    XII.TextMiningApplications275
    XII.1GeneralConsiderations276
    XII.2CorporateFinance:MiningIndustryLiteratureforBusinessIntelligence281
    XII.3A“Horizontal”TextMiningApplication:PatentAnalysisSolutionLeveragingaCommercialTextAnalyticsPlatform297
    XII.4LifeSciencesResearch:MiningBiologicalPathwayInformationwithGeneWays309

    AppendixA:DIAL:ADedicatedInformationExtractionLanguageforTextMining317
    A.1WhatIstheDIALLanguage?317
    A.2InformationExtractionintheDIALEnvironment318
    A.3TextTokenization320
    A.4ConceptandRuleStructure320
    A.5PatternMatching322
    A.6PatternElements323
    A.7RuleConstraints327
    A.8ConceptGuards328
    A.9CompleteDIALExamples329

    Bibliography337
    Index391
  • 内容简介:
      《文本挖掘(英文版)》是一部文本挖掘领域名著,作者为世界知名的权威学者。书中涵盖了核心文本挖掘操作、文本挖掘预处理技术、分类、聚类、信息提取、信息提取的概率模型、预处理应用、可视化方法、链接分析、文本挖掘应用等内容,很好地结合了文本挖掘的理论和实践。《文本挖掘(英文版)》非常适合文本挖掘、信息检索领域的研究人员和实践者阅读,也适合作为高等院校计算机及相关专业研究生的数据挖掘和知识发现等课程的教材。
  • 作者简介:
      RonenFeIdmarl,机器学习、数据挖掘和非结构化数据管理的先驱人物。以色列Bar一liarl大学数学与计算机科学系高级讲师、数据挖掘实验室主任,Clearforest公司(主要为企业和政府机构开发下一代文本挖掘应用)合作创始人、董事长,现在还是纽约大学Stern商学院的副教授。
      JamesSanger风险投资家,商业数据解决方案、因特网应用和IT安全产品领域公认的行业专家。他于1982年与人合伙创立了ABSVetllures公司。此前,他是DBCapital纽约公司的常务董事他本科毕业于宾夕法尼亚大学,研究生就读于牛津大学和利物浦大学他是IEEE和美国人工智能协会(AAAI)会员。
  • 目录:
    I.IntroductiontoTextMining1
    I.1DefiningTextMining1
    I.2GeneralArchitectureofTextMiningSystems13

    II.CoreTextMiningOperations19
    II.1CoreTextMiningOperations19
    II.2UsingBackgroundKnowledgeforTextMining41
    II.3TextMiningQueryLanguages51

    III.TextMiningPreprocessingTechniques57
    III.1Task-OrientedApproaches58
    III.2FurtherReading62

    IV.Categorization64
    IV.1ApplicationsofTextCategorization65
    IV.2DefinitionoftheProblem66
    IV.3DocumentRepresentation68
    IV.4KnowledgeEngineeringApproachtoTC70
    IV.5MachineLearningApproachtoTC70
    IV.6UsingUnlabeledDatatoImproveClassification78
    IV.7EvaluationofTextClassifiers79
    IV.8CitationsandNotes80

    V.Clustering82
    V.1ClusteringTasksinTextAnalysis82
    V.2TheGeneralClusteringProblem84
    V.3ClusteringAlgorithms85
    V.4ClusteringofTextualData88
    V.5CitationsandNotes92

    VI.InformationExtraction94
    VI.1IntroductiontoInformationExtraction94
    VI.2HistoricalEvolutionofIE:TheMessageUnderstandingConferencesandTipster96
    VI.3IEExamples101
    VI.4ArchitectureofIESystems104
    VI.5AnaphoraResolution109
    VI.6InductiveAlgorithmsforIE119
    VI.7StructuralIE122
    VI.8FurtherReading129

    VII.ProbabilisticModelsforInformationExtraction131
    VII.1HiddenMarkovModels131
    VII.2StochasticContext-FreeGrammars137
    VII.3MaximalEntropyModeling138
    VII.4MaximalEntropyMarkovModels140
    VII.5ConditionalRandomFields142
    VII.6FurtherReading145

    VIII.PreprocessingApplicationsUsingProbabilisticandHybridApproaches146
    VIII.1ApplicationsofHMMtoTextualAnalysis146
    VIII.2UsingMEMMforInformationExtraction152
    VIII.3ApplicationsofCRFstoTextualAnalysis153
    VIII.4TEG:UsingSCFGRulesforHybridStatistical–Knowledge-BasedIE155
    VIII.5Bootstrapping166
    VIII.6FurtherReading175

    IX.Presentation-LayerConsiderationsforBrowsingandQueryRefinement177
    IX.1Browsing177
    IX.2AccessingConstraintsandSimpleSpecificationFiltersatthePresentationLayer185
    IX.3AccessingtheUnderlyingQueryLanguage186
    IX.4CitationsandNotes187

    X.VisualizationApproaches189
    X.1Introduction189
    X.2ArchitecturalConsiderations192
    X.3CommonVisualizationApproachesforTextMining194
    X.4VisualizationTechniquesinLinkAnalysis225
    X.5Real-WorldExample:TheDocumentExplorerSystem235

    XI.LinkAnalysis244
    XI.1Preliminaries244
    XI.2AutomaticLayoutofNetworks246
    XI.3PathsandCyclesinGraphs250
    XI.4Centrality251
    XI.5PartitioningofNetworks259
    XI.6PatternMatchinginNetworks272
    XI.7SoftwarePackagesforLinkAnalysis273
    XI.8CitationsandNotes274

    XII.TextMiningApplications275
    XII.1GeneralConsiderations276
    XII.2CorporateFinance:MiningIndustryLiteratureforBusinessIntelligence281
    XII.3A“Horizontal”TextMiningApplication:PatentAnalysisSolutionLeveragingaCommercialTextAnalyticsPlatform297
    XII.4LifeSciencesResearch:MiningBiologicalPathwayInformationwithGeneWays309

    AppendixA:DIAL:ADedicatedInformationExtractionLanguageforTextMining317
    A.1WhatIstheDIALLanguage?317
    A.2InformationExtractionintheDIALEnvironment318
    A.3TextTokenization320
    A.4ConceptandRuleStructure320
    A.5PatternMatching322
    A.6PatternElements323
    A.7RuleConstraints327
    A.8ConceptGuards328
    A.9CompleteDIALExamples329

    Bibliography337
    Index391
查看详情
好书推荐 / 更多
文本挖掘
北平学人访问记(上)(碎金文丛5)
贺逸文
文本挖掘
文青之死
赖香吟 ;后浪
文本挖掘
立马上菜
M.F.K.费雪
文本挖掘
自愈之路:开创癌症免疫疗法的科学家们
[美]尼尔·卡纳万(Neil Canavan)
文本挖掘
哲思与海:一部诗意的哲学随笔
[美]戴维·法雷尔·克雷尔 著;陈瑾 译
文本挖掘
锥形帐篷的起源
乔尼·休斯
文本挖掘
事邦国之神祇:唐至北宋吉礼变迁研究
朱溢 著
文本挖掘
《剑桥非洲史·20世纪卷(1905—1940)》 《剑桥非洲史·20世纪卷(1940—1975)》(丛书2册)
安德鲁·罗伯茨;迈克尔·克劳德
文本挖掘
面具与乌托邦:墨西哥人民及其文化剪影
[墨]萨穆埃尔·拉莫斯
文本挖掘
苏联的外宾商店:为了工业化所需的黄金
[俄罗斯]叶列娜·亚历山德罗夫娜·奥金娜
文本挖掘
警治的终结
[英]亚历克斯·S.维塔莱 著;王飞、张鹏瀚 译
文本挖掘
用电影燃尽欲望
[【日】]园子温;余梦娇