文本挖掘

文本挖掘
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [以色列] , [美]
2009-08
版次: 1
ISBN: 9787115205353
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 410页
字数: 506千字
正文语种: 英语
20人买过
  •   《文本挖掘(英文版)》是一部文本挖掘领域名著,作者为世界知名的权威学者。书中涵盖了核心文本挖掘操作、文本挖掘预处理技术、分类、聚类、信息提取、信息提取的概率模型、预处理应用、可视化方法、链接分析、文本挖掘应用等内容,很好地结合了文本挖掘的理论和实践。《文本挖掘(英文版)》非常适合文本挖掘、信息检索领域的研究人员和实践者阅读,也适合作为高等院校计算机及相关专业研究生的数据挖掘和知识发现等课程的教材。   RonenFeIdmarl,机器学习、数据挖掘和非结构化数据管理的先驱人物。以色列Bar一liarl大学数学与计算机科学系高级讲师、数据挖掘实验室主任,Clearforest公司(主要为企业和政府机构开发下一代文本挖掘应用)合作创始人、董事长,现在还是纽约大学Stern商学院的副教授。
      JamesSanger风险投资家,商业数据解决方案、因特网应用和IT安全产品领域公认的行业专家。他于1982年与人合伙创立了ABSVetllures公司。此前,他是DBCapital纽约公司的常务董事他本科毕业于宾夕法尼亚大学,研究生就读于牛津大学和利物浦大学他是IEEE和美国人工智能协会(AAAI)会员。 I.IntroductiontoTextMining1
    I.1DefiningTextMining1
    I.2GeneralArchitectureofTextMiningSystems13

    II.CoreTextMiningOperations19
    II.1CoreTextMiningOperations19
    II.2UsingBackgroundKnowledgeforTextMining41
    II.3TextMiningQueryLanguages51

    III.TextMiningPreprocessingTechniques57
    III.1Task-OrientedApproaches58
    III.2FurtherReading62

    IV.Categorization64
    IV.1ApplicationsofTextCategorization65
    IV.2DefinitionoftheProblem66
    IV.3DocumentRepresentation68
    IV.4KnowledgeEngineeringApproachtoTC70
    IV.5MachineLearningApproachtoTC70
    IV.6UsingUnlabeledDatatoImproveClassification78
    IV.7EvaluationofTextClassifiers79
    IV.8CitationsandNotes80

    V.Clustering82
    V.1ClusteringTasksinTextAnalysis82
    V.2TheGeneralClusteringProblem84
    V.3ClusteringAlgorithms85
    V.4ClusteringofTextualData88
    V.5CitationsandNotes92

    VI.InformationExtraction94
    VI.1IntroductiontoInformationExtraction94
    VI.2HistoricalEvolutionofIE:TheMessageUnderstandingConferencesandTipster96
    VI.3IEExamples101
    VI.4ArchitectureofIESystems104
    VI.5AnaphoraResolution109
    VI.6InductiveAlgorithmsforIE119
    VI.7StructuralIE122
    VI.8FurtherReading129

    VII.ProbabilisticModelsforInformationExtraction131
    VII.1HiddenMarkovModels131
    VII.2StochasticContext-FreeGrammars137
    VII.3MaximalEntropyModeling138
    VII.4MaximalEntropyMarkovModels140
    VII.5ConditionalRandomFields142
    VII.6FurtherReading145

    VIII.PreprocessingApplicationsUsingProbabilisticandHybridApproaches146
    VIII.1ApplicationsofHMMtoTextualAnalysis146
    VIII.2UsingMEMMforInformationExtraction152
    VIII.3ApplicationsofCRFstoTextualAnalysis153
    VIII.4TEG:UsingSCFGRulesforHybridStatistical–Knowledge-BasedIE155
    VIII.5Bootstrapping166
    VIII.6FurtherReading175

    IX.Presentation-LayerConsiderationsforBrowsingandQueryRefinement177
    IX.1Browsing177
    IX.2AccessingConstraintsandSimpleSpecificationFiltersatthePresentationLayer185
    IX.3AccessingtheUnderlyingQueryLanguage186
    IX.4CitationsandNotes187

    X.VisualizationApproaches189
    X.1Introduction189
    X.2ArchitecturalConsiderations192
    X.3CommonVisualizationApproachesforTextMining194
    X.4VisualizationTechniquesinLinkAnalysis225
    X.5Real-WorldExample:TheDocumentExplorerSystem235

    XI.LinkAnalysis244
    XI.1Preliminaries244
    XI.2AutomaticLayoutofNetworks246
    XI.3PathsandCyclesinGraphs250
    XI.4Centrality251
    XI.5PartitioningofNetworks259
    XI.6PatternMatchinginNetworks272
    XI.7SoftwarePackagesforLinkAnalysis273
    XI.8CitationsandNotes274

    XII.TextMiningApplications275
    XII.1GeneralConsiderations276
    XII.2CorporateFinance:MiningIndustryLiteratureforBusinessIntelligence281
    XII.3A“Horizontal”TextMiningApplication:PatentAnalysisSolutionLeveragingaCommercialTextAnalyticsPlatform297
    XII.4LifeSciencesResearch:MiningBiologicalPathwayInformationwithGeneWays309

    AppendixA:DIAL:ADedicatedInformationExtractionLanguageforTextMining317
    A.1WhatIstheDIALLanguage?317
    A.2InformationExtractionintheDIALEnvironment318
    A.3TextTokenization320
    A.4ConceptandRuleStructure320
    A.5PatternMatching322
    A.6PatternElements323
    A.7RuleConstraints327
    A.8ConceptGuards328
    A.9CompleteDIALExamples329

    Bibliography337
    Index391
  • 内容简介:
      《文本挖掘(英文版)》是一部文本挖掘领域名著,作者为世界知名的权威学者。书中涵盖了核心文本挖掘操作、文本挖掘预处理技术、分类、聚类、信息提取、信息提取的概率模型、预处理应用、可视化方法、链接分析、文本挖掘应用等内容,很好地结合了文本挖掘的理论和实践。《文本挖掘(英文版)》非常适合文本挖掘、信息检索领域的研究人员和实践者阅读,也适合作为高等院校计算机及相关专业研究生的数据挖掘和知识发现等课程的教材。
  • 作者简介:
      RonenFeIdmarl,机器学习、数据挖掘和非结构化数据管理的先驱人物。以色列Bar一liarl大学数学与计算机科学系高级讲师、数据挖掘实验室主任,Clearforest公司(主要为企业和政府机构开发下一代文本挖掘应用)合作创始人、董事长,现在还是纽约大学Stern商学院的副教授。
      JamesSanger风险投资家,商业数据解决方案、因特网应用和IT安全产品领域公认的行业专家。他于1982年与人合伙创立了ABSVetllures公司。此前,他是DBCapital纽约公司的常务董事他本科毕业于宾夕法尼亚大学,研究生就读于牛津大学和利物浦大学他是IEEE和美国人工智能协会(AAAI)会员。
  • 目录:
    I.IntroductiontoTextMining1
    I.1DefiningTextMining1
    I.2GeneralArchitectureofTextMiningSystems13

    II.CoreTextMiningOperations19
    II.1CoreTextMiningOperations19
    II.2UsingBackgroundKnowledgeforTextMining41
    II.3TextMiningQueryLanguages51

    III.TextMiningPreprocessingTechniques57
    III.1Task-OrientedApproaches58
    III.2FurtherReading62

    IV.Categorization64
    IV.1ApplicationsofTextCategorization65
    IV.2DefinitionoftheProblem66
    IV.3DocumentRepresentation68
    IV.4KnowledgeEngineeringApproachtoTC70
    IV.5MachineLearningApproachtoTC70
    IV.6UsingUnlabeledDatatoImproveClassification78
    IV.7EvaluationofTextClassifiers79
    IV.8CitationsandNotes80

    V.Clustering82
    V.1ClusteringTasksinTextAnalysis82
    V.2TheGeneralClusteringProblem84
    V.3ClusteringAlgorithms85
    V.4ClusteringofTextualData88
    V.5CitationsandNotes92

    VI.InformationExtraction94
    VI.1IntroductiontoInformationExtraction94
    VI.2HistoricalEvolutionofIE:TheMessageUnderstandingConferencesandTipster96
    VI.3IEExamples101
    VI.4ArchitectureofIESystems104
    VI.5AnaphoraResolution109
    VI.6InductiveAlgorithmsforIE119
    VI.7StructuralIE122
    VI.8FurtherReading129

    VII.ProbabilisticModelsforInformationExtraction131
    VII.1HiddenMarkovModels131
    VII.2StochasticContext-FreeGrammars137
    VII.3MaximalEntropyModeling138
    VII.4MaximalEntropyMarkovModels140
    VII.5ConditionalRandomFields142
    VII.6FurtherReading145

    VIII.PreprocessingApplicationsUsingProbabilisticandHybridApproaches146
    VIII.1ApplicationsofHMMtoTextualAnalysis146
    VIII.2UsingMEMMforInformationExtraction152
    VIII.3ApplicationsofCRFstoTextualAnalysis153
    VIII.4TEG:UsingSCFGRulesforHybridStatistical–Knowledge-BasedIE155
    VIII.5Bootstrapping166
    VIII.6FurtherReading175

    IX.Presentation-LayerConsiderationsforBrowsingandQueryRefinement177
    IX.1Browsing177
    IX.2AccessingConstraintsandSimpleSpecificationFiltersatthePresentationLayer185
    IX.3AccessingtheUnderlyingQueryLanguage186
    IX.4CitationsandNotes187

    X.VisualizationApproaches189
    X.1Introduction189
    X.2ArchitecturalConsiderations192
    X.3CommonVisualizationApproachesforTextMining194
    X.4VisualizationTechniquesinLinkAnalysis225
    X.5Real-WorldExample:TheDocumentExplorerSystem235

    XI.LinkAnalysis244
    XI.1Preliminaries244
    XI.2AutomaticLayoutofNetworks246
    XI.3PathsandCyclesinGraphs250
    XI.4Centrality251
    XI.5PartitioningofNetworks259
    XI.6PatternMatchinginNetworks272
    XI.7SoftwarePackagesforLinkAnalysis273
    XI.8CitationsandNotes274

    XII.TextMiningApplications275
    XII.1GeneralConsiderations276
    XII.2CorporateFinance:MiningIndustryLiteratureforBusinessIntelligence281
    XII.3A“Horizontal”TextMiningApplication:PatentAnalysisSolutionLeveragingaCommercialTextAnalyticsPlatform297
    XII.4LifeSciencesResearch:MiningBiologicalPathwayInformationwithGeneWays309

    AppendixA:DIAL:ADedicatedInformationExtractionLanguageforTextMining317
    A.1WhatIstheDIALLanguage?317
    A.2InformationExtractionintheDIALEnvironment318
    A.3TextTokenization320
    A.4ConceptandRuleStructure320
    A.5PatternMatching322
    A.6PatternElements323
    A.7RuleConstraints327
    A.8ConceptGuards328
    A.9CompleteDIALExamples329

    Bibliography337
    Index391
查看详情
系列丛书 / 更多
文本挖掘
算法(英文版•第4版)
[美]塞奇威克(Robert Sedgewick)、[美]韦恩(Kevin Wayne) 著
文本挖掘
计算机程序设计艺术(第2卷 英文版·第3版):半数值算法
[美]高德纳 著
文本挖掘
计算机程序设计艺术,卷4A:组合算法(一)(英文版)
[美]Donald E.Knuth 著
文本挖掘
计算机程序设计艺术(第3卷 英文版·第2版):排序与查找
[美]高德纳(Knuth D.E) 著
文本挖掘
C++Primer(英文版)(第4版)
李普曼 著
文本挖掘
数据结构与算法分析:C++描述(英文版)(第3版)
[美]维斯 著
文本挖掘
UNIX环境高级编程
史蒂文斯、拉戈 著
文本挖掘
信息检索:算法与启发式方法(英文版·第2版)
[美]格罗斯曼、[美]弗里德 著
文本挖掘
Web数据挖掘:超文本数据的知识发现
[印]查凯莱巴蒂 著
文本挖掘
TCP/IP 详解(卷2):实现(英文版)
[美]赖特(Gary R.Wright)、[美]史蒂文斯(W.Richard Stevens) 著
文本挖掘
IPv6详解,第1卷,核心协议实现:IPv6时代的《TCP/IP详解》!
[美]李清、[日]神明达哉、[日]岛庆一 著
文本挖掘
UNIX网络编程 卷1
[美]史蒂文斯、[美]芬纳、[美]鲁道夫 著
您可能感兴趣 / 更多
文本挖掘
最棒的狗狗 从小狗奇力身上学习用乐观心态应对竞争压力,勇敢面对挑战
[以色列]加利亚·伯恩斯坦
文本挖掘
耶路撒冷:一座伟大的城市(被揉碎的世界中心,《耶路撒冷三千年》译者倾情翻译,走进这座灿烂无比却又伤痕累累的伟大城市)
[以色列]约瑟夫·米利斯
文本挖掘
(以色列研究经典译丛)以色列外交史:星与权杖
[以色列]伊曼纽尔·纳冯 著;李兰兰 译;关媛
文本挖掘
尤瓦·左默艺术科普绘本:全2册(繁花+自然世界,献给所有热爱大自然喜欢探索有冒险精神孩子的科普绘本)
[以色列]尤瓦·左默 绘者
文本挖掘
走进奇妙的自然世界:尤瓦左默艺术科普图画书(精装,大开本)
[以色列]尤瓦·左默 绘者
文本挖掘
一个完整的巴勒斯坦--英国委任统治时期的犹太人与阿拉伯人(地区研究丛书)
[以色列]汤姆·塞格夫 著;丁辰熹 译
文本挖掘
好望角丛书·为了国家,不惜一切:本-古里安传
[以色列]汤姆·塞格夫
文本挖掘
诺贝尔儿童经济学漫画
[以色列]艾迪拉莫 图;文:(以色列)优尼特˙维博
文本挖掘
玩具岛梦幻之旅(99)(“以色列奖”得主经典作品)
[以色列]米里亚姆·雅兰-施泰克丽丝
文本挖掘
BIM手册 (原著第三版)
[以色列]拉斐尔·萨克斯(Rafael Sacks) (美)查尔斯·伊斯曼(Charles Eastman) (韩)李刚(Ghang Lee)
文本挖掘
洞悉对手:领导人、情报部门与国际关系中的意图评估
[以色列]克伦·亚希-米洛 著;曹德军 译
文本挖掘
光学检验与测试
[以色列]迈克尔·豪斯纳(MichaelHausner 著