面向web数据的信息抽取及融合技术研究

面向web数据的信息抽取及融合技术研究
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2021-06
版次: 1
ISBN: 9787568068291
定价: 68.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 160页
字数: 185千字
  • 随着Web数据的不断扩充,如何从Web数据中抽取信息并融合成指导决策的情报,已成为广泛关注的领域。面向Web数据的信息抽取和融合可以通过统计、在线分析处理、情报检索、机器学习、专家系统、模式识别等诸多方法来实现上述目标。本书是信息抽取领域的学术著作,旨在从情报检索的视角介绍面向非限定领域的Web数据分析及处理方法。本书从基本概念讲解信息抽取以及融合,涉及词、句、篇章等层面的分析和处理策略,特别是针对情报处理的需要,以“事件”为切入点,将包括中文分词、词性标注、组块划分、句法分析、*大熵模型、条件随机域模型、马尔科夫模型等各类相关的处理模型和技术融入事件抽取、事件类型及元素识别、事件信息融合等领域的具体处理任务中加以介绍,并对信息抽取及融合等领域的发展状况及代表性处理手段进行介绍。 王君泽,1982年生,工学博士,管理学博士后,华中科技大学公共管理学院硕士生导师。2010年毕业于华中科技大学电子与信息工程系,获博士学位。主要研究方向为网络舆情、国家信息安全、公共情报管理等。目前已经在IEEE Intelligent Systems、《新闻与传播研究》、《管理世界》、《情报学报》等国内外权威刊物上发表论文多篇。主持自然科学基金项目一项。 第一章Web数据在情报分析中的效用研究/ 1第一节情报分析中的Web数据使用/ 1

    第二节Web数据效用发挥面临的挑战/ 4

    第三节小结/ 6

    第二章中文分词及词性标注/ 8第一节中文自动分词的难点/ 8

    第二节中文分词的基本方法/ 10

    第三节中文词性标注的难点/ 14

    第四节中文词性标注的基本方法/ 15

    第三章中文句法分析/ 21第一节完全句法分析技术/ 21

    第二节浅层句法分析/ 26

    第四章语料库与词汇知识库/ 28第一节语料库技术/ 28

    第二节词汇知识库/ 34

    第五章Web数据消重/ 39第一节引言/ 39

    第二节相关工作与研究框架/ 40

    第三节算法流程分析/ 41

    第四节算法效果评估/ 44

    第五节基于网页转载关系识别的舆情传播态势分析/ 47

    第六章基于最大熵模型的中文事件抽取方法研究/ 49第一节引言/ 49

    第二节相关工作/ 51

    第三节基于最大熵模型的事件类型及元素标注/ 52

    第四节基于组块分析的标注单元划分/ 54

    第五节实验及结果分析/ 56

    第七章共指事件的事件表象可信度评估模型研究/ 58目录面向Web数据的信息抽取及融合技术研究第一节引言/ 58

    第二节相关工作/ 59

    第三节事件表象信任网络/ 61

    第四节基于信任网络的事件表象可信度计算/ 63

    第五节实验与分析/ 64

    第八章面向新闻文本的事件表象融合策略研究/ 68第一节引言/ 68

    第二节相关研究工作/ 69

    第三节事件表象之间的共指关系识别/ 70

    第四节基于Opinosis图结构的共指事件表象融合/ 74

    第五节实验与结果分析/ 77

    第九章面向共指事件识别的同义表述模式抽取研究/ 79第一节引言/ 79

    第二节相关研究工作/ 80

    第三节词级别同义表述模式抽取/ 82

    第四节语句级别同义表述模式抽取/ 86

    第五节实验/ 91

    第十章基于共指事件识别的同义词集构建研究/ 96第一节研究背景/ 96

    第二节相关工作/ 97

    第三节共指事件表述识别/ 99

    第四节同义词抽取及筛选策略/ 103

    第五节实验/ 105

    第十一章基于评论针对性的评论排序/ 108第一节问题定义与分析/ 109

    第二节评论针对性的计算策略/ 111

    第三节实验/ 114

    第四节分析和讨论/ 116第十二章裁判文书类案推送中的案情相似度计算模型研究/ 118第一节背景介绍/ 118

    第二节相关研究工作/ 119

    第三节模型构建/ 120

    第四节实验/ 126

    第十三章舆情数据中的话题分析研究/ 130第一节PLSA介绍/ 130

    第二节数据相关工作/ 132

    第三节结果/ 134

    第四节讨论/ 139

    参考文献/ 141 
  • 内容简介:
    随着Web数据的不断扩充,如何从Web数据中抽取信息并融合成指导决策的情报,已成为广泛关注的领域。面向Web数据的信息抽取和融合可以通过统计、在线分析处理、情报检索、机器学习、专家系统、模式识别等诸多方法来实现上述目标。本书是信息抽取领域的学术著作,旨在从情报检索的视角介绍面向非限定领域的Web数据分析及处理方法。本书从基本概念讲解信息抽取以及融合,涉及词、句、篇章等层面的分析和处理策略,特别是针对情报处理的需要,以“事件”为切入点,将包括中文分词、词性标注、组块划分、句法分析、*大熵模型、条件随机域模型、马尔科夫模型等各类相关的处理模型和技术融入事件抽取、事件类型及元素识别、事件信息融合等领域的具体处理任务中加以介绍,并对信息抽取及融合等领域的发展状况及代表性处理手段进行介绍。
  • 作者简介:
    王君泽,1982年生,工学博士,管理学博士后,华中科技大学公共管理学院硕士生导师。2010年毕业于华中科技大学电子与信息工程系,获博士学位。主要研究方向为网络舆情、国家信息安全、公共情报管理等。目前已经在IEEE Intelligent Systems、《新闻与传播研究》、《管理世界》、《情报学报》等国内外权威刊物上发表论文多篇。主持自然科学基金项目一项。
  • 目录:
    第一章Web数据在情报分析中的效用研究/ 1第一节情报分析中的Web数据使用/ 1

    第二节Web数据效用发挥面临的挑战/ 4

    第三节小结/ 6

    第二章中文分词及词性标注/ 8第一节中文自动分词的难点/ 8

    第二节中文分词的基本方法/ 10

    第三节中文词性标注的难点/ 14

    第四节中文词性标注的基本方法/ 15

    第三章中文句法分析/ 21第一节完全句法分析技术/ 21

    第二节浅层句法分析/ 26

    第四章语料库与词汇知识库/ 28第一节语料库技术/ 28

    第二节词汇知识库/ 34

    第五章Web数据消重/ 39第一节引言/ 39

    第二节相关工作与研究框架/ 40

    第三节算法流程分析/ 41

    第四节算法效果评估/ 44

    第五节基于网页转载关系识别的舆情传播态势分析/ 47

    第六章基于最大熵模型的中文事件抽取方法研究/ 49第一节引言/ 49

    第二节相关工作/ 51

    第三节基于最大熵模型的事件类型及元素标注/ 52

    第四节基于组块分析的标注单元划分/ 54

    第五节实验及结果分析/ 56

    第七章共指事件的事件表象可信度评估模型研究/ 58目录面向Web数据的信息抽取及融合技术研究第一节引言/ 58

    第二节相关工作/ 59

    第三节事件表象信任网络/ 61

    第四节基于信任网络的事件表象可信度计算/ 63

    第五节实验与分析/ 64

    第八章面向新闻文本的事件表象融合策略研究/ 68第一节引言/ 68

    第二节相关研究工作/ 69

    第三节事件表象之间的共指关系识别/ 70

    第四节基于Opinosis图结构的共指事件表象融合/ 74

    第五节实验与结果分析/ 77

    第九章面向共指事件识别的同义表述模式抽取研究/ 79第一节引言/ 79

    第二节相关研究工作/ 80

    第三节词级别同义表述模式抽取/ 82

    第四节语句级别同义表述模式抽取/ 86

    第五节实验/ 91

    第十章基于共指事件识别的同义词集构建研究/ 96第一节研究背景/ 96

    第二节相关工作/ 97

    第三节共指事件表述识别/ 99

    第四节同义词抽取及筛选策略/ 103

    第五节实验/ 105

    第十一章基于评论针对性的评论排序/ 108第一节问题定义与分析/ 109

    第二节评论针对性的计算策略/ 111

    第三节实验/ 114

    第四节分析和讨论/ 116第十二章裁判文书类案推送中的案情相似度计算模型研究/ 118第一节背景介绍/ 118

    第二节相关研究工作/ 119

    第三节模型构建/ 120

    第四节实验/ 126

    第十三章舆情数据中的话题分析研究/ 130第一节PLSA介绍/ 130

    第二节数据相关工作/ 132

    第三节结果/ 134

    第四节讨论/ 139

    参考文献/ 141 
查看详情
您可能感兴趣 / 更多
面向web数据的信息抽取及融合技术研究
网络舆情应对的关键技术研究
王君泽 著