未读消息消息

购物车

我的订单

个人中心

店铺

我的订单收藏

拍卖

拍卖交易我的竞拍收藏

我的好友资金账户

卖家中心

客服 |

帮助中心 9:00-20:30 在线留言

客服电话

010-89648155

服务时间

客服咨询 8:00-21:00

纠纷处理 9:00-21:00

图书审核 9:00-18:00

监督与建议

请选择

手机孔网

面向web数据的信息抽取及融合技术研究

作者: 王君泽

出版社: 华中科技大学出版社

出版时间: 2021-06

版次: 1

ISBN: 9787568068291

定价: 68.00

装帧: 平装

开本: 16开

纸张: 胶版纸

页数: 160页

字数: 185千字

分类: 计算机与互联网

随着Web数据的不断扩充，如何从Web数据中抽取信息并融合成指导决策的情报，已成为广泛关注的领域。面向Web数据的信息抽取和融合可以通过统计、在线分析处理、情报检索、机器学习、专家系统、模式识别等诸多方法来实现上述目标。本书是信息抽取领域的学术著作，旨在从情报检索的视角介绍面向非限定领域的Web数据分析及处理方法。本书从基本概念讲解信息抽取以及融合，涉及词、句、篇章等层面的分析和处理策略，特别是针对情报处理的需要，以“事件”为切入点，将包括中文分词、词性标注、组块划分、句法分析、*大熵模型、条件随机域模型、马尔科夫模型等各类相关的处理模型和技术融入事件抽取、事件类型及元素识别、事件信息融合等领域的具体处理任务中加以介绍，并对信息抽取及融合等领域的发展状况及代表性处理手段进行介绍。王君泽，1982年生，工学博士，管理学博士后，华中科技大学公共管理学院硕士生导师。2010年毕业于华中科技大学电子与信息工程系，获博士学位。主要研究方向为网络舆情、国家信息安全、公共情报管理等。目前已经在IEEE Intelligent Systems、《新闻与传播研究》、《管理世界》、《情报学报》等国内外权威刊物上发表论文多篇。主持自然科学基金项目一项。第一章Web数据在情报分析中的效用研究/ 1第一节情报分析中的Web数据使用/ 1

第二节Web数据效用发挥面临的挑战/ 4

第三节小结/ 6

第二章中文分词及词性标注/ 8第一节中文自动分词的难点/ 8

第二节中文分词的基本方法/ 10

第三节中文词性标注的难点/ 14

第四节中文词性标注的基本方法/ 15

第三章中文句法分析/ 21第一节完全句法分析技术/ 21

第二节浅层句法分析/ 26

第四章语料库与词汇知识库/ 28第一节语料库技术/ 28

第二节词汇知识库/ 34

第五章Web数据消重/ 39第一节引言/ 39

第二节相关工作与研究框架/ 40

第三节算法流程分析/ 41

第四节算法效果评估/ 44

第五节基于网页转载关系识别的舆情传播态势分析/ 47

第六章基于最大熵模型的中文事件抽取方法研究/ 49第一节引言/ 49

第二节相关工作/ 51

第三节基于最大熵模型的事件类型及元素标注/ 52

第四节基于组块分析的标注单元划分/ 54

第五节实验及结果分析/ 56

第七章共指事件的事件表象可信度评估模型研究/ 58目录面向Web数据的信息抽取及融合技术研究第一节引言/ 58

第二节相关工作/ 59

第三节事件表象信任网络/ 61

第四节基于信任网络的事件表象可信度计算/ 63

第五节实验与分析/ 64

第八章面向新闻文本的事件表象融合策略研究/ 68第一节引言/ 68

第二节相关研究工作/ 69

第三节事件表象之间的共指关系识别/ 70

第四节基于Opinosis图结构的共指事件表象融合/ 74

第五节实验与结果分析/ 77

第九章面向共指事件识别的同义表述模式抽取研究/ 79第一节引言/ 79

第二节相关研究工作/ 80

第三节词级别同义表述模式抽取/ 82

第四节语句级别同义表述模式抽取/ 86

第五节实验/ 91

第十章基于共指事件识别的同义词集构建研究/ 96第一节研究背景/ 96

第二节相关工作/ 97

第三节共指事件表述识别/ 99

第四节同义词抽取及筛选策略/ 103

第五节实验/ 105

第十一章基于评论针对性的评论排序/ 108第一节问题定义与分析/ 109

第二节评论针对性的计算策略/ 111

第三节实验/ 114

第四节分析和讨论/ 116第十二章裁判文书类案推送中的案情相似度计算模型研究/ 118第一节背景介绍/ 118

第二节相关研究工作/ 119

第三节模型构建/ 120

第四节实验/ 126

第十三章舆情数据中的话题分析研究/ 130第一节PLSA介绍/ 130

第二节数据相关工作/ 132

第三节结果/ 134

第四节讨论/ 139

参考文献/ 141
内容简介:
随着Web数据的不断扩充，如何从Web数据中抽取信息并融合成指导决策的情报，已成为广泛关注的领域。面向Web数据的信息抽取和融合可以通过统计、在线分析处理、情报检索、机器学习、专家系统、模式识别等诸多方法来实现上述目标。本书是信息抽取领域的学术著作，旨在从情报检索的视角介绍面向非限定领域的Web数据分析及处理方法。本书从基本概念讲解信息抽取以及融合，涉及词、句、篇章等层面的分析和处理策略，特别是针对情报处理的需要，以“事件”为切入点，将包括中文分词、词性标注、组块划分、句法分析、*大熵模型、条件随机域模型、马尔科夫模型等各类相关的处理模型和技术融入事件抽取、事件类型及元素识别、事件信息融合等领域的具体处理任务中加以介绍，并对信息抽取及融合等领域的发展状况及代表性处理手段进行介绍。
作者简介:
王君泽，1982年生，工学博士，管理学博士后，华中科技大学公共管理学院硕士生导师。2010年毕业于华中科技大学电子与信息工程系，获博士学位。主要研究方向为网络舆情、国家信息安全、公共情报管理等。目前已经在IEEE Intelligent Systems、《新闻与传播研究》、《管理世界》、《情报学报》等国内外权威刊物上发表论文多篇。主持自然科学基金项目一项。
目录:
第一章Web数据在情报分析中的效用研究/ 1第一节情报分析中的Web数据使用/ 1

第二节Web数据效用发挥面临的挑战/ 4

第三节小结/ 6

第二章中文分词及词性标注/ 8第一节中文自动分词的难点/ 8

第二节中文分词的基本方法/ 10

第三节中文词性标注的难点/ 14

第四节中文词性标注的基本方法/ 15

第三章中文句法分析/ 21第一节完全句法分析技术/ 21

第二节浅层句法分析/ 26

第四章语料库与词汇知识库/ 28第一节语料库技术/ 28

第二节词汇知识库/ 34

第五章Web数据消重/ 39第一节引言/ 39

第二节相关工作与研究框架/ 40

第三节算法流程分析/ 41

第四节算法效果评估/ 44

第五节基于网页转载关系识别的舆情传播态势分析/ 47

第六章基于最大熵模型的中文事件抽取方法研究/ 49第一节引言/ 49

第二节相关工作/ 51

第三节基于最大熵模型的事件类型及元素标注/ 52

第四节基于组块分析的标注单元划分/ 54

第五节实验及结果分析/ 56

第七章共指事件的事件表象可信度评估模型研究/ 58目录面向Web数据的信息抽取及融合技术研究第一节引言/ 58

第二节相关工作/ 59

第三节事件表象信任网络/ 61

第四节基于信任网络的事件表象可信度计算/ 63

第五节实验与分析/ 64

第八章面向新闻文本的事件表象融合策略研究/ 68第一节引言/ 68

第二节相关研究工作/ 69

第三节事件表象之间的共指关系识别/ 70

第四节基于Opinosis图结构的共指事件表象融合/ 74

第五节实验与结果分析/ 77

第九章面向共指事件识别的同义表述模式抽取研究/ 79第一节引言/ 79

第二节相关研究工作/ 80

第三节词级别同义表述模式抽取/ 82

第四节语句级别同义表述模式抽取/ 86

第五节实验/ 91

第十章基于共指事件识别的同义词集构建研究/ 96第一节研究背景/ 96

第二节相关工作/ 97

第三节共指事件表述识别/ 99

第四节同义词抽取及筛选策略/ 103

第五节实验/ 105

第十一章基于评论针对性的评论排序/ 108第一节问题定义与分析/ 109

第二节评论针对性的计算策略/ 111

第三节实验/ 114

第四节分析和讨论/ 116第十二章裁判文书类案推送中的案情相似度计算模型研究/ 118第一节背景介绍/ 118

第二节相关研究工作/ 119

第三节模型构建/ 120

第四节实验/ 126

第十三章舆情数据中的话题分析研究/ 130第一节PLSA介绍/ 130

第二节数据相关工作/ 132

第三节结果/ 134

第四节讨论/ 139

参考文献/ 141

查看详情

面向web数据的信息抽取及融合技术研究

内容简介:

作者简介:

目录: