Web文本挖掘技术理论与应用

Web文本挖掘技术理论与应用
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2017-06
版次: 01
ISBN: 9787121298271
定价: 49.00
装帧: 平装
开本: 16开
页数: 112页
正文语种: 简体中文
8人买过
  • 随着互联网和通讯网的迅猛发展,网络文本成为信息的主要载体及人们生活中不可或缺的主要信息来源,文本挖掘技术的研究意义和实用价值越来越突出。另一方面,随着Web 2.0时代的到来,出现了越来越多的由用户创作的网络数字内容。用户数字内容的大量产生和传播使得短文本计算、Web文本信息抽取、文本情感分析等逐渐成为Web文本挖掘研究的热点问题。本书从Web文本的信息抽取、聚类、分类、信息检索等技术出发,与读者分享作者多年的研究和开发经验。 何慧,女,华北电力大学(北京)控制与计算机工程学院讲师,加拿大蒙特利尔大学计算机学院访问学者,主要科研领域为机器学习、自然语言处理。 目    录
    第1章  概论 1
    1.1  研究的背景和意义 1
    1.2  文本挖掘相关技术概述及研究现状 2
    1.2.1  文本分类概述及研究现状 3
    1.2.2  文本聚类概述及研究现状 5
    1.2.3  信息抽取概述及研究现状 6
    1.2.4  文本检索概述及研究现状 7
    1.3  文本挖掘领域亟待解决的问题 8
    1.4  本书的研究内容与结构安排 11
    参考文献 13
    第2章  基于统计语言模型的短文本计算 18
    2.1  引言 18
    2.2  文本信息处理基础知识 19
    2.2.1  文本的表示 19
    2.2.2  特征选择 21
    2.3  基于N-gram的特征提取和RPCL的短文本聚类算法 22
    2.3.1  相关工作 23
    2.3.2  算法描述 23
    2.3.3  实验及分析 28
    2.4  小结 31
    参考文献 31
    第3章  面向广告推荐和情感分析的Web文本信息抽取 35
    3.1  引言 35
    3.2  信息抽取常用算法和模型 36
    3.2.1  N-gram语言模型 36
    3.2.2  隐马尔可夫模型 37
    3.2.3  最大熵模型 38
    3.3  基于隐马尔科夫模型的半监督中文复合词抽取算法 41
    3.3.1  相关工作 42
    3.3.2  算法描述 42
    3.3.3  实验及分析 46
    3.4  基于最大熵和LMR模板的中文情感词抽取算法 48
    3.4.1  相关工作 49
    3.4.2  算法描述 50
    3.4.3  实验及分析 51
    3.5  小结 55
    参考文献 55
    第4章  基于监督和半监督的文本情感分类 59
    4.1  引言 59
    4.2  常用的监督和半监督文本分类算法 60
    4.2.1  常用文本分类算法 61
    4.2.2  半监督文本分类算法 63
    4.3  文本情感分类的研究现状 66
    4.3.1  主客观分类 66
    4.3.2  情感极性分类 66
    4.4  基于带先验的最大熵歌词情感分类 68
    4.4.1  相关工作 68
    4.4.2  歌词语料集统计信息 69
    4.4.3  算法描述 71
    4.4.4  实验及分析 74
    4.5  基于图的半监督学习文本情感分类算法 76
    4.5.1  算法描述 77
    4.5.2  实验及分析 79
    4.6  小结 82
    参考文献 82
    第5章  文本观点检索研究 89
    5.1  引言 89
    5.2  相关研究 89
    5.3  文本观点检索系统设计与评测 90
    5.3.1  COAE2008观点检索任务、数据及相关评测指标 91
    5.3.2  文本观点检索系统 92
    5.4  小结 96
    参考文献 96
    第6章  总结与展望 99
    6.1  本文的工作总结 99
    6.2  未来的工作展望 101
  • 内容简介:
    随着互联网和通讯网的迅猛发展,网络文本成为信息的主要载体及人们生活中不可或缺的主要信息来源,文本挖掘技术的研究意义和实用价值越来越突出。另一方面,随着Web 2.0时代的到来,出现了越来越多的由用户创作的网络数字内容。用户数字内容的大量产生和传播使得短文本计算、Web文本信息抽取、文本情感分析等逐渐成为Web文本挖掘研究的热点问题。本书从Web文本的信息抽取、聚类、分类、信息检索等技术出发,与读者分享作者多年的研究和开发经验。
  • 作者简介:
    何慧,女,华北电力大学(北京)控制与计算机工程学院讲师,加拿大蒙特利尔大学计算机学院访问学者,主要科研领域为机器学习、自然语言处理。
  • 目录:
    目    录
    第1章  概论 1
    1.1  研究的背景和意义 1
    1.2  文本挖掘相关技术概述及研究现状 2
    1.2.1  文本分类概述及研究现状 3
    1.2.2  文本聚类概述及研究现状 5
    1.2.3  信息抽取概述及研究现状 6
    1.2.4  文本检索概述及研究现状 7
    1.3  文本挖掘领域亟待解决的问题 8
    1.4  本书的研究内容与结构安排 11
    参考文献 13
    第2章  基于统计语言模型的短文本计算 18
    2.1  引言 18
    2.2  文本信息处理基础知识 19
    2.2.1  文本的表示 19
    2.2.2  特征选择 21
    2.3  基于N-gram的特征提取和RPCL的短文本聚类算法 22
    2.3.1  相关工作 23
    2.3.2  算法描述 23
    2.3.3  实验及分析 28
    2.4  小结 31
    参考文献 31
    第3章  面向广告推荐和情感分析的Web文本信息抽取 35
    3.1  引言 35
    3.2  信息抽取常用算法和模型 36
    3.2.1  N-gram语言模型 36
    3.2.2  隐马尔可夫模型 37
    3.2.3  最大熵模型 38
    3.3  基于隐马尔科夫模型的半监督中文复合词抽取算法 41
    3.3.1  相关工作 42
    3.3.2  算法描述 42
    3.3.3  实验及分析 46
    3.4  基于最大熵和LMR模板的中文情感词抽取算法 48
    3.4.1  相关工作 49
    3.4.2  算法描述 50
    3.4.3  实验及分析 51
    3.5  小结 55
    参考文献 55
    第4章  基于监督和半监督的文本情感分类 59
    4.1  引言 59
    4.2  常用的监督和半监督文本分类算法 60
    4.2.1  常用文本分类算法 61
    4.2.2  半监督文本分类算法 63
    4.3  文本情感分类的研究现状 66
    4.3.1  主客观分类 66
    4.3.2  情感极性分类 66
    4.4  基于带先验的最大熵歌词情感分类 68
    4.4.1  相关工作 68
    4.4.2  歌词语料集统计信息 69
    4.4.3  算法描述 71
    4.4.4  实验及分析 74
    4.5  基于图的半监督学习文本情感分类算法 76
    4.5.1  算法描述 77
    4.5.2  实验及分析 79
    4.6  小结 82
    参考文献 82
    第5章  文本观点检索研究 89
    5.1  引言 89
    5.2  相关研究 89
    5.3  文本观点检索系统设计与评测 90
    5.3.1  COAE2008观点检索任务、数据及相关评测指标 91
    5.3.2  文本观点检索系统 92
    5.4  小结 96
    参考文献 96
    第6章  总结与展望 99
    6.1  本文的工作总结 99
    6.2  未来的工作展望 101
查看详情
相关图书 / 更多
Web文本挖掘技术理论与应用
Web前端开发与项目实践
魏慧;胡沁涵
Web文本挖掘技术理论与应用
Web前端设计
王珊
Web文本挖掘技术理论与应用
Web应用开发技术(微课版)
白磊
Web文本挖掘技术理论与应用
Web 3.0:打造良好体验的品牌方法论
施襄 著
Web文本挖掘技术理论与应用
Web API设计原则通过API和微服务实现价值交付
(美)詹姆斯·希金博特姆(James Higginbotham)
Web文本挖掘技术理论与应用
Weir & Abrahams 人体解剖影像图谱(第6版)
袁慧书 著
Web文本挖掘技术理论与应用
Web3.0:数字时代赋能与变革
贾新峰
Web文本挖掘技术理论与应用
Web3.0:构建数字经济新未来
翟振林
Web文本挖掘技术理论与应用
Web前端开发基础
韩少云、王春梅 著
Web文本挖掘技术理论与应用
Web3.0时代:创新思维赋能数字未来
徐俊
Web文本挖掘技术理论与应用
Web前端开发实战
郭凯;孔繁玉;张有宽
Web文本挖掘技术理论与应用
Web前端设计基础(第2版)
李立威;薛晓霞;王晓红;李丹丹;王艳娥