信息管理专业前沿论丛:中文新闻网页处理与舆情分析

信息管理专业前沿论丛:中文新闻网页处理与舆情分析
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2012-12
版次: 1
ISBN: 9787305110467
定价: 30.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 152页
字数: 183千字
正文语种: 简体中文
分类: 社会文化
2人买过
  •   《信息管理专业前沿论丛:中文新闻网页处理与舆情分析》为面向舆情分析的中文新闻网页处理关键技术研究。 第l章 绪论    l.l研究背景    l.2研究对象    1.3研究现状    1.4研究内容    1.5全书内容安排     参考文献  第2章 中文新闻网页正文抽取     2.1概述    2.2文本密度判别法     2.2.1相关定义及假设    2.2.2 统计分析    z.2.3密度区分阈值     2.3方法实现    2.3.1转换HTML为DOM树  2.3.2获取文本结点    2.3.3计算文本密度    2.3.4判别分析    2.4实验结果及分析    2.4.1实验数据    2.4.2评价指标    2.4.3实验步骤及结果    2.4.4结果分析    2.5本章 小结    参考文献第3章 中文新闻重复网页识别    3.1概述    3.2算法设计    3.2.1重复网页的界定    3.2.2算法思想    3.2.3后缀树    3.2.4 u“Konen算法    3.2.5 Mat e:hing Statistics算法    3.2.6相似度计算    3.3算法实现    3.3.1改进的ukkonen算法    3.3.2改进的Matching Statistic:s算法    3.3.3中文新闻重复网页识别算法    3.4实验结果及分析    3.4.1实验说明    3.4.2评价标准    3.4.3实验结果与分析    3.5本章 小结    参考文献  第4章 中文新闻网页关键词抽取    4.1概述    4.2网页内容及关键词构成分析     4.2.1网页内容分析    4.2.2关键词特征分析    4.3关键词抽取    4.3.1网页正文抽取    4.3.2新闻文本分词    4.3.3综合加权    4.3.4候选关键词组配    4.4实验结果与分析    4.4.1实验数据    4.4.2评价标准    4.4.3实验结果与分析    4.5本章 小结    参考文献  第5章 中文新闻网页自动分类    5.1概述    5.2新闻网页预处理    5 2.1创建新闻分类标注语料库    5.2.2抽取新闻网页正文    5.2.3正文文本分词及创建索引    5.3基于标题的自动分类方法    s.3.1词长加权法     5.3.2简单类目加权法    5.3.3经典类目加权法    5.3.4改进的类目加权法    5.4实验结果与分析    5.4.1性能评价指标    5.4.2实验结果    5.4.3结果分析    5.5本章 小结    参考文献  第6章 中文新闻网页主题聚合    6.1概述    6.2模型设计    6.2.1系统模型     6.2.2系统流程     6.3系统关键技术    6.3.1主题选择模块    6.3.2 RSs Feed初始集合选择模块     6.3.3 RSS聚合模块    6.3.4 RSS Feed分析模块    6.3.5 RSShem分析过滤模块    6.3.6超链接自动提取模块    6.3.7 RSSFeed自动发现模块    6.4系统的实现    6.4.1测试硬件配置    6.4.2测试集的选择    6.4.3系统测试    6.5本章 小结    参考文献  第7章 基于主题的网络舆情分析     7.1概述    7.2模型设计    7.3基于主题的网络舆情分析    7.3.1舆情主题规划    7.3.2舆情信息采集    7.3.3舆情信息分析    7.3.4舆情预警处理    7.4模型实现     7.4.1实现环境    7.4.2技术支撑    7.4.3实现流程    7.4.4测试集的选择    7.4.5测试结果分析    7.5本章小结    参考文献  第8章 结束语    8.1总结    8.2进一步的研究工作附录A 关键词抽取对照数据表   附录B 新闻语料库来源网站   附录C 江苏法院网络舆情分析系统后记
  • 内容简介:
      《信息管理专业前沿论丛:中文新闻网页处理与舆情分析》为面向舆情分析的中文新闻网页处理关键技术研究。
  • 目录:
    第l章 绪论    l.l研究背景    l.2研究对象    1.3研究现状    1.4研究内容    1.5全书内容安排     参考文献  第2章 中文新闻网页正文抽取     2.1概述    2.2文本密度判别法     2.2.1相关定义及假设    2.2.2 统计分析    z.2.3密度区分阈值     2.3方法实现    2.3.1转换HTML为DOM树  2.3.2获取文本结点    2.3.3计算文本密度    2.3.4判别分析    2.4实验结果及分析    2.4.1实验数据    2.4.2评价指标    2.4.3实验步骤及结果    2.4.4结果分析    2.5本章 小结    参考文献第3章 中文新闻重复网页识别    3.1概述    3.2算法设计    3.2.1重复网页的界定    3.2.2算法思想    3.2.3后缀树    3.2.4 u“Konen算法    3.2.5 Mat e:hing Statistics算法    3.2.6相似度计算    3.3算法实现    3.3.1改进的ukkonen算法    3.3.2改进的Matching Statistic:s算法    3.3.3中文新闻重复网页识别算法    3.4实验结果及分析    3.4.1实验说明    3.4.2评价标准    3.4.3实验结果与分析    3.5本章 小结    参考文献  第4章 中文新闻网页关键词抽取    4.1概述    4.2网页内容及关键词构成分析     4.2.1网页内容分析    4.2.2关键词特征分析    4.3关键词抽取    4.3.1网页正文抽取    4.3.2新闻文本分词    4.3.3综合加权    4.3.4候选关键词组配    4.4实验结果与分析    4.4.1实验数据    4.4.2评价标准    4.4.3实验结果与分析    4.5本章 小结    参考文献  第5章 中文新闻网页自动分类    5.1概述    5.2新闻网页预处理    5 2.1创建新闻分类标注语料库    5.2.2抽取新闻网页正文    5.2.3正文文本分词及创建索引    5.3基于标题的自动分类方法    s.3.1词长加权法     5.3.2简单类目加权法    5.3.3经典类目加权法    5.3.4改进的类目加权法    5.4实验结果与分析    5.4.1性能评价指标    5.4.2实验结果    5.4.3结果分析    5.5本章 小结    参考文献  第6章 中文新闻网页主题聚合    6.1概述    6.2模型设计    6.2.1系统模型     6.2.2系统流程     6.3系统关键技术    6.3.1主题选择模块    6.3.2 RSs Feed初始集合选择模块     6.3.3 RSS聚合模块    6.3.4 RSS Feed分析模块    6.3.5 RSShem分析过滤模块    6.3.6超链接自动提取模块    6.3.7 RSSFeed自动发现模块    6.4系统的实现    6.4.1测试硬件配置    6.4.2测试集的选择    6.4.3系统测试    6.5本章 小结    参考文献  第7章 基于主题的网络舆情分析     7.1概述    7.2模型设计    7.3基于主题的网络舆情分析    7.3.1舆情主题规划    7.3.2舆情信息采集    7.3.3舆情信息分析    7.3.4舆情预警处理    7.4模型实现     7.4.1实现环境    7.4.2技术支撑    7.4.3实现流程    7.4.4测试集的选择    7.4.5测试结果分析    7.5本章小结    参考文献  第8章 结束语    8.1总结    8.2进一步的研究工作附录A 关键词抽取对照数据表   附录B 新闻语料库来源网站   附录C 江苏法院网络舆情分析系统后记
查看详情
相关图书 / 更多
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息系统监理师考试32小时通关(第二版)
薛大龙
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息物理系统安全
(澳)萨基卜·阿里,等
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息系统分析与设计
熊伟、陈浩、陈荦
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息论基础(原书第2版·典藏版) [美]托马斯·M.科沃
(美)托马斯·M.科沃 (美)乔伊·A.托马斯
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息系统项目管理师案例分析一本通(第二版)
王树文
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息差:看透大数据背后的底层逻辑
(英) 保罗·古德温 著,文通天下 出品
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息安全工程师考试32小时通关
薛大龙 副主编 王开景 田禾 韩玉
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息安全法研究(第二版)
马民虎 方婷著
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息可视化设计
周承君、姜朝阳、王之娇 著
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息助推,或适得其反--为什么知道的并非越多越好?
(美) 卡斯·R.桑斯坦 著,杨帅华 译
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息学竞赛宝典 数据结构基础
张新华 梁靖韵 刘树明
信息管理专业前沿论丛:中文新闻网页处理与舆情分析
信息学竞赛宝典 动态规划
张新华 胡向荣 伍婉秋