Web知识挖掘

Web知识挖掘
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
出版社: 科学出版社
2010-06
版次: 1
ISBN: 9787030274991
定价: 50.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 336页
字数: 403千字
正文语种: 简体中文
  • 《Web知识挖掘:理论、方法与应用》是一部关于Web知识挖掘的比较系统、完整,且理论和实践相结合的著作,共含7章:第1章与第2章是Web知识挖掘概论,其中,第1章总体上对Web知识挖掘的现状、概念、典型方法、应用领域以及面临的挑战进行综述性说明;第2章介绍了Web知识挖掘的预备知识、分类体系、基本流程等内容。第3~6章是Web知识挖掘的理论与方法,分别论述了Web爬取、Web结构挖掘、内容挖掘、日志挖掘相关理论与方法,并系统总结了我们自己在元数据、概念、知识元等多个层次上的知识获取以及个性化知识服务等方面的工作。第7章是Web知识挖掘的实践与应用实例,以实例对Web结构挖掘、日志挖掘及内容挖掘的应用进行了说明。
    《Web知识挖掘:理论、方法与应用》不仅系统地介绍了Web知识挖掘领域的基础理论与方法,也阐述了我们在该领域的创新性工作,因而适合不同类型与层次的研究人员及学生。
    《Web知识挖掘:理论、方法与应用》可作为信息领域的科研与工程技术人员的参考书,也可作为计算机与相关专业的研究生和高年级本科生的教材或辅导书目。 前言
    第1章Web挖掘概述
    1.1Web发展历史与现状
    1.1.1Web技术发展
    1.1.2Web上的信息爆炸
    1.2Web挖掘的概念
    1.2.1典型的Web挖掘定义
    1.2.2Web挖掘与数据挖掘、信息检索、信息抽取的区别
    1.3Web挖掘面临的挑战
    1.3.1Web数据的高度复杂性
    1.3.2Web数据检索的局限性
    1.4Web挖掘的研究方向
    1.5小结

    第2章Web挖掘的基础知识
    2.1Web挖掘的主要预备知识
    2.1.1数据挖掘
    2.1.2文本挖掘
    2.1.3信息检索
    2.2Web挖掘分类
    2.2.1Web数据的分类体系
    2.2.2Web挖掘分类
    2.3Web挖掘的主要应用
    2.4Web挖掘的基本流程
    2.4.1数据采集
    2.4.2数据预处理
    2.4.3模式挖掘
    2.4.4模式评估
    2.5Web挖掘领域的重要文献、国际期刊与会议、标准规范
    2.5.1Web挖掘领域的重要文献
    2.5.2Web挖掘相关的国际期刊与国际会议
    2.5.3Web挖掘相关的标准、规范及语言
    2.6小结

    第3章Web爬取与页面组织管理
    3.1Web爬取概述
    3.1.1Web爬取的分类
    3.1.2Web爬取的基本原理
    3.1.3Web爬取面临的挑战
    3.2Web爬取中的主要技术问题
    3.2.1爬取次序
    3.2.2爬取性能问题
    3.2.3爬取礼貌性问题
    3.3隐含Web爬取
    3.3.1隐含Web爬虫框架及工作机理
    3.3.2表单分析与提交
    3.3.3隐含Web爬虫实例HiWE
    3.4面向主题的Web爬取
    3.4.1主题相关度分析
    3.4.2确定下个访问URL
    3.4.3面向主题爬取的爬虫实例
    3.5爬取页面的存储与管理
    3.5.1爬取文档的特点
    3.5.2爬取文档的存储方法
    3.5.3爬取文档的管理
    3.6小结

    第4章Web结构挖掘
    4.1Web结构挖掘概述
    4.1.1Web结构挖掘的分类
    4.1.2Web结构挖掘的应用
    4.2PageRank算法
    4.2.1超链接分析的假设
    4.2.2随机冲浪(randomsurfing)模型
    4.2.3PageRank值的计算
    4.2.4PageRank算法的改进
    4.2.5PageRank算法在Google中的应用
    4.3HITS算法
    4.3.1HITS算法的基本思想
    4.3.2HITS算法具体过程
    4.3.3HITS算法与PageRank算法的对比
    4.3.4HITS算法改进
    4.4Hilltop算法
    4.4.1Hilltop算法基本思想
    4.4.2专家页面选取及分值计算
    4.4.3目标页面选取及分值计算
    4.4.4PageRank算法和Hilltop算法区别
    4.4.5Hilltop算法的缺陷
    4.5Web宏观结构特性分析
    4.5.1Web的无尺度特性
    4.5.2Web的小世界(smallworld)特性
    4.5.3“蝴蝶结”和“日冕”现象
    4.5.4Web宏观结构特性的主要应用
    4.6小结

    第5章Web内容挖掘
    5.1Web页面的特征表示
    5.1.1特征表示的基本原理
    5.1.2特征的离散化
    5.1.3Web页面特征分析
    5.1.4页面文本建模
    5.2Web页面分类
    5.2.1分类方法综述
    5.2.2基于内容的网页分类
    5.3Web页面聚类
    5.3.1聚类方法综述
    5.3.2基于内容的页面聚类
    5.4面向Web的信息抽取
    5.4.1信息抽取概述
    5.4.2命名实体识别
    5.4.3实体关系检测
    5.4.4页面元数据抽取
    5.5面向Web的本体学习
    5.5.1面向文本的本体学习概述
    5.5.2概念获取
    5.5.3概念关系获取
    5.5.4试验结果与分析
    5.6面向Web的知识元及其关联抽取
    5.6.1知识元及其关联抽取概述
    5.6.2知识元抽取
    5.6.3知识元前序关系抽取
    5.7多媒体数据挖掘
    5.7.1图像数据的挖掘
    5.7.2视频数据的挖掘
    5.7.3音频数据的挖掘
    5.8Web内容挖掘的未来研究方向
    5.9小结

    第6章Web日志挖掘
    6.1Web日志挖掘概述
    6.1.1Web日志挖掘的分类
    6.1.2Web日志挖掘的典型应用
    6.1.3Web日志挖掘的流程
    6.2Web日志预处理
    6.2.1Web日志数据的格式
    6.2.2Web日志数据清洗
    6.2.3用户识别和会话识别
    6.2.4访问路径填充
    6.2.5事务识别
    6.3序列模式挖掘
    6.3.1序列模式的定义
    6.3.2GSP算法
    6.3.3PrefixSpan算法
    6.4Web用户行为模式挖掘
    6.4.1研究现状
    6.4.2相关概念
    6.4.3用户行为模式挖掘工作机理
    6.5Web用户个性挖掘
    6.5.1个性挖掘的基本概念
    6.5.2个性属性归并
    6.S.3用户个性聚类
    6.5.4个性特征与行为的关联规则分析
    6.5.5个性特征的获取
    6.5.6实例
    6.6Web用户兴趣感知
    6.6.1研究现状
    6.6.2基于建构主义的学习兴趣感知
    6.6.3用户兴趣模型的表示和更新
    6.6.4用户兴趣感知举例
    6.7Web日志挖掘的未来研究方向
    6.8小结

    第7章Web挖掘的应用实例
    7.1应用1:面向网络学习的学习者个性挖掘
    7.1.1学习者模型和数据收集
    7.1.2学习者个性挖掘机理
    7.1.3PELDIS工作流程
    7.1.4个性挖掘实例
    7.2应用2:海量Web资源中的知识处理与服务
    7.2.1体系结构与工作机理
    7.2.2基于主题图的Web资源组织与管理
    7.2.3主题图的自动生成
    7.2.4多维关联索引构建与检索结果的个性化排序
    7.2.5个性化资源推荐与导航
    7.2.6基于SOA的Yotta系统实现
    7.3小结
    参考文献
  • 内容简介:
    《Web知识挖掘:理论、方法与应用》是一部关于Web知识挖掘的比较系统、完整,且理论和实践相结合的著作,共含7章:第1章与第2章是Web知识挖掘概论,其中,第1章总体上对Web知识挖掘的现状、概念、典型方法、应用领域以及面临的挑战进行综述性说明;第2章介绍了Web知识挖掘的预备知识、分类体系、基本流程等内容。第3~6章是Web知识挖掘的理论与方法,分别论述了Web爬取、Web结构挖掘、内容挖掘、日志挖掘相关理论与方法,并系统总结了我们自己在元数据、概念、知识元等多个层次上的知识获取以及个性化知识服务等方面的工作。第7章是Web知识挖掘的实践与应用实例,以实例对Web结构挖掘、日志挖掘及内容挖掘的应用进行了说明。
    《Web知识挖掘:理论、方法与应用》不仅系统地介绍了Web知识挖掘领域的基础理论与方法,也阐述了我们在该领域的创新性工作,因而适合不同类型与层次的研究人员及学生。
    《Web知识挖掘:理论、方法与应用》可作为信息领域的科研与工程技术人员的参考书,也可作为计算机与相关专业的研究生和高年级本科生的教材或辅导书目。
  • 目录:
    前言
    第1章Web挖掘概述
    1.1Web发展历史与现状
    1.1.1Web技术发展
    1.1.2Web上的信息爆炸
    1.2Web挖掘的概念
    1.2.1典型的Web挖掘定义
    1.2.2Web挖掘与数据挖掘、信息检索、信息抽取的区别
    1.3Web挖掘面临的挑战
    1.3.1Web数据的高度复杂性
    1.3.2Web数据检索的局限性
    1.4Web挖掘的研究方向
    1.5小结

    第2章Web挖掘的基础知识
    2.1Web挖掘的主要预备知识
    2.1.1数据挖掘
    2.1.2文本挖掘
    2.1.3信息检索
    2.2Web挖掘分类
    2.2.1Web数据的分类体系
    2.2.2Web挖掘分类
    2.3Web挖掘的主要应用
    2.4Web挖掘的基本流程
    2.4.1数据采集
    2.4.2数据预处理
    2.4.3模式挖掘
    2.4.4模式评估
    2.5Web挖掘领域的重要文献、国际期刊与会议、标准规范
    2.5.1Web挖掘领域的重要文献
    2.5.2Web挖掘相关的国际期刊与国际会议
    2.5.3Web挖掘相关的标准、规范及语言
    2.6小结

    第3章Web爬取与页面组织管理
    3.1Web爬取概述
    3.1.1Web爬取的分类
    3.1.2Web爬取的基本原理
    3.1.3Web爬取面临的挑战
    3.2Web爬取中的主要技术问题
    3.2.1爬取次序
    3.2.2爬取性能问题
    3.2.3爬取礼貌性问题
    3.3隐含Web爬取
    3.3.1隐含Web爬虫框架及工作机理
    3.3.2表单分析与提交
    3.3.3隐含Web爬虫实例HiWE
    3.4面向主题的Web爬取
    3.4.1主题相关度分析
    3.4.2确定下个访问URL
    3.4.3面向主题爬取的爬虫实例
    3.5爬取页面的存储与管理
    3.5.1爬取文档的特点
    3.5.2爬取文档的存储方法
    3.5.3爬取文档的管理
    3.6小结

    第4章Web结构挖掘
    4.1Web结构挖掘概述
    4.1.1Web结构挖掘的分类
    4.1.2Web结构挖掘的应用
    4.2PageRank算法
    4.2.1超链接分析的假设
    4.2.2随机冲浪(randomsurfing)模型
    4.2.3PageRank值的计算
    4.2.4PageRank算法的改进
    4.2.5PageRank算法在Google中的应用
    4.3HITS算法
    4.3.1HITS算法的基本思想
    4.3.2HITS算法具体过程
    4.3.3HITS算法与PageRank算法的对比
    4.3.4HITS算法改进
    4.4Hilltop算法
    4.4.1Hilltop算法基本思想
    4.4.2专家页面选取及分值计算
    4.4.3目标页面选取及分值计算
    4.4.4PageRank算法和Hilltop算法区别
    4.4.5Hilltop算法的缺陷
    4.5Web宏观结构特性分析
    4.5.1Web的无尺度特性
    4.5.2Web的小世界(smallworld)特性
    4.5.3“蝴蝶结”和“日冕”现象
    4.5.4Web宏观结构特性的主要应用
    4.6小结

    第5章Web内容挖掘
    5.1Web页面的特征表示
    5.1.1特征表示的基本原理
    5.1.2特征的离散化
    5.1.3Web页面特征分析
    5.1.4页面文本建模
    5.2Web页面分类
    5.2.1分类方法综述
    5.2.2基于内容的网页分类
    5.3Web页面聚类
    5.3.1聚类方法综述
    5.3.2基于内容的页面聚类
    5.4面向Web的信息抽取
    5.4.1信息抽取概述
    5.4.2命名实体识别
    5.4.3实体关系检测
    5.4.4页面元数据抽取
    5.5面向Web的本体学习
    5.5.1面向文本的本体学习概述
    5.5.2概念获取
    5.5.3概念关系获取
    5.5.4试验结果与分析
    5.6面向Web的知识元及其关联抽取
    5.6.1知识元及其关联抽取概述
    5.6.2知识元抽取
    5.6.3知识元前序关系抽取
    5.7多媒体数据挖掘
    5.7.1图像数据的挖掘
    5.7.2视频数据的挖掘
    5.7.3音频数据的挖掘
    5.8Web内容挖掘的未来研究方向
    5.9小结

    第6章Web日志挖掘
    6.1Web日志挖掘概述
    6.1.1Web日志挖掘的分类
    6.1.2Web日志挖掘的典型应用
    6.1.3Web日志挖掘的流程
    6.2Web日志预处理
    6.2.1Web日志数据的格式
    6.2.2Web日志数据清洗
    6.2.3用户识别和会话识别
    6.2.4访问路径填充
    6.2.5事务识别
    6.3序列模式挖掘
    6.3.1序列模式的定义
    6.3.2GSP算法
    6.3.3PrefixSpan算法
    6.4Web用户行为模式挖掘
    6.4.1研究现状
    6.4.2相关概念
    6.4.3用户行为模式挖掘工作机理
    6.5Web用户个性挖掘
    6.5.1个性挖掘的基本概念
    6.5.2个性属性归并
    6.S.3用户个性聚类
    6.5.4个性特征与行为的关联规则分析
    6.5.5个性特征的获取
    6.5.6实例
    6.6Web用户兴趣感知
    6.6.1研究现状
    6.6.2基于建构主义的学习兴趣感知
    6.6.3用户兴趣模型的表示和更新
    6.6.4用户兴趣感知举例
    6.7Web日志挖掘的未来研究方向
    6.8小结

    第7章Web挖掘的应用实例
    7.1应用1:面向网络学习的学习者个性挖掘
    7.1.1学习者模型和数据收集
    7.1.2学习者个性挖掘机理
    7.1.3PELDIS工作流程
    7.1.4个性挖掘实例
    7.2应用2:海量Web资源中的知识处理与服务
    7.2.1体系结构与工作机理
    7.2.2基于主题图的Web资源组织与管理
    7.2.3主题图的自动生成
    7.2.4多维关联索引构建与检索结果的个性化排序
    7.2.5个性化资源推荐与导航
    7.2.6基于SOA的Yotta系统实现
    7.3小结
    参考文献
查看详情
您可能感兴趣 / 更多
Web知识挖掘
Web应用开发技术(微课版)
白磊
Web知识挖掘
Web API设计原则通过API和微服务实现价值交付
(美)詹姆斯·希金博特姆(James Higginbotham)
Web知识挖掘
Weir & Abrahams 人体解剖影像图谱(第6版)
袁慧书 著
Web知识挖掘
Web3.0:数字时代赋能与变革
贾新峰
Web知识挖掘
Web3:科技新趋势(拥抱数字化变革,打造Web 3时代商业新生态)
(美)克里斯·达菲
Web知识挖掘
Web3.0:构建数字经济新未来
翟振林
Web知识挖掘
Web渗透测试从新手到高手(微课超值版)
网络安全技术联盟
Web知识挖掘
Weird But True Christmas 300 Festive Facts to Light Up the Holidays
National Kids
Web知识挖掘
Web前端开发基础案例教程
赵革委
Web知识挖掘
Web地理信息课程建设与服务模式研究(精)
秦耀辰、闫卫阳、夏浩铭、付品德、秦奋 著
Web知识挖掘
Web3.0应用开发实战(从Web 2.0到Web 3.0)
屈希峰 编
Web知识挖掘
Web前端设计基础(第2版)
李立威;薛晓霞;王晓红;李丹丹;王艳娥
系列丛书 / 更多
Web知识挖掘
Web应用开发技术(微课版)
白磊
Web知识挖掘
Web API设计原则通过API和微服务实现价值交付
(美)詹姆斯·希金博特姆(James Higginbotham)
Web知识挖掘
Weir & Abrahams 人体解剖影像图谱(第6版)
袁慧书 著
Web知识挖掘
Web3.0:数字时代赋能与变革
贾新峰
Web知识挖掘
Web3:科技新趋势(拥抱数字化变革,打造Web 3时代商业新生态)
(美)克里斯·达菲
Web知识挖掘
Web3.0:构建数字经济新未来
翟振林
Web知识挖掘
Web渗透测试从新手到高手(微课超值版)
网络安全技术联盟
Web知识挖掘
Weird But True Christmas 300 Festive Facts to Light Up the Holidays
National Kids
Web知识挖掘
Web前端开发基础案例教程
赵革委
Web知识挖掘
Web地理信息课程建设与服务模式研究(精)
秦耀辰、闫卫阳、夏浩铭、付品德、秦奋 著
Web知识挖掘
Web3.0应用开发实战(从Web 2.0到Web 3.0)
屈希峰 编
Web知识挖掘
Web前端设计基础(第2版)
李立威;薛晓霞;王晓红;李丹丹;王艳娥
相关图书 / 更多
Web知识挖掘
Web应用开发技术(微课版)
白磊
Web知识挖掘
Web API设计原则通过API和微服务实现价值交付
(美)詹姆斯·希金博特姆(James Higginbotham)
Web知识挖掘
Weir & Abrahams 人体解剖影像图谱(第6版)
袁慧书 著
Web知识挖掘
Web3.0:数字时代赋能与变革
贾新峰
Web知识挖掘
Web3:科技新趋势(拥抱数字化变革,打造Web 3时代商业新生态)
(美)克里斯·达菲
Web知识挖掘
Web3.0:构建数字经济新未来
翟振林
Web知识挖掘
Web渗透测试从新手到高手(微课超值版)
网络安全技术联盟
Web知识挖掘
Weird But True Christmas 300 Festive Facts to Light Up the Holidays
National Kids
Web知识挖掘
Web前端开发基础案例教程
赵革委
Web知识挖掘
Web地理信息课程建设与服务模式研究(精)
秦耀辰、闫卫阳、夏浩铭、付品德、秦奋 著
Web知识挖掘
Web3.0应用开发实战(从Web 2.0到Web 3.0)
屈希峰 编
Web知识挖掘
Web前端设计基础(第2版)
李立威;薛晓霞;王晓红;李丹丹;王艳娥