海量文本数据的多维挖掘

海量文本数据的多维挖掘
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] (Chao Zhang) , ,
2020-07
版次: 1
ISBN: 9787111659907
定价: 79.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 184页
9人买过
  • 本书由国际数据挖掘领域泰斗、UIUC韩家玮教授和其学生张超博士(现为佐治亚理工学院助理教授)合著。介绍了将非结构化文本数据转换为多维知识的数据挖掘技术,并讲解了他们开发的文本多维数据集框架的原理和使用方法。 译者序 


    作者简介 


    译者简介 


    第1章 引言 1 


    11 概述 1 


    12 主要部分 3 


    121 第一部分:立方体构造 3 


    122 第二部分:立方体开发 5 


    123 示例应用 5 


    13 技术路线 6 


    131 任务1:分类器生成 7 


    132 任务2:文档分配 8 


    133 任务3:多维摘要 8 


    134 任务4:跨维度预测 9 


    135 任务5:异常事件检测 9 


    136 小结 9 


    14 本书大纲 10 


    第一部分 立方体构造算法 


    第2章 主题级分类器生成 12 


    21 概述 12 


    22 相关工作 15 


    221 监督分类器学习 15 


    222 基于模式的提取 15 


    223 基于聚类的分类器构建 16 


    23 准备工作 17 


    231 问题定义 17 


    232 方法概述 17 


    24 自适应词聚类 18 


    241 划分主题的球形聚类 18 


    242 识别代表性词语 20 


    25 自适应词嵌入 21 


    251 分布式词语表示 21 


    252 学习局部词嵌入 21 


    26 实验评估 22 


    261 实验设计 22 


    262 定性结果 24 


    263 定量分析 27 


    27 小结 29 


    第3章 词语级分类器生成 30 


    31 概述 30 


    32 相关工作 32 


    33 问题定义 33 


    34 HiExpan框架 33 


    341 框架概述 33 


    342 关键词提取 34 


    343 层次树扩展 34 


    344 分类器全局优化 41 


    35 实验 42 


    351 实验设计 42 


    352 定性结果 43 


    353 定量结果 44 


    36 小结 47 


    第4章 弱监督文本分类 48 


    41 概述 48 


    42 相关工作 51 


    421 潜在变量模型 51 


    422 基于嵌入的模型 51 


    43 准备工作 52 


    431 问题定义 52 


    432 方法概述 53 


    44 伪文档生成 53 


    441 建模类分布 53 


    442 生成伪文档 55 


    45 自训练的神经模型 56 


    451 神经模型预训练 56 


    452 神经模型自训练 57 


    453 基于CNN和RNN的实例化 58 


    46 实验 59 


    461 数据集 59 


    462 基线 59 


    463 实验设计 60 


    464 实验结果 61 


    465 参数研究 65 


    466 案例研究 67 


    47 小结 68 


    第5章 弱监督层次文本分类 69 


    51 概述 69 


    52 相关工作 71 


    521 弱监督文本分类 71 


    522 层次文本分类 71 


    53 问题定义 72 


    54 伪文档生成 72 


    55 层次分类模型 74 


    551 局部分类器预训练 75 


    552 全局分类器自训练 75 


    553 阻断机制 77 


    554 推导 77 


    555 算法概述 77 


    56 实验 78 


    561 实验设计 78 


    562 定量比较 80 


    563 组件评估 82 


    57 小结 84 


    第二部分 立方体开发算法 


    第6章 多维摘要 86 


    61 概述 86 


    62 相关工作 89 


    63 准备工作 90 


    631 文本立方体准备 90 


    632 问题定义 91 


    64 排名度量 91 


    641 普遍性和完整性 92 


    642 邻域敏感的独特性 92 


    65 RepPhrase方法 96 


    651 简介 96 


    652 混合离线物化 97 


    653 最优在线处理 100 


    66 实验 101 


    661 实验设计 101 


    662 有效性评估 103 


    663 效率评估 107 


    67 小结 111 


    第7章 立方体空间中的跨维度预测 112 


    71 概述 112 


    72 相关工作 114 


    73 准备工作 115 


    731 问题描述 115 


    732 方法概述 115 


    74 半监督多模态嵌入 117 


    741 无监督重构任务 117 


    742 监督分类任务 119 


    743 优化程序 119 


    75 多模态嵌入的在线更新 120 


    751 生命衰减学习 120 


    752 基于约束的学习 121 


    753 复杂度分析 124 


    76 实验 124 


    761 实验设计 124 


    762 定量比较 127 


    763 案例研究 129 


    764 参数影响 132 


    765 下游应用 134 


    77 小结 135 


    第8章 立方体空间中的事件检测 136 


    81 概述 136 


    82 相关工作 138 


    821 突发事件检测 138 


    822 时空事件检测 139 


    83 准备工作 140 


    831 问题定义 140 


    832 方法概述 140 


    833 多模态嵌入 142 


    84 候选生成 143 


    841 贝叶斯混合聚类模型 144 


    842 参数评估 145 


    85 候选分类 146 


    851 多模态嵌入的特征推导 146 


    852 分类过程 147 


    86 支持持续的事件检测 147 


    87 复杂度分析 148 


    88 实验 148 


    881 实验设计 148 


    882 定性结果 150 


    883 定量结果 153 


    884 可扩展性研究 154 


    885 特征的重要性 155 


    89 小结 156 


    第9章 结论 157 


    91 总结 157 


    92 未来工作 158 


    参考文献 160
  • 内容简介:
    本书由国际数据挖掘领域泰斗、UIUC韩家玮教授和其学生张超博士(现为佐治亚理工学院助理教授)合著。介绍了将非结构化文本数据转换为多维知识的数据挖掘技术,并讲解了他们开发的文本多维数据集框架的原理和使用方法。
  • 目录:
    译者序 


    作者简介 


    译者简介 


    第1章 引言 1 


    11 概述 1 


    12 主要部分 3 


    121 第一部分:立方体构造 3 


    122 第二部分:立方体开发 5 


    123 示例应用 5 


    13 技术路线 6 


    131 任务1:分类器生成 7 


    132 任务2:文档分配 8 


    133 任务3:多维摘要 8 


    134 任务4:跨维度预测 9 


    135 任务5:异常事件检测 9 


    136 小结 9 


    14 本书大纲 10 


    第一部分 立方体构造算法 


    第2章 主题级分类器生成 12 


    21 概述 12 


    22 相关工作 15 


    221 监督分类器学习 15 


    222 基于模式的提取 15 


    223 基于聚类的分类器构建 16 


    23 准备工作 17 


    231 问题定义 17 


    232 方法概述 17 


    24 自适应词聚类 18 


    241 划分主题的球形聚类 18 


    242 识别代表性词语 20 


    25 自适应词嵌入 21 


    251 分布式词语表示 21 


    252 学习局部词嵌入 21 


    26 实验评估 22 


    261 实验设计 22 


    262 定性结果 24 


    263 定量分析 27 


    27 小结 29 


    第3章 词语级分类器生成 30 


    31 概述 30 


    32 相关工作 32 


    33 问题定义 33 


    34 HiExpan框架 33 


    341 框架概述 33 


    342 关键词提取 34 


    343 层次树扩展 34 


    344 分类器全局优化 41 


    35 实验 42 


    351 实验设计 42 


    352 定性结果 43 


    353 定量结果 44 


    36 小结 47 


    第4章 弱监督文本分类 48 


    41 概述 48 


    42 相关工作 51 


    421 潜在变量模型 51 


    422 基于嵌入的模型 51 


    43 准备工作 52 


    431 问题定义 52 


    432 方法概述 53 


    44 伪文档生成 53 


    441 建模类分布 53 


    442 生成伪文档 55 


    45 自训练的神经模型 56 


    451 神经模型预训练 56 


    452 神经模型自训练 57 


    453 基于CNN和RNN的实例化 58 


    46 实验 59 


    461 数据集 59 


    462 基线 59 


    463 实验设计 60 


    464 实验结果 61 


    465 参数研究 65 


    466 案例研究 67 


    47 小结 68 


    第5章 弱监督层次文本分类 69 


    51 概述 69 


    52 相关工作 71 


    521 弱监督文本分类 71 


    522 层次文本分类 71 


    53 问题定义 72 


    54 伪文档生成 72 


    55 层次分类模型 74 


    551 局部分类器预训练 75 


    552 全局分类器自训练 75 


    553 阻断机制 77 


    554 推导 77 


    555 算法概述 77 


    56 实验 78 


    561 实验设计 78 


    562 定量比较 80 


    563 组件评估 82 


    57 小结 84 


    第二部分 立方体开发算法 


    第6章 多维摘要 86 


    61 概述 86 


    62 相关工作 89 


    63 准备工作 90 


    631 文本立方体准备 90 


    632 问题定义 91 


    64 排名度量 91 


    641 普遍性和完整性 92 


    642 邻域敏感的独特性 92 


    65 RepPhrase方法 96 


    651 简介 96 


    652 混合离线物化 97 


    653 最优在线处理 100 


    66 实验 101 


    661 实验设计 101 


    662 有效性评估 103 


    663 效率评估 107 


    67 小结 111 


    第7章 立方体空间中的跨维度预测 112 


    71 概述 112 


    72 相关工作 114 


    73 准备工作 115 


    731 问题描述 115 


    732 方法概述 115 


    74 半监督多模态嵌入 117 


    741 无监督重构任务 117 


    742 监督分类任务 119 


    743 优化程序 119 


    75 多模态嵌入的在线更新 120 


    751 生命衰减学习 120 


    752 基于约束的学习 121 


    753 复杂度分析 124 


    76 实验 124 


    761 实验设计 124 


    762 定量比较 127 


    763 案例研究 129 


    764 参数影响 132 


    765 下游应用 134 


    77 小结 135 


    第8章 立方体空间中的事件检测 136 


    81 概述 136 


    82 相关工作 138 


    821 突发事件检测 138 


    822 时空事件检测 139 


    83 准备工作 140 


    831 问题定义 140 


    832 方法概述 140 


    833 多模态嵌入 142 


    84 候选生成 143 


    841 贝叶斯混合聚类模型 144 


    842 参数评估 145 


    85 候选分类 146 


    851 多模态嵌入的特征推导 146 


    852 分类过程 147 


    86 支持持续的事件检测 147 


    87 复杂度分析 148 


    88 实验 148 


    881 实验设计 148 


    882 定性结果 150 


    883 定量结果 153 


    884 可扩展性研究 154 


    885 特征的重要性 155 


    89 小结 156 


    第9章 结论 157 


    91 总结 157 


    92 未来工作 158 


    参考文献 160
查看详情
您可能感兴趣 / 更多
海量文本数据的多维挖掘
语言恶女:女性如何夺回语言
[美]阿曼达·蒙特尔/著李辛/译
海量文本数据的多维挖掘
过劳:好工作是如何变坏的
[美]艾琳·L.凯利(Erin;L.Kelly;[美]菲利斯·莫恩((Phyllis;Moen
海量文本数据的多维挖掘
雪花的故事(用照片展示雪花的秘密,为你揭开冬日奇景的奥秘)
[美]马克·卡西诺[美]乔恩·尼尔森
海量文本数据的多维挖掘
进阶书系-国际史的技艺
[美] 马克·特拉亨伯格
海量文本数据的多维挖掘
杜甫传
[美]弗洛伦斯.艾思柯
海量文本数据的多维挖掘
爵士乐史(精装本)
[美]泰德·乔亚 著
海量文本数据的多维挖掘
作家榜名著:夏日走过山间(王芳推荐版本!与《瓦尔登湖》齐名的经典名作!心浮气躁想要逃离现实生活?让大自然的神奇力量瞬间治愈你!)
[美]约翰·缪尔、作家榜经典名 著;刘子超 译
海量文本数据的多维挖掘
环境的科学 (平装版)
[美]威廉·坎宁安 后浪
海量文本数据的多维挖掘
数学侦探 游乐园里的古怪笑脸
[美]丹尼尔·肯尼 艾米丽·博艾尔 著 刘玙婧、王婧 译;小博集出品
海量文本数据的多维挖掘
读懂经济学:提升“财商”、塑造价值观念的经济学读本,一本书参破瞬息万变的经济世界底层逻辑!
[美]霍华德·亚鲁斯 著;赵善江 译;斯坦威 出品
海量文本数据的多维挖掘
数学侦探 神秘路线上的连环追踪
[美]丹尼尔·肯尼 艾米丽·博艾尔 著 刘玙婧、王婧 译;小博集出品
海量文本数据的多维挖掘
陶瓷创意造型新技法(陶艺学习系列丛书)
[美]黛布·施瓦茨科夫 著,张靖靖 译