面向互联网的智能信息检索技术研究

面向互联网的智能信息检索技术研究
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
出版社: 科学出版社
2021-11
版次: 1
ISBN: 9787030700643
定价: 129.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 236页
  • 《面向互联网的智能信息检索技术研究》以作者在智能信息检索领域多年的研究工作为基础,总结并梳理了面向互联网的智能信息检索技术的*新前沿进展,从查询意图理解和相关性匹配两个方面着重介绍了智能检索技术研究的脉络和发展,进而通过将智能检索技术应用于智能问答、医疗检索、用户画像和情感计算等多项信息检索和自然语言处理研究实践,分析并探讨了相关技术应用中的研究范式和应用模式,为人工智能和计算机科学与技术专业人士提供智能信息检索技术的全新解读,促进智能信息检索技术的突破与发展。 目录 

    《博士后文库》序言 

    前言 

    第1章 绪论 1 

    1.1 信息检索技术及其发展 1 

    1.2 面向搜索引擎的智能信息检索技术 2 

    1.3 查询意图理解和相关性排序 3 

    1.4 排序学习 4 

    1.4.1 点级排序学习模型 5 

    1.4.2 对级排序学习模型 6 

    1.4.3 列表级排序学习模型 7 

    1.5 智能信息检索评价指标 8 

    1.6 智能信息检索相关应用场景 10 

    1.7 本书研究内容及章节安排 12 

    参考文献 14 

    第2章 基于混合模型的查询意图理解 19 

    2.1 引言 19 

    2.2 相关研究工作 20 

    2.3 查询意图分类模型整体框架 21 

    2.4 查询向量表示 22 

    2.5 基于混合模型的查询意图分类 23 

    2.5.1 面向中间类别的意图匹配 23 

    2.5.2 面向最终分类的查询意图分类 27 

    2.6 查询意图分类方法性能评估 28 

    2.6.1 实验设置 28 

    2.6.2 对比模型和评价指标 28 

    2.6.3 实验结果与分析 29 

    2.7 本章小结 30 

    参考文献 31 

    第3章 面向生物医学文本检索的监督式查询扩展 34 

    3.1 引言 34 

    3.2 相关研究工作 35 

    3.3 监督式生物医学扩展词排序方法 36 

    3.3.1 方法整体流程 36 

    3.3.2 候选扩展词抽取 37 

    3.3.3 词项标注策略 37 

    3.3.4 词特征抽取 38 

    3.3.5 排序模型构建 41 

    3.4 监督式查询扩展方法性能评估 43 

    3.4.1 实验设置 43 

    3.4.2 标注策略性能评估 44 

    3.4.3 扩展词特征性能评估 44 

    3.4.4 损失函数性能评估 45 

    3.4.5 整体检索性能 45 

    3.4.6 实验结果与分析 47 

    3.5 本章小结 48 

    参考文献 48 

    第4章 排序学习文档特征生成 51 

    4.1 引言 51 

    4.2 相关研究工作 52 

    4.3 基于查询级半监督自编码器的排序模型 54 

    4.3.1 降噪自编码器 54 

    4.3.2 基于Bregman散度的损失函数 55 

    4.3.3 查询约束 56 

    4.4 半监督自编码排序方法性能评估 58 

    4.4.1 实验设置 58 

    4.4.2 多种自编码器强化的排序性能对比 59 

    4.4.3 多种排序学习方法的性能对比 61 

    4.4.4 与深度排序模型的检索性能对比 62 

    4.4.5 特征维度对实验性能的影响 64 

    4.4.6 讨论 64 

    4.5 本章小结 65 

    参考文献 65 

    第5章 直接优化信息检索评价指标的排序学习算法 70 

    5.1 引言 70 

    5.2 相关研究工作 72 

    5.3 信息检索评价指标 73 

    5.3.1 平均排序倒数 73 

    5.3.2 期望倒数排序 73 

    5.3.3 Q-measure评价指标 74 

    5.4 基于AdaRank的排序特征生成方法 75 

    5.4.1 特征生成框架 75 

    5.4.2 基于AdaRank直接优化信息检索评价指标 77 

    5.4.3 基于标准数据集的特征生成框架 79 

    5.5 直接优化评价指标排序方法性能评估 79 

    5.5.1 语料库 79 

    5.5.2 实验设置 80 

    5.5.3 所提出三种排序算法的性能评估 80 

    5.5.4 对生成特征集的评价 83 

    5.5.5 对组合特征集的评价 86 

    5.5.6 实验分析与讨论 86 

    5.6 本章小结 87 

    参考文献 88 

    第6章 融合多重损失函数的排序学习模型 91 

    6.1 引言 91 

    6.2 相关研究工作 92 

    6.3 问题定义 92 

    6.4 融合多重损失函数的排序学习 94 

    6.4.1 多种候选损失函数 94 

    6.4.2 基于梯度下降的损失优化 95 

    6.4.3 基于加权损失函数的重要性进行排序 96 

    6.5 多重损失函数融合排序方法性能评估 98 

    6.5.1 数据集和实验设置 98 

    6.5.2 对级损失函数选择 98 

    6.5.3 列表级损失函数选择 99 

    6.5.4 正则加权策略的效果评估 99 

    6.5.5 迭代敏感加权策略的效果评估 100 

    6.5.6 接力加权策略的效果评估 100 

    6.5.7 整体性能比较 101 

    6.5.8 与其他算法的比较 103 

    6.6 本章小结 103 

    参考文献 104 

    第7章 基于排序学习的情感原因抽取 107 

    7.1 引言 107 

    7.2 相关研究工作 108 

    7.3 面向情感原因抽取的排序模型 110 

    7.3.1 问题定义 110 

    7.3.2 面向情感原因的子句排序特征 111 

    7.3.3 面向情感原因的排序模型构建 113 

    7.4 基于排序的情感原因抽取方法性能评估 115 

    7.4.1 实验设置 115 

    7.4.2 与现有方法的比较 116 

    7.4.3 排序特征的比较 118 

    7.4.4 特征词的性能比较 119 

    7.4.5 主题模型的特征比较 120 

    7.4.6 停用词和情感级别归一化的影响 120 

    7.4.7 讨论 121 

    7.5 本章小结 121 

    参考文献 121 

    第8章 基于预训练词嵌入的词排序模型 125 

    8.1 引言 125 

    8.2 相关研究工作 126 

    8.3 融合词嵌入向量的词排序模型 127 

    8.3.1 方法基本框架 127 

    8.3.2 候选扩展词的获取 128 

    8.3.3 基于单词表示的词特征抽取 128 

    8.3.4 词标注策略 130 

    8.3.5 基于排序学习的扩展词排序模型 131 

    8.4 词排序模型性能评估 132 

    8.4.1 实验设置 132 

    8.4.2 点级、对级和列表级方法的性能评估 135 

    8.4.3 与基线模型的结果比较 139 

    8.4.4 跨数据集训练词排序模型的有效性 141 

    8.4.5 参数选择过程 141 

    8.4.6 词排序模型的分析与讨论 143 

    8.5 本章小结 144 

    参考文献 144 

    第9章 基于社会化标注和主题模型的个性化检索 148 

    9.1 引言 148 

    9.2 相关研究工作 149 

    9.3 基于社会化标注的个性化文档检索 151 

    9.3.1 文档重构 151 

    9.3.2 主题模型优化 152 

    9.3.3 个性化文档检索 154 

    9.4 个性化检索方法性能评估 155 

    9.4.1 实验设置 155 

    9.4.2 实验结果与分析 156 

    9.5 本章小结 159 

    参考文献 159 

    第10章 融合语义词向量的社交媒体文本检索 162 

    10.1 引言 162 

    10.2 相关研究工作 163 

    10.3 基于词向量的微博查询扩展 166 

    10.4 微博检索方法性能评估 167 

    10.4.1 实验设置 167 

    10.4.2 微博检索伪相关反馈的参数选择 168 

    10.4.3 实验对比模型 169 

    10.4.4 基于词向量的伪相关反馈查询扩展性能 170 

    10.5 本章小结 172 

    参考文献 172 

    第11章 面向社交媒体的用户画像技术 175 

    11.1 引言 175 

    11.2 相关研究工作 176 

    11.3 基于两阶段多通路模型融合框架的用户画像构建方法 178 

    11.4 融合特征萃取的多粒度卷积神经网络用户画像构建方法 179 

    11.4.1 多粒度用户特征抽取 180 

    11.4.2 特征融合层 181 

    11.4.3 综合输出层 183 

    11.5 基于社交卷积注意力网络的用户画像构建方法 184 

    11.5.1 基于文本注意力的用户属性分类 185 

    11.5.2 基于文本和社交网络注意力的用户属性分类 186 

    11.6 用户画像方法性能评估 187 

    11.6.1 实验设置 187 

    11.6.2 对比模型 189 

    11.6.3 注意力层的效用 191 

    11.6.4 文本注意力和社交网络注意力的效用 191 

    11.6.5 注意力可视化 192 

    11.7 本章小结 193 

    参考文献 193 

    第12章 面向多样化排序的医疗文本匹配 198 

    12.1 引言 198 

    12.2 医疗文本匹配技术及其研究进展 199 

    12.2.1 医疗问答技术 199 

    12.2.2 面向多样性的信息检索 200 

    12.2.3 面向医疗文本的排序学习方法 200 

    12.3 面向多样性排序的医疗文本匹配方法 201 

    12.3.1 方法整体框架 201 

    12.3.2 医疗答案的标注策略 201 

    12.3.3 排序特征抽取 204 

    12.3.4 医疗答案排序学习方法 206 

    12.4 医疗文本匹配方法性能评估 209 

    12.4.1 实验设置 209 

    12.4.2 评价指标 209 

    12.4.3 医疗问题和答案的标注 210 

    12.4.4 对比的排序模型 211 

    12.4.5 检索性能评估结果 212 

    12.4.6 不同排序学习方法的性能评估 213 

    12.4.7 讨论 217 

    12.5 本章小结 217 

    参考文献 218 

    第13章 基于胶囊网络的医疗问答研究 221 

    13.1 引言 221 

    13.2 基于胶囊网络的医疗问答模型 222 

    13.2.1 输入表示 223 

    13.2.2 交互信息提取 224 

    13.2.3 双向胶囊网络层 224 

    13.3 医疗问答方法性能评估 226 

    13.3.1 实验设置 226 

    13.3.2 问答模型性能评估 227 

    13.3.3 所提出模型中不同层的影响 228 

    13.3.4 随机过采样的影响 228 

    13.3.5 动态路由算法中迭代次数的作用 229 

    13.4 本章小结 230 

    参考文献 230 

    第14章 总结与展望 233 

    14.1 总结 233 

    14.2 展望 235 

    编后记 237 

    彩图
  • 内容简介:
    《面向互联网的智能信息检索技术研究》以作者在智能信息检索领域多年的研究工作为基础,总结并梳理了面向互联网的智能信息检索技术的*新前沿进展,从查询意图理解和相关性匹配两个方面着重介绍了智能检索技术研究的脉络和发展,进而通过将智能检索技术应用于智能问答、医疗检索、用户画像和情感计算等多项信息检索和自然语言处理研究实践,分析并探讨了相关技术应用中的研究范式和应用模式,为人工智能和计算机科学与技术专业人士提供智能信息检索技术的全新解读,促进智能信息检索技术的突破与发展。
  • 目录:
    目录 

    《博士后文库》序言 

    前言 

    第1章 绪论 1 

    1.1 信息检索技术及其发展 1 

    1.2 面向搜索引擎的智能信息检索技术 2 

    1.3 查询意图理解和相关性排序 3 

    1.4 排序学习 4 

    1.4.1 点级排序学习模型 5 

    1.4.2 对级排序学习模型 6 

    1.4.3 列表级排序学习模型 7 

    1.5 智能信息检索评价指标 8 

    1.6 智能信息检索相关应用场景 10 

    1.7 本书研究内容及章节安排 12 

    参考文献 14 

    第2章 基于混合模型的查询意图理解 19 

    2.1 引言 19 

    2.2 相关研究工作 20 

    2.3 查询意图分类模型整体框架 21 

    2.4 查询向量表示 22 

    2.5 基于混合模型的查询意图分类 23 

    2.5.1 面向中间类别的意图匹配 23 

    2.5.2 面向最终分类的查询意图分类 27 

    2.6 查询意图分类方法性能评估 28 

    2.6.1 实验设置 28 

    2.6.2 对比模型和评价指标 28 

    2.6.3 实验结果与分析 29 

    2.7 本章小结 30 

    参考文献 31 

    第3章 面向生物医学文本检索的监督式查询扩展 34 

    3.1 引言 34 

    3.2 相关研究工作 35 

    3.3 监督式生物医学扩展词排序方法 36 

    3.3.1 方法整体流程 36 

    3.3.2 候选扩展词抽取 37 

    3.3.3 词项标注策略 37 

    3.3.4 词特征抽取 38 

    3.3.5 排序模型构建 41 

    3.4 监督式查询扩展方法性能评估 43 

    3.4.1 实验设置 43 

    3.4.2 标注策略性能评估 44 

    3.4.3 扩展词特征性能评估 44 

    3.4.4 损失函数性能评估 45 

    3.4.5 整体检索性能 45 

    3.4.6 实验结果与分析 47 

    3.5 本章小结 48 

    参考文献 48 

    第4章 排序学习文档特征生成 51 

    4.1 引言 51 

    4.2 相关研究工作 52 

    4.3 基于查询级半监督自编码器的排序模型 54 

    4.3.1 降噪自编码器 54 

    4.3.2 基于Bregman散度的损失函数 55 

    4.3.3 查询约束 56 

    4.4 半监督自编码排序方法性能评估 58 

    4.4.1 实验设置 58 

    4.4.2 多种自编码器强化的排序性能对比 59 

    4.4.3 多种排序学习方法的性能对比 61 

    4.4.4 与深度排序模型的检索性能对比 62 

    4.4.5 特征维度对实验性能的影响 64 

    4.4.6 讨论 64 

    4.5 本章小结 65 

    参考文献 65 

    第5章 直接优化信息检索评价指标的排序学习算法 70 

    5.1 引言 70 

    5.2 相关研究工作 72 

    5.3 信息检索评价指标 73 

    5.3.1 平均排序倒数 73 

    5.3.2 期望倒数排序 73 

    5.3.3 Q-measure评价指标 74 

    5.4 基于AdaRank的排序特征生成方法 75 

    5.4.1 特征生成框架 75 

    5.4.2 基于AdaRank直接优化信息检索评价指标 77 

    5.4.3 基于标准数据集的特征生成框架 79 

    5.5 直接优化评价指标排序方法性能评估 79 

    5.5.1 语料库 79 

    5.5.2 实验设置 80 

    5.5.3 所提出三种排序算法的性能评估 80 

    5.5.4 对生成特征集的评价 83 

    5.5.5 对组合特征集的评价 86 

    5.5.6 实验分析与讨论 86 

    5.6 本章小结 87 

    参考文献 88 

    第6章 融合多重损失函数的排序学习模型 91 

    6.1 引言 91 

    6.2 相关研究工作 92 

    6.3 问题定义 92 

    6.4 融合多重损失函数的排序学习 94 

    6.4.1 多种候选损失函数 94 

    6.4.2 基于梯度下降的损失优化 95 

    6.4.3 基于加权损失函数的重要性进行排序 96 

    6.5 多重损失函数融合排序方法性能评估 98 

    6.5.1 数据集和实验设置 98 

    6.5.2 对级损失函数选择 98 

    6.5.3 列表级损失函数选择 99 

    6.5.4 正则加权策略的效果评估 99 

    6.5.5 迭代敏感加权策略的效果评估 100 

    6.5.6 接力加权策略的效果评估 100 

    6.5.7 整体性能比较 101 

    6.5.8 与其他算法的比较 103 

    6.6 本章小结 103 

    参考文献 104 

    第7章 基于排序学习的情感原因抽取 107 

    7.1 引言 107 

    7.2 相关研究工作 108 

    7.3 面向情感原因抽取的排序模型 110 

    7.3.1 问题定义 110 

    7.3.2 面向情感原因的子句排序特征 111 

    7.3.3 面向情感原因的排序模型构建 113 

    7.4 基于排序的情感原因抽取方法性能评估 115 

    7.4.1 实验设置 115 

    7.4.2 与现有方法的比较 116 

    7.4.3 排序特征的比较 118 

    7.4.4 特征词的性能比较 119 

    7.4.5 主题模型的特征比较 120 

    7.4.6 停用词和情感级别归一化的影响 120 

    7.4.7 讨论 121 

    7.5 本章小结 121 

    参考文献 121 

    第8章 基于预训练词嵌入的词排序模型 125 

    8.1 引言 125 

    8.2 相关研究工作 126 

    8.3 融合词嵌入向量的词排序模型 127 

    8.3.1 方法基本框架 127 

    8.3.2 候选扩展词的获取 128 

    8.3.3 基于单词表示的词特征抽取 128 

    8.3.4 词标注策略 130 

    8.3.5 基于排序学习的扩展词排序模型 131 

    8.4 词排序模型性能评估 132 

    8.4.1 实验设置 132 

    8.4.2 点级、对级和列表级方法的性能评估 135 

    8.4.3 与基线模型的结果比较 139 

    8.4.4 跨数据集训练词排序模型的有效性 141 

    8.4.5 参数选择过程 141 

    8.4.6 词排序模型的分析与讨论 143 

    8.5 本章小结 144 

    参考文献 144 

    第9章 基于社会化标注和主题模型的个性化检索 148 

    9.1 引言 148 

    9.2 相关研究工作 149 

    9.3 基于社会化标注的个性化文档检索 151 

    9.3.1 文档重构 151 

    9.3.2 主题模型优化 152 

    9.3.3 个性化文档检索 154 

    9.4 个性化检索方法性能评估 155 

    9.4.1 实验设置 155 

    9.4.2 实验结果与分析 156 

    9.5 本章小结 159 

    参考文献 159 

    第10章 融合语义词向量的社交媒体文本检索 162 

    10.1 引言 162 

    10.2 相关研究工作 163 

    10.3 基于词向量的微博查询扩展 166 

    10.4 微博检索方法性能评估 167 

    10.4.1 实验设置 167 

    10.4.2 微博检索伪相关反馈的参数选择 168 

    10.4.3 实验对比模型 169 

    10.4.4 基于词向量的伪相关反馈查询扩展性能 170 

    10.5 本章小结 172 

    参考文献 172 

    第11章 面向社交媒体的用户画像技术 175 

    11.1 引言 175 

    11.2 相关研究工作 176 

    11.3 基于两阶段多通路模型融合框架的用户画像构建方法 178 

    11.4 融合特征萃取的多粒度卷积神经网络用户画像构建方法 179 

    11.4.1 多粒度用户特征抽取 180 

    11.4.2 特征融合层 181 

    11.4.3 综合输出层 183 

    11.5 基于社交卷积注意力网络的用户画像构建方法 184 

    11.5.1 基于文本注意力的用户属性分类 185 

    11.5.2 基于文本和社交网络注意力的用户属性分类 186 

    11.6 用户画像方法性能评估 187 

    11.6.1 实验设置 187 

    11.6.2 对比模型 189 

    11.6.3 注意力层的效用 191 

    11.6.4 文本注意力和社交网络注意力的效用 191 

    11.6.5 注意力可视化 192 

    11.7 本章小结 193 

    参考文献 193 

    第12章 面向多样化排序的医疗文本匹配 198 

    12.1 引言 198 

    12.2 医疗文本匹配技术及其研究进展 199 

    12.2.1 医疗问答技术 199 

    12.2.2 面向多样性的信息检索 200 

    12.2.3 面向医疗文本的排序学习方法 200 

    12.3 面向多样性排序的医疗文本匹配方法 201 

    12.3.1 方法整体框架 201 

    12.3.2 医疗答案的标注策略 201 

    12.3.3 排序特征抽取 204 

    12.3.4 医疗答案排序学习方法 206 

    12.4 医疗文本匹配方法性能评估 209 

    12.4.1 实验设置 209 

    12.4.2 评价指标 209 

    12.4.3 医疗问题和答案的标注 210 

    12.4.4 对比的排序模型 211 

    12.4.5 检索性能评估结果 212 

    12.4.6 不同排序学习方法的性能评估 213 

    12.4.7 讨论 217 

    12.5 本章小结 217 

    参考文献 218 

    第13章 基于胶囊网络的医疗问答研究 221 

    13.1 引言 221 

    13.2 基于胶囊网络的医疗问答模型 222 

    13.2.1 输入表示 223 

    13.2.2 交互信息提取 224 

    13.2.3 双向胶囊网络层 224 

    13.3 医疗问答方法性能评估 226 

    13.3.1 实验设置 226 

    13.3.2 问答模型性能评估 227 

    13.3.3 所提出模型中不同层的影响 228 

    13.3.4 随机过采样的影响 228 

    13.3.5 动态路由算法中迭代次数的作用 229 

    13.4 本章小结 230 

    参考文献 230 

    第14章 总结与展望 233 

    14.1 总结 233 

    14.2 展望 235 

    编后记 237 

    彩图
查看详情
您可能感兴趣 / 更多
面向互联网的智能信息检索技术研究
军工科研生产网络保密技术管理
徐博 著;王西雁、曹丹、俞烽、陶凌汉 编
面向互联网的智能信息检索技术研究
“十四五”中国天然气行业发展前瞻
徐博 编著
面向互联网的智能信息检索技术研究
水下多AUV协同定位方法
徐博 著
面向互联网的智能信息检索技术研究
国际城市收缩问题研究
徐博 著
面向互联网的智能信息检索技术研究
东北亚研究丛书:冷战后俄罗斯亚太地缘战略
徐博 著
面向互联网的智能信息检索技术研究
马尔库塞否定性思想研究:外国哲学
徐博 著
面向互联网的智能信息检索技术研究
促进我国自主科技创新的财税政策研究
徐博 著