实体识别技术

实体识别技术
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: , , ,
2017-10
版次: 1
ISBN: 9787111581611
定价: 69.00
装帧: 精装
开本: 16开
纸张: 胶版纸
页数: 199页
正文语种: 简体中文
3人买过
  •   《实体识别技术》基于作者多年对数据集成的相关研究工作,从多角度阐述实体识别技术,主要包括相似度计算算法、实体识别的分块技术、典型的基于机器学习的实体识别技术和基于关系的实体记录识别技术,以及新型的实体识别技术(包括基于时间的宴体识别技术、基于众包的实体识别、隐私保护下的实体识别)等内容。
      《实体识别技术》深入浅出、案例丰富,适合数据集成等方向的研究生阅读,也能为相关领域研究人员和开发人员提供重要参考。 丛书前言
    前言

    第1章 概述
    1.1 实体识别问题的提出
    1.2 实体识别研究的发展历史
    1.3 实体识别问题的描述
    1.4 实体识别的处理流程
    1.5 实体识别的挑战
    1.5.1 相似度衡量问题
    1.5.2 计算效率问题
    1.5.3 机器学习方法的应用问题
    1.5.4 关联对象的识别问题
    1.5.5 一些新的挑战
    1.5.6 实体识别评估
    1.6 实体识别的应用
    1.6.1 医疗卫生
    1.6.2 人口普查
    1.6.3 客户关系管理
    1.6.4 网购比价
    1.6.5 犯罪及欺诈侦查
    1.6.6 关联的开放数据
    1.6.7 引文数据库
    1.7 本章小结
    参考文献

    第2章 相似度计算算法
    2.1 基于字段的相似度算法
    2.1 Jaccard相似度算法
    2.1.2 基于TF-IDF的相似度算法
    2.1.3 基于q-grams的相似度算法
    2.2 基于编辑距离的相似度算法
    2.2.1 Levenshtein距离算法
    2.2.2 Jaro和Jaro-Winkler距离算法
    2.3 混合的相似度算法
    2.3.1 扩展的Jaccard相似度算法
    2.3.2 Monge-Elkan相似度算法
    2.3.3 Soft TF-IDF相似度算法
    2.4 数值型数据相似度算法
    2.4.1 数字型相似度算法
    2.4.2 日期型相似度算法
    2.4.3 价格型相似度算法
    2.5 本章小结
    参考文献

    第3章 实体识别的分块技术
    3.1 引言
    3.1.1 数据分块技术的应用
    3.1.2 实体识别数据分块问题定义与算法分类
    3.2 分块键
    3.2.1 分块键的定义
    3.2.2 分块键的编码
    3.3 基于等值匹配的分块算法
    3.3.1 标准分块方法
    3.3.2 基于学习的分块键定义
    3.4 基于相似性的分块算法
    3.4.1 基于排序的分块方法
    3.4.2 基于字符串分割的分块方法
    3.4.3 基于MinHash的分块方法
    3.4.4 基于Canopy聚类的分块方法
    3.4.5 基于前缀过滤的分块方法
    3.5 本章小结
    参考文献

    第4章 基于机器学习的实体识别方法
    4.1 基于分类器的实体识别方法
    4.1.1 基于决策树的实体识别方法
    4.1.2 基于贝叶斯分类器的实体识别方法
    4.1.3 基于SVM的实体识别方法
    4.1.4 基于主动学习的实体识别方法
    4.1.5 其他方法
    4.2 基于概率图模型的实体识别方法
    4.2.1 基于马尔可夫逻辑网络的实体识别方法
    4.2.2 基于条件随机场的实体识别方法
    4.3 本章小结
    参考文献

    第5章 基于关系的实体识别方法
    5.1 引言
    5.2 联合式实体识别方法
    5.2.1 基于关系聚类的联合式实体识别方法
    5.2.2 复杂信息空间中的联合式实体识别方法
    5.3 基于实体关系的消歧方法
    5.3.1 基于社交关系的名字消歧方法
    5.3.2 基于实体关系的实体消歧方法
    5.3.3 基于异构实体关系的实体消歧方法
    5.4 本章小结
    参考文献

    第6章 新型的实体识别技术
    6.1 引言
    6.2 基于时间模型的实体识别技术
    6.2.1 一个实例
    6.2.2 时间模型
    6.2.3 基于时间模型的实体识别算法
    6.3 基于众包的实体识别技术
    6.3.1 一个实例
    6.3.2 基于众包的实体识别框架
    6.3.3 基于众包的实体识别的核心问题
    6.3.4 基于众包的实体识别方法的特点
    6.4 隐私保护下的实体识别技术
    6.4.1 实体匹配中隐私保护的分类
    6.4.2 实体识别隐私保护算法的评估
    6.5 本章小结
    参考文献

    第7章 实体识别评估
    7.1 基于记录对的精确性评价一准确率、召回率和F测度
    7.2 分块技术评价
    7.3 常用数据集
    7.3.1 真实数据集
    7.3.2 数据生成工具
    7.4 本章小结
    参考文献

    第8章 总结与展望
    8.1 实体识别研究总结
    8.2 新型实体识别研究展望
    8.2.1 基于时间模型的实体识别
    8.2.2 基于众包的实体识别
    8.2.3 隐私保护下的实体识别
    8.3 研究挑战
  • 内容简介:
      《实体识别技术》基于作者多年对数据集成的相关研究工作,从多角度阐述实体识别技术,主要包括相似度计算算法、实体识别的分块技术、典型的基于机器学习的实体识别技术和基于关系的实体记录识别技术,以及新型的实体识别技术(包括基于时间的宴体识别技术、基于众包的实体识别、隐私保护下的实体识别)等内容。
      《实体识别技术》深入浅出、案例丰富,适合数据集成等方向的研究生阅读,也能为相关领域研究人员和开发人员提供重要参考。
  • 目录:
    丛书前言
    前言

    第1章 概述
    1.1 实体识别问题的提出
    1.2 实体识别研究的发展历史
    1.3 实体识别问题的描述
    1.4 实体识别的处理流程
    1.5 实体识别的挑战
    1.5.1 相似度衡量问题
    1.5.2 计算效率问题
    1.5.3 机器学习方法的应用问题
    1.5.4 关联对象的识别问题
    1.5.5 一些新的挑战
    1.5.6 实体识别评估
    1.6 实体识别的应用
    1.6.1 医疗卫生
    1.6.2 人口普查
    1.6.3 客户关系管理
    1.6.4 网购比价
    1.6.5 犯罪及欺诈侦查
    1.6.6 关联的开放数据
    1.6.7 引文数据库
    1.7 本章小结
    参考文献

    第2章 相似度计算算法
    2.1 基于字段的相似度算法
    2.1 Jaccard相似度算法
    2.1.2 基于TF-IDF的相似度算法
    2.1.3 基于q-grams的相似度算法
    2.2 基于编辑距离的相似度算法
    2.2.1 Levenshtein距离算法
    2.2.2 Jaro和Jaro-Winkler距离算法
    2.3 混合的相似度算法
    2.3.1 扩展的Jaccard相似度算法
    2.3.2 Monge-Elkan相似度算法
    2.3.3 Soft TF-IDF相似度算法
    2.4 数值型数据相似度算法
    2.4.1 数字型相似度算法
    2.4.2 日期型相似度算法
    2.4.3 价格型相似度算法
    2.5 本章小结
    参考文献

    第3章 实体识别的分块技术
    3.1 引言
    3.1.1 数据分块技术的应用
    3.1.2 实体识别数据分块问题定义与算法分类
    3.2 分块键
    3.2.1 分块键的定义
    3.2.2 分块键的编码
    3.3 基于等值匹配的分块算法
    3.3.1 标准分块方法
    3.3.2 基于学习的分块键定义
    3.4 基于相似性的分块算法
    3.4.1 基于排序的分块方法
    3.4.2 基于字符串分割的分块方法
    3.4.3 基于MinHash的分块方法
    3.4.4 基于Canopy聚类的分块方法
    3.4.5 基于前缀过滤的分块方法
    3.5 本章小结
    参考文献

    第4章 基于机器学习的实体识别方法
    4.1 基于分类器的实体识别方法
    4.1.1 基于决策树的实体识别方法
    4.1.2 基于贝叶斯分类器的实体识别方法
    4.1.3 基于SVM的实体识别方法
    4.1.4 基于主动学习的实体识别方法
    4.1.5 其他方法
    4.2 基于概率图模型的实体识别方法
    4.2.1 基于马尔可夫逻辑网络的实体识别方法
    4.2.2 基于条件随机场的实体识别方法
    4.3 本章小结
    参考文献

    第5章 基于关系的实体识别方法
    5.1 引言
    5.2 联合式实体识别方法
    5.2.1 基于关系聚类的联合式实体识别方法
    5.2.2 复杂信息空间中的联合式实体识别方法
    5.3 基于实体关系的消歧方法
    5.3.1 基于社交关系的名字消歧方法
    5.3.2 基于实体关系的实体消歧方法
    5.3.3 基于异构实体关系的实体消歧方法
    5.4 本章小结
    参考文献

    第6章 新型的实体识别技术
    6.1 引言
    6.2 基于时间模型的实体识别技术
    6.2.1 一个实例
    6.2.2 时间模型
    6.2.3 基于时间模型的实体识别算法
    6.3 基于众包的实体识别技术
    6.3.1 一个实例
    6.3.2 基于众包的实体识别框架
    6.3.3 基于众包的实体识别的核心问题
    6.3.4 基于众包的实体识别方法的特点
    6.4 隐私保护下的实体识别技术
    6.4.1 实体匹配中隐私保护的分类
    6.4.2 实体识别隐私保护算法的评估
    6.5 本章小结
    参考文献

    第7章 实体识别评估
    7.1 基于记录对的精确性评价一准确率、召回率和F测度
    7.2 分块技术评价
    7.3 常用数据集
    7.3.1 真实数据集
    7.3.2 数据生成工具
    7.4 本章小结
    参考文献

    第8章 总结与展望
    8.1 实体识别研究总结
    8.2 新型实体识别研究展望
    8.2.1 基于时间模型的实体识别
    8.2.2 基于众包的实体识别
    8.2.3 隐私保护下的实体识别
    8.3 研究挑战
查看详情
系列丛书 / 更多
实体识别技术
大规模元搜索引擎技术
[美]孟卫一(Weiyi Meng) 著;朱亮 译
实体识别技术
云数据管理:挑战与机遇
马友忠 译
实体识别技术
位置大数据隐私管理
潘晓、霍峥、孟小峰 著
实体识别技术
大数据管理概论
孟小峰 著
实体识别技术
移动数据挖掘
连德富 张富峥 王英子 袁 晶 谢 幸 著
实体识别技术
异构信息网络挖掘:原理和方法
段磊 译
实体识别技术
短文本数据理解
王仲远 著
实体识别技术
大数据集成
董欣 著;王秋月 译
实体识别技术
大数据、小数据、无数据:网络世界的数据学术
孟小峰、张祎、赵尔平 译
实体识别技术
个人数据管理
李玉坤 孟小峰 著
相关图书 / 更多
实体识别技术
实体店这样运营能爆卖
高海友
实体识别技术
实体店爆卖实战手册
姿涵
实体识别技术
实体经济高质量发展策略研究——以河南省为例
黄毅敏、王红娜、张如云 著
实体识别技术
实体企业金融化的动因、后果与治理对策研究
王冬梅
实体识别技术
实体肿瘤CAR-T细胞治疗免疫学基础与临床治疗研究
王斌
实体识别技术
实体企业反腐密码
段秋斌
实体识别技术
实体立国
厉以宁
实体识别技术
实体店线上线下运营实战一本通
刘珂
实体识别技术
实体与数字空间建构
常悦;郭苏琳;高智慧;王冲
实体识别技术
实体立国(政协委员文库)
厉以宁 著
实体识别技术
实体肿瘤规范诊疗手册
梁廷波
实体识别技术
实体零售商主导下快消品双渠道供应链合作博弈研究
刘峥、郑兴有、余明阳 著
您可能感兴趣 / 更多
实体识别技术
分布式数据库系统原理与应用
申德荣 著