术语学与术语信息处理

作者: 张榕著

出版社: 中国社会科学出版社

出版时间: 2015-05

版次: 1

ISBN: 9787516160916

定价: 48.00

装帧: 平装

开本: 16开

纸张: 胶版纸

页数: 191页

字数: 212千字

分类: 社会文化

3人买过

信息时代对术语学研究提出新的要求，本书从知识发现的视角对术语界定进行论证；提出面向大规模文本的术语定义的抽取、术语定义的领域聚类以及术语识别的方法。张榕，女，1975年11月出生，籍贯江苏溧水。2006年毕业于北京语言大学，获语言学与应用语言学博士学位，研究方向为语言信息处理，现为北京语言大学教师。第一章  引论

  第一节  本研究提出的背景

    一  术语定义自动抽取的必要性

    二  术语定义的聚类的意义

    三  术语识别的意义

  第二节  国内外研究现状

    一  术语定义抽取的研究现状

    二  句子聚类的国内外研究

    三  术语识别的研究现状

  第三节  术语学介绍

    一  什么是术语学

    二  术语学的发展简介

    三  术语学的主要流派

    四  我国的术语学研究

    五  术语数据库

    六  术语概念的唯一性与术语定义的多样性

    七  术语与普通词语

    八  术语的跨语言借用

    九  新术语与旧术语在定义出现概率上的区别

    十  术语的语缀

    十一  一些基本概念

  第四节  术语与术语定义的界定

    一  术语的界定

    二  术语定义的界定

第二章  术语定义的抽取研究

  第一节  候选术语定义的规则匹配

    一  文本下载

    二  文本的预处理

    三  文本的分词

    四  候选术语定义的模板匹配

  第二节  基于统计方法的术语定义抽取

    一  词语的定义隶属度

    二  句子的定义隶属度

    三  句子的定义隶属度实验结果

  第三节  向量空间距离计算

    一  向量空间模型介绍

    二  向量空间模型的引用

    三  向量空间模型实验结果示例

  第四节  隶属度计算和向量空间模型的结合

  第五节  术语定义抽取系统结构与实验结果

  第六节  实验结果评价

    一  网络文本结构的多样性因素

    二  语言表达形式的多样性因素

    三  分词的因素

    四  网络文本的可靠性因素

    五  搜索引擎准确率的因素

    六  算法的因素

  第七节  术语定义形式的多样性

    一  传统意义上的定义形式

    二  下定义的要求

    三  术语定义形式的多样性

  第八节  本章小结

第三章  术语定义的聚类研究

  第一节  术语定义聚类的必要性

  第二节  聚类综述

    一  聚类与聚类分析

    二  分类与聚类

    三  硬聚类和软聚类

    四  层级聚类与诽：层级聚类

  第三节  本研究采用的聚类方法

    一  聚类步骤

    二  相似度的界定和属性的选取

    三  《知网》介绍

  第四节  术语定义的领域聚类

    一  句子相似度计算

    二  词语的相似度计算

    三  术语定义领域聚类的停用词表的建立

    四  聚类特征的选取

  第五节  术语定义聚类的结果及分析

    一  领域聚类的判定复杂性

    二  聚类相似度阈值的设定

    三  《知网》知识库在领域聚类中的优点与局限性

    四  聚类结果的错误分析

第四章  术语自动识别研究

  第一节  术语缺乏位置信息

  第二节  术语的抽取

    一  术语的语言学特征

    二  术语的粗抽取

    三  术语边界的确定

    四  术语的词性过滤

    五  术语词性序列的统计

  第三节  候选术语的统计特征

    一  术语的用词长度特征

    二  候选术语的长度与词频计算

    三  候选术语的最后得分

  第四节  过滤词表的构建

    一  术语识别过滤词表构建的必要性

    二  过滤词表的构建

  第五节  术语识别系统结构与实验结果

  第六节  实验结果分析

    一  定义匹配模板的局限性

    二  句子定义隶属度过低

    三  其他情况

  第七节  本章小结

第五章  结束语

附录

  附录一  《人民日报》用词与术语定义用词对比

  附录二  词语的定义隶属度

  附录三  术语定义抽取的分步骤结果示例

  附录四  术语的词性序列

  附录五  术语抽取结果

  附录六  术语定义聚类的部分结果

  附录七  术语定义聚类程序示例

参考文献

致谢
内容简介:
信息时代对术语学研究提出新的要求，本书从知识发现的视角对术语界定进行论证；提出面向大规模文本的术语定义的抽取、术语定义的领域聚类以及术语识别的方法。
作者简介:
张榕，女，1975年11月出生，籍贯江苏溧水。2006年毕业于北京语言大学，获语言学与应用语言学博士学位，研究方向为语言信息处理，现为北京语言大学教师。
目录:
第一章  引论

  第一节  本研究提出的背景

    一  术语定义自动抽取的必要性

    二  术语定义的聚类的意义

    三  术语识别的意义

  第二节  国内外研究现状

    一  术语定义抽取的研究现状

    二  句子聚类的国内外研究

    三  术语识别的研究现状

  第三节  术语学介绍

    一  什么是术语学

    二  术语学的发展简介

    三  术语学的主要流派

    四  我国的术语学研究

    五  术语数据库

    六  术语概念的唯一性与术语定义的多样性

    七  术语与普通词语

    八  术语的跨语言借用

    九  新术语与旧术语在定义出现概率上的区别

    十  术语的语缀

    十一  一些基本概念

  第四节  术语与术语定义的界定

    一  术语的界定

    二  术语定义的界定

第二章  术语定义的抽取研究

  第一节  候选术语定义的规则匹配

    一  文本下载

    二  文本的预处理

    三  文本的分词

    四  候选术语定义的模板匹配

  第二节  基于统计方法的术语定义抽取

    一  词语的定义隶属度

    二  句子的定义隶属度

    三  句子的定义隶属度实验结果

  第三节  向量空间距离计算

    一  向量空间模型介绍

    二  向量空间模型的引用

    三  向量空间模型实验结果示例

  第四节  隶属度计算和向量空间模型的结合

  第五节  术语定义抽取系统结构与实验结果

  第六节  实验结果评价

    一  网络文本结构的多样性因素

    二  语言表达形式的多样性因素

    三  分词的因素

    四  网络文本的可靠性因素

    五  搜索引擎准确率的因素

    六  算法的因素

  第七节  术语定义形式的多样性

    一  传统意义上的定义形式

    二  下定义的要求

    三  术语定义形式的多样性

  第八节  本章小结

第三章  术语定义的聚类研究

  第一节  术语定义聚类的必要性

  第二节  聚类综述

    一  聚类与聚类分析

    二  分类与聚类

    三  硬聚类和软聚类

    四  层级聚类与诽：层级聚类

  第三节  本研究采用的聚类方法

    一  聚类步骤

    二  相似度的界定和属性的选取

    三  《知网》介绍

  第四节  术语定义的领域聚类

    一  句子相似度计算

    二  词语的相似度计算

    三  术语定义领域聚类的停用词表的建立

    四  聚类特征的选取

  第五节  术语定义聚类的结果及分析

    一  领域聚类的判定复杂性

    二  聚类相似度阈值的设定

    三  《知网》知识库在领域聚类中的优点与局限性

    四  聚类结果的错误分析

第四章  术语自动识别研究

  第一节  术语缺乏位置信息

  第二节  术语的抽取

    一  术语的语言学特征

    二  术语的粗抽取

    三  术语边界的确定

    四  术语的词性过滤

    五  术语词性序列的统计

  第三节  候选术语的统计特征

    一  术语的用词长度特征

    二  候选术语的长度与词频计算

    三  候选术语的最后得分

  第四节  过滤词表的构建

    一  术语识别过滤词表构建的必要性

    二  过滤词表的构建

  第五节  术语识别系统结构与实验结果

  第六节  实验结果分析

    一  定义匹配模板的局限性

    二  句子定义隶属度过低

    三  其他情况

  第七节  本章小结

第五章  结束语

附录

  附录一  《人民日报》用词与术语定义用词对比

  附录二  词语的定义隶属度

  附录三  术语定义抽取的分步骤结果示例

  附录四  术语的词性序列

  附录五  术语抽取结果

  附录六  术语定义聚类的部分结果

  附录七  术语定义聚类程序示例

参考文献

致谢

查看详情

术语学与术语信息处理

内容简介:

作者简介:

目录: