术语学与术语信息处理

术语学与术语信息处理
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2015-05
版次: 1
ISBN: 9787516160916
定价: 48.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 191页
字数: 212千字
分类: 社会文化
3人买过
  • 信息时代对术语学研究提出新的要求,本书从知识发现的视角对术语界定进行论证;提出面向大规模文本的术语定义的抽取、术语定义的领域聚类以及术语识别的方法。 张榕,女,1975年11月出生,籍贯江苏溧水。2006年毕业于北京语言大学,获语言学与应用语言学博士学位,研究方向为语言信息处理,现为北京语言大学教师。 第一章  引论

      第一节  本研究提出的背景

        一  术语定义自动抽取的必要性 

        二  术语定义的聚类的意义

        三  术语识别的意义

      第二节  国内外研究现状

        一  术语定义抽取的研究现状

        二  句子聚类的国内外研究

        三  术语识别的研究现状

      第三节  术语学介绍

        一  什么是术语学

        二  术语学的发展简介

        三  术语学的主要流派

        四  我国的术语学研究

        五  术语数据库

        六  术语概念的唯一性与术语定义的多样性

        七  术语与普通词语

        八  术语的跨语言借用

        九  新术语与旧术语在定义出现概率上的区别

        十  术语的语缀

        十一  一些基本概念

      第四节  术语与术语定义的界定

        一  术语的界定

        二  术语定义的界定

    第二章  术语定义的抽取研究

      第一节  候选术语定义的规则匹配

        一  文本下载

        二  文本的预处理 

        三  文本的分词 

        四  候选术语定义的模板匹配 

      第二节  基于统计方法的术语定义抽取 

        一  词语的定义隶属度 

        二  句子的定义隶属度 

        三  句子的定义隶属度实验结果

      第三节  向量空间距离计算 

        一  向量空间模型介绍 

        二  向量空间模型的引用 

        三  向量空间模型实验结果示例

      第四节  隶属度计算和向量空间模型的结合

      第五节  术语定义抽取系统结构与实验结果

      第六节  实验结果评价 

        一  网络文本结构的多样性因素 

        二  语言表达形式的多样性因素 

        三  分词的因素 

        四  网络文本的可靠性因素

        五  搜索引擎准确率的因素

        六  算法的因素

      第七节  术语定义形式的多样性

        一  传统意义上的定义形式

        二  下定义的要求

        三  术语定义形式的多样性

      第八节  本章小结

    第三章  术语定义的聚类研究

      第一节  术语定义聚类的必要性

      第二节  聚类综述

        一  聚类与聚类分析

        二  分类与聚类

        三  硬聚类和软聚类

        四  层级聚类与诽:层级聚类

      第三节  本研究采用的聚类方法

        一  聚类步骤

        二  相似度的界定和属性的选取

        三  《知网》介绍 

      第四节  术语定义的领域聚类 

        一  句子相似度计算

        二  词语的相似度计算 

        三  术语定义领域聚类的停用词表的建立

        四  聚类特征的选取 

      第五节  术语定义聚类的结果及分析

        一  领域聚类的判定复杂性

        二  聚类相似度阈值的设定

        三  《知网》知识库在领域聚类中的优点与局限性

        四  聚类结果的错误分析

    第四章  术语自动识别研究

      第一节  术语缺乏位置信息

      第二节  术语的抽取

        一  术语的语言学特征

        二  术语的粗抽取

        三  术语边界的确定

        四  术语的词性过滤

        五  术语词性序列的统计

      第三节  候选术语的统计特征

        一  术语的用词长度特征

        二  候选术语的长度与词频计算

        三  候选术语的最后得分

      第四节  过滤词表的构建

        一  术语识别过滤词表构建的必要性

        二  过滤词表的构建

      第五节  术语识别系统结构与实验结果

      第六节  实验结果分析

        一  定义匹配模板的局限性

        二  句子定义隶属度过低

        三  其他情况

      第七节  本章小结

    第五章  结束语

    附录

      附录一  《人民日报》用词与术语定义用词对比

      附录二  词语的定义隶属度

      附录三  术语定义抽取的分步骤结果示例

      附录四  术语的词性序列

      附录五  术语抽取结果

      附录六  术语定义聚类的部分结果

      附录七  术语定义聚类程序示例

    参考文献

    致谢
  • 内容简介:
    信息时代对术语学研究提出新的要求,本书从知识发现的视角对术语界定进行论证;提出面向大规模文本的术语定义的抽取、术语定义的领域聚类以及术语识别的方法。
  • 作者简介:
    张榕,女,1975年11月出生,籍贯江苏溧水。2006年毕业于北京语言大学,获语言学与应用语言学博士学位,研究方向为语言信息处理,现为北京语言大学教师。
  • 目录:
    第一章  引论

      第一节  本研究提出的背景

        一  术语定义自动抽取的必要性 

        二  术语定义的聚类的意义

        三  术语识别的意义

      第二节  国内外研究现状

        一  术语定义抽取的研究现状

        二  句子聚类的国内外研究

        三  术语识别的研究现状

      第三节  术语学介绍

        一  什么是术语学

        二  术语学的发展简介

        三  术语学的主要流派

        四  我国的术语学研究

        五  术语数据库

        六  术语概念的唯一性与术语定义的多样性

        七  术语与普通词语

        八  术语的跨语言借用

        九  新术语与旧术语在定义出现概率上的区别

        十  术语的语缀

        十一  一些基本概念

      第四节  术语与术语定义的界定

        一  术语的界定

        二  术语定义的界定

    第二章  术语定义的抽取研究

      第一节  候选术语定义的规则匹配

        一  文本下载

        二  文本的预处理 

        三  文本的分词 

        四  候选术语定义的模板匹配 

      第二节  基于统计方法的术语定义抽取 

        一  词语的定义隶属度 

        二  句子的定义隶属度 

        三  句子的定义隶属度实验结果

      第三节  向量空间距离计算 

        一  向量空间模型介绍 

        二  向量空间模型的引用 

        三  向量空间模型实验结果示例

      第四节  隶属度计算和向量空间模型的结合

      第五节  术语定义抽取系统结构与实验结果

      第六节  实验结果评价 

        一  网络文本结构的多样性因素 

        二  语言表达形式的多样性因素 

        三  分词的因素 

        四  网络文本的可靠性因素

        五  搜索引擎准确率的因素

        六  算法的因素

      第七节  术语定义形式的多样性

        一  传统意义上的定义形式

        二  下定义的要求

        三  术语定义形式的多样性

      第八节  本章小结

    第三章  术语定义的聚类研究

      第一节  术语定义聚类的必要性

      第二节  聚类综述

        一  聚类与聚类分析

        二  分类与聚类

        三  硬聚类和软聚类

        四  层级聚类与诽:层级聚类

      第三节  本研究采用的聚类方法

        一  聚类步骤

        二  相似度的界定和属性的选取

        三  《知网》介绍 

      第四节  术语定义的领域聚类 

        一  句子相似度计算

        二  词语的相似度计算 

        三  术语定义领域聚类的停用词表的建立

        四  聚类特征的选取 

      第五节  术语定义聚类的结果及分析

        一  领域聚类的判定复杂性

        二  聚类相似度阈值的设定

        三  《知网》知识库在领域聚类中的优点与局限性

        四  聚类结果的错误分析

    第四章  术语自动识别研究

      第一节  术语缺乏位置信息

      第二节  术语的抽取

        一  术语的语言学特征

        二  术语的粗抽取

        三  术语边界的确定

        四  术语的词性过滤

        五  术语词性序列的统计

      第三节  候选术语的统计特征

        一  术语的用词长度特征

        二  候选术语的长度与词频计算

        三  候选术语的最后得分

      第四节  过滤词表的构建

        一  术语识别过滤词表构建的必要性

        二  过滤词表的构建

      第五节  术语识别系统结构与实验结果

      第六节  实验结果分析

        一  定义匹配模板的局限性

        二  句子定义隶属度过低

        三  其他情况

      第七节  本章小结

    第五章  结束语

    附录

      附录一  《人民日报》用词与术语定义用词对比

      附录二  词语的定义隶属度

      附录三  术语定义抽取的分步骤结果示例

      附录四  术语的词性序列

      附录五  术语抽取结果

      附录六  术语定义聚类的部分结果

      附录七  术语定义聚类程序示例

    参考文献

    致谢
查看详情
相关图书 / 更多
术语学与术语信息处理
术语的解读:小说戏曲研究的视角与方法
谭帆
术语学与术语信息处理
术语革命:中国近代经济学主要术语的形成
孙大权
术语学与术语信息处理
术语学理论与实践
[奥地利]H.费尔伯(Helmut Felber) G.布丁(Gerhard Budin)邱碧华
术语学与术语信息处理
术语学:对象研究方法结构
[俄罗斯]弗拉基米尔·莫伊谢耶维奇·列依奇克 著;林春泽 译
术语学与术语信息处理
术语计算与知识组织研究
宋培彦
术语学与术语信息处理
术语管理概论
王华树 冷冰冰
术语学与术语信息处理
术语管理指南
王华树、王少爽 著
术语学与术语信息处理
术语翻译方法论
信娜
术语学与术语信息处理
术语·知识·话语:跨学科视阈下的术语翻译研究新探索
魏向清、刘润泽、时闻 编
术语学与术语信息处理
术语学概论
[加] 著
术语学与术语信息处理
术语翻译新论:找译译法翻译理论与实务
李亚舒;徐树德
术语学与术语信息处理
术语的认知语义研究/创新与应用语言学丛书
张春泉 作者