自然语言处理综论

自然语言处理综论
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2005-06
版次: 1
ISBN: 9787121007767
定价: 78.00
装帧: 平装
开本: 16开
纸张: 其他
页数: 588页
56人买过
  •   本书是一本全面系统地讲述计算机自然语言处理的优秀教材。本书英文版出版之后好评如潮,国外许多著名大学纷纷把本书选为自然语言处理和计算语言学课程的主要教材,该书被誉为该领域教材的“黄金标准”。本书包含的内容十分丰富,分为四个部分,共21章,深入细致地探讨了计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。从层次的角度看,本书的论述是按照自然语言的不同层面逐步展开的,首先论述单词的自动形态分析,接着论述自动句法分析,然后论述各种语言单位的自动语义分析,最后论述连贯文本的自动分析、对话与会话的智能代理以及自然语言生成。从技术的角度看,本书介绍了正则表达式、有限状态自动机、文本-语音转换、发音与拼写的概率模型、词类自动标注、N元语法、隐马尔可夫模型、上下文无关语法、特征与合一、词汇化剖析与概率剖析、一阶谓词演算、词义排歧、修辞结构理论、机器翻译等非常广泛的内容。本书具有“覆盖全面、注重实用、强调评测、语料为本”四大特色。在本书的配套网站上,还提供了相关的资源和工具,便于读者在实践中进一步提高。 Daniel Jurafsky
    在美国加利福尼亚大学获计算机科学博士学位, 现于美国科罗拉多大学语言学系和计算机科学系任教, 并在认知科学研究所工作, 主要研究方向为语言的概率模型和语音信息处理. 由于他在语音和语言处理方面的成就, 于1997年获美国NSF职业奖.
    James H.Martin
    在美国加利福尼亚大学获计算机科学博士学位, 现任职于美国科罗拉多大学计算机科学系和认知科学研究所, 主要研究方向为计算语义学. 机器学习和信息检索.
    冯志伟国家教育部语言文字应用研究所研究员. 博士生导师. 先后在北京大学和中国科学技术大学获双硕士位, 在语音和语言的计算机处理领域具有多年的研究经验, 曾在多个国家参与研究和教学工作, 主要研究方向为自然语言处理. 计算语言学和机器翻译, 主要著作有《自然语言的计算机处理》和《数理语言学》等18部。 第1章导论
    1.1语音与语言处理中的知识
    1.2歧义
    1.3模型和算法
    1.4语言、思维和理解
    1.5学科现状与近期发展
    1.6语音和语言处理简史
    1.6.1基础研究:20世纪40年代和20世纪50年代
    1.6.2两个阵营:1957年至1970年
    1.6.3四个范型:1970年至1983年
    1.6.4经验主义和有限状态模型的复苏:1983年至1993年
    1.6.5不同领域的合流:1994年至1999年
    1.6.6多重发现
    1.6.7心理学的简要注记
    1.7小结
    1.8文献和历史说明

    第一部分词汇的计算机处理
    第2章正则表达式与自动机
    2.1正则表达式
    2.1.1基本正则表达式模式
    2.1.2析取、组合与优先关系
    2.1.3一个简单的例子
    2.1.4一个比较复杂的例子
    2.1.5高级算符
    2.1.6正则表达式中的替换、存储器与eliza
    2.2有限状态自动机
    2.2.1用fsa来识别羊的语言
    2.2.2形式语言
    2.2.3另外的例子
    2.2.4非确定fsa
    2.2.5使用nfsa接收符号串
    2.2.6识别就是搜索
    2.2.7确定自动机与非确定自动机的关系
    2.3正则语言与fsa
    2.4小结
    2.5文献和历史说明

    第3章形态学与有限状态转录机
    3.1英语形态学概观
    3.1.1屈折形态学
    3.1.2派生形态学
    3.2有限状态形态剖析
    3.2.1词表和形态顺序规则
    3.2.2用有限状态转录机进行形态剖析
    3.2.3正词法规则和有限状态转录机
    3.3把fst词表与规则相结合
    3.4与词表无关的fst:porter词干处理器
    3.5人是怎样进行形态处理的
    3.6小结
    3.7文献和历史说明

    第4章计算音系学与文本-语音转换
    4.1言语语音与语音标音法
    4.1.1发音器官
    4.1.2辅音:发音部位
    4.1.3辅音:发音方法
    4.1.4元音
    4.1.5音节
    4.2音位和音位规则
    4.3音位规则和转录机
    4.4计算音系学中的一些高级问题
    4.4.1元音和谐
    4.4.2模板式形态学
    4.4.3优选理论
    4.5音位规则的机器学习
    4.6tts中从文本映射到语音
    4.6.1发音词典
    4.6.2词典之外的查找:文本分析
    4.6.3基于有限状态转录机(fst)的发音词典
    4.7文本-语音转换中的韵律
    4.7.1韵律的音系学性质
    4.7.2韵律的语音和声学性质
    4.7.3语音合成中的韵律
    4.8人处理音位和形态的过程
    4.9小结
    4.10文献和历史说明

    第5章发音与拼写的概率模型
    5.1关于拼写错误
    5.2拼写错误模式
    5.3非词错误的检查
    5.4概率模型
    5.5把贝叶斯方法应用于拼写
    5.6最小编辑距离
    5.7英语的发音变异
    5.8发音问题研究中的贝叶斯方法
    5.8.1发音变异的决策树模型
    5.9加权自动机
    5.9.1从加权自动机计算似然度:向前算法
    5.9.2解码:viterbi算法
    5.9.3加权自动机和切分
    5.9.4用切分来进行词表的自动归纳
    5.10人类发音研究
    5.11小结
    5.12文献和历史说明

    第6章n元语法
    6.1语料库中单词数目的计算
    6.2简单的(非平滑的)n元语法
    6.2.1n元语法及其对训练语料库的敏感性
    6.3平滑
    6.3.1加1平滑
    6.3.2witten-bell打折法
    6.3.3good-turing打折法
    6.4回退
    6.4.1回退与打折相结合
    6.5删除插值法
    6.6拼写和发音的n元语法
    6.6.1上下文有关的错拼更正
    6.6.2发音模型的n元语法
    6.7熵
    6.7.1用于比较模型的交叉熵
    6.7.2英语的熵
    6.8小结
    6.9文献和历史说明

    第7章hmm与语音识别
    7.1语音识别的总体结构
    7.2隐马尔可夫模型概述
    7.3再谈viterbi算法
    7.4先进的解码方法
    7.4.1a*解码算法
    7.5语音的声学处理
    7.5.1声波
    7.5.2怎样解释波形
    7.5.3声谱
    7.5.4特征抽取
    7.6声学概率的计算
    7.7语音识别系统的训练
    7.8用于语音合成的波形生成
    7.8.1音高和音延的修正
    7.8.2单元选择
    7.9人的语音识别
    7.10小结
    7.11文献和历史说明

    第二部分句法的计算机处理
    第8章词的分类与词类标注
    8.1大多数英语词的分类
    8.2英语的标记集
    8.3词类标注
    8.4基于规则的词类标注
    8.5随机词类标注
    8.5.1说明问题的一个例子
    8.5.2实际的hmm标注算法
    8.6基于转换的标注
    8.6.1怎样应用tbl规则
    8.6.2怎样学习tbl规则
    8.7其他问题
    8.7.1多重标记和多项词
    8.7.2未知词
    8.7.3基于类的n元语法
    8.8小结
    8.9文献和历史说明

    第9章英语的上下文无关语法
    9.1组成性
    9.2上下文无关规则和树
    9.3句子级的结构
    9.4名词短语
    9.4.1在中心名词前的成分
    9.4.2名词后的成分
    9.5并列关系
    9.6一致关系
    9.7动词短语和次范畴化
    9.8助动词
    9.9口语的句法
    9.9.1不流畅现象
    9.10语法等价与范式
    9.11有限状态语法和上下文无关语法
    9.12语法和人的语言处理
    9.13小结
    9.14文献和历史说明

    第10章基于上下文无关语法的剖析
    10.1剖析就是搜索
    10.1.1自顶向下剖析
    10.1.2自底向上剖析
    10.1.3自顶向下剖析与自底向上剖析的对比
    10.2基本的自顶向下剖析
    10.2.1增加自底向上过滤
    10.3基本的自顶向下剖析的问题
    10.3.1左递归
    10.3.2歧义
    10.3.3子树的重复剖析
    10.4earley算法
    10.4.1预测
    10.4.2扫描
    10.4.3完成
    10.4.4示例
    10.4.5从线图中检索剖析树
    10.5有限状态剖析方法
    10.6小结
    10.7文献和历史说明

    第11章特征与合一
    11.1特征结构
    11.2特征结构的合一
    11.3语法中的特征结构
    11.3.1一致关系
    11.3.2中心语特征
    11.3.3次范畴化
    11.3.4其他词类的次范畴化
    11.3.5长距离依存关系
    11.4合一的实现
    11.4.1合一的数据结构
    11.4.2合一算法
    11.5带有合一约束的剖析
    11.5.1把合一结合到earley剖析器中
    11.5.2复制的必要性
    11.5.3合一剖析
    11.6类型与继承
    11.6.1类型的扩充
    11.6.2合一的其他扩充
    11.7小结
    11.8文献和历史说明

    第12章词汇化剖析与概率剖析
    12.1概率上下文无关语法
    12.1.1pcfg的概率cyk剖析
    12.1.2pcfg概率的学习
    12.2pcfg的问题
    12.3概率词汇化的cfg
    12.4依存语法
    12.4.1范畴语法
    12.5人的剖析
    12.6小结
    12.7文献和历史说明

    第13章语言的复杂性
    13.1chomsky层级
    13.2怎么判断一种语言不是正则的
    13.2.1抽吸引理
    13.2.2英语和其他自然语言是正则语言吗
    13.3自然语言是上下文无关的吗
    13.4计算复杂性和人的语言处理
    13.5小结
    13.6文献和历史说明

    第三部分语义的计算机处理
    第14章意义的表示法
    14.1意义表示的计算要求
    14.1.1可能性验证
    14.1.2无歧义表示
    14.1.3规范形式
    14.1.4推论与变元
    14.1.5表达能力
    14.2语言的意义结构
    14.2.1谓词论元结构
    14.3一阶谓词演算
    14.3.1fopc基础
    14.3.2fopc的语义
    14.3.3变量和逻辑量词
    14.3.4推论
    14.4某些与语言学相关的概念
    14.4.1范畴
    14.4.2事件
    14.4.3时间表示
    14.4.4体
    14.4.5信念表示
    14.4.6缺陷
    14.5有关的表示方法
    14.6意义的其他表示方法
    14.6.1作为行动的意义
    14.6.2作为真值的意义
    14.7小结
    14.8文献和历史说明

    第15章语义分析
    15.1句法驱动的语义分析
    15.1.1给上下文无关语法规则扩充语义
    15.1.2量词辖域和复杂项的转译
    15.2给英语片断附加语义分析
    15.2.1句子
    15.2.2名词短语
    15.2.3动词短语
    15.2.4介词短语
    15.3把语义分析结合到earley剖析中
    15.4惯用语和组成性
    15.5鲁棒的语义分析
    15.5.1语义语法
    15.5.2信息抽取
    15.6小结
    15.7文献和历史说明

    第16章词汇语义学
    16.1词位及其涵义之间的关系
    16.1.1同形关系
    16.1.2多义关系
    16.1.3同义关系
    16.1.4上下位关系
    16.2wordnet:词汇关系信息库
    16.3词的内在结构
    16.3.1题元角色
    16.3.2选择限制
    16.3.3基元分解
    16.3.4语义场
    16.4语言的创造性与词典
    16.4.1隐喻
    16.4.2换喻
    16.4.3隐喻和换喻的计算方法
    16.5小结
    16.6文献和历史说明

    第17章词义排歧与信息检索
    17.1基于选择限制的排歧
    17.1.1选择限制的局限性
    17.2鲁棒的词义排歧
    17.2.1机器学习方法
    17.2.2基于词典的方法
    17.3信息检索
    17.3.1向量空间模型
    17.3.2检索词加权
    17.3.3检索词的选择和创造
    17.3.4同形关系、多义关系和同义关系
    17.3.5改进用户的查询条件
    17.4信息检索的其他任务
    17.5小结
    17.6文献和历史说明

    第四部分语用的计算机处理
    第18章话语
    18.1所指判定
    18.1.1所指现象
    18.1.2同指的句法和语义约束
    18.1.3代词解释中的优先关系
    18.1.4代词判定算法
    18.2文本的连贯
    18.2.1现象
    18.2.2基于推理的判定算法
    18.3话语结构
    18.4所指和连贯的心理语言学研究
    18.5小结
    18.6文献和历史说明

    第19章对话与会话智能代理
    19.1什么使对话出现差别
    19.1.1话轮和话段
    19.1.2对话的共同基础
    19.1.3会话隐涵
    19.2对话行为
    19.3对话行为的自动解释
    19.3.1对话行为的计划推理解释
    19.3.2对话行为的基于提示的解释
    19.3.3要点
    19.4对话结构与连贯性
    19.5会话智能代理中的对话管理
    19.6小结
    19.7文献和历史说明

    第20章自然语言生成
    20.1语言生成导引
    20.2生成的体系结构
    20.3表层实现
    20.3.1系统语法
    20.3.2功能合一语法
    20.3.3要点
    20.4话语规划
    20.4.1文本说明图
    20.4.2修辞关系
    20.4.3小结
    20.5其他问题
    20.5.1微规划
    20.5.2词汇选择
    20.5.3生成系统评价
    20.5.4语音生成
    20.6小结
    20.7文献和历史说明

    第21章机器翻译
    21.1语言的相似性和差异性
    21.2转换模型
    21.2.1句法转换
    21.2.2词汇转换
    21.3中间语的思想:使用意义
    21.4直接转换
    21.5使用统计技术
    21.5.1流畅性的量化
    21.5.2忠实性的量化
    21.5.3输出的搜索
    21.6可用性与系统开发
    21.7小结
    21.8文献和历史说明

    附录a正则表达式的算符
    附录bporterstemming算法
    附录c标记集c5和c7
    附录dhmm模型的训练:向前-向后算法
    参考文献
    术语表
  • 内容简介:
      本书是一本全面系统地讲述计算机自然语言处理的优秀教材。本书英文版出版之后好评如潮,国外许多著名大学纷纷把本书选为自然语言处理和计算语言学课程的主要教材,该书被誉为该领域教材的“黄金标准”。本书包含的内容十分丰富,分为四个部分,共21章,深入细致地探讨了计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。从层次的角度看,本书的论述是按照自然语言的不同层面逐步展开的,首先论述单词的自动形态分析,接着论述自动句法分析,然后论述各种语言单位的自动语义分析,最后论述连贯文本的自动分析、对话与会话的智能代理以及自然语言生成。从技术的角度看,本书介绍了正则表达式、有限状态自动机、文本-语音转换、发音与拼写的概率模型、词类自动标注、N元语法、隐马尔可夫模型、上下文无关语法、特征与合一、词汇化剖析与概率剖析、一阶谓词演算、词义排歧、修辞结构理论、机器翻译等非常广泛的内容。本书具有“覆盖全面、注重实用、强调评测、语料为本”四大特色。在本书的配套网站上,还提供了相关的资源和工具,便于读者在实践中进一步提高。
  • 作者简介:
    Daniel Jurafsky
    在美国加利福尼亚大学获计算机科学博士学位, 现于美国科罗拉多大学语言学系和计算机科学系任教, 并在认知科学研究所工作, 主要研究方向为语言的概率模型和语音信息处理. 由于他在语音和语言处理方面的成就, 于1997年获美国NSF职业奖.
    James H.Martin
    在美国加利福尼亚大学获计算机科学博士学位, 现任职于美国科罗拉多大学计算机科学系和认知科学研究所, 主要研究方向为计算语义学. 机器学习和信息检索.
    冯志伟国家教育部语言文字应用研究所研究员. 博士生导师. 先后在北京大学和中国科学技术大学获双硕士位, 在语音和语言的计算机处理领域具有多年的研究经验, 曾在多个国家参与研究和教学工作, 主要研究方向为自然语言处理. 计算语言学和机器翻译, 主要著作有《自然语言的计算机处理》和《数理语言学》等18部。
  • 目录:
    第1章导论
    1.1语音与语言处理中的知识
    1.2歧义
    1.3模型和算法
    1.4语言、思维和理解
    1.5学科现状与近期发展
    1.6语音和语言处理简史
    1.6.1基础研究:20世纪40年代和20世纪50年代
    1.6.2两个阵营:1957年至1970年
    1.6.3四个范型:1970年至1983年
    1.6.4经验主义和有限状态模型的复苏:1983年至1993年
    1.6.5不同领域的合流:1994年至1999年
    1.6.6多重发现
    1.6.7心理学的简要注记
    1.7小结
    1.8文献和历史说明

    第一部分词汇的计算机处理
    第2章正则表达式与自动机
    2.1正则表达式
    2.1.1基本正则表达式模式
    2.1.2析取、组合与优先关系
    2.1.3一个简单的例子
    2.1.4一个比较复杂的例子
    2.1.5高级算符
    2.1.6正则表达式中的替换、存储器与eliza
    2.2有限状态自动机
    2.2.1用fsa来识别羊的语言
    2.2.2形式语言
    2.2.3另外的例子
    2.2.4非确定fsa
    2.2.5使用nfsa接收符号串
    2.2.6识别就是搜索
    2.2.7确定自动机与非确定自动机的关系
    2.3正则语言与fsa
    2.4小结
    2.5文献和历史说明

    第3章形态学与有限状态转录机
    3.1英语形态学概观
    3.1.1屈折形态学
    3.1.2派生形态学
    3.2有限状态形态剖析
    3.2.1词表和形态顺序规则
    3.2.2用有限状态转录机进行形态剖析
    3.2.3正词法规则和有限状态转录机
    3.3把fst词表与规则相结合
    3.4与词表无关的fst:porter词干处理器
    3.5人是怎样进行形态处理的
    3.6小结
    3.7文献和历史说明

    第4章计算音系学与文本-语音转换
    4.1言语语音与语音标音法
    4.1.1发音器官
    4.1.2辅音:发音部位
    4.1.3辅音:发音方法
    4.1.4元音
    4.1.5音节
    4.2音位和音位规则
    4.3音位规则和转录机
    4.4计算音系学中的一些高级问题
    4.4.1元音和谐
    4.4.2模板式形态学
    4.4.3优选理论
    4.5音位规则的机器学习
    4.6tts中从文本映射到语音
    4.6.1发音词典
    4.6.2词典之外的查找:文本分析
    4.6.3基于有限状态转录机(fst)的发音词典
    4.7文本-语音转换中的韵律
    4.7.1韵律的音系学性质
    4.7.2韵律的语音和声学性质
    4.7.3语音合成中的韵律
    4.8人处理音位和形态的过程
    4.9小结
    4.10文献和历史说明

    第5章发音与拼写的概率模型
    5.1关于拼写错误
    5.2拼写错误模式
    5.3非词错误的检查
    5.4概率模型
    5.5把贝叶斯方法应用于拼写
    5.6最小编辑距离
    5.7英语的发音变异
    5.8发音问题研究中的贝叶斯方法
    5.8.1发音变异的决策树模型
    5.9加权自动机
    5.9.1从加权自动机计算似然度:向前算法
    5.9.2解码:viterbi算法
    5.9.3加权自动机和切分
    5.9.4用切分来进行词表的自动归纳
    5.10人类发音研究
    5.11小结
    5.12文献和历史说明

    第6章n元语法
    6.1语料库中单词数目的计算
    6.2简单的(非平滑的)n元语法
    6.2.1n元语法及其对训练语料库的敏感性
    6.3平滑
    6.3.1加1平滑
    6.3.2witten-bell打折法
    6.3.3good-turing打折法
    6.4回退
    6.4.1回退与打折相结合
    6.5删除插值法
    6.6拼写和发音的n元语法
    6.6.1上下文有关的错拼更正
    6.6.2发音模型的n元语法
    6.7熵
    6.7.1用于比较模型的交叉熵
    6.7.2英语的熵
    6.8小结
    6.9文献和历史说明

    第7章hmm与语音识别
    7.1语音识别的总体结构
    7.2隐马尔可夫模型概述
    7.3再谈viterbi算法
    7.4先进的解码方法
    7.4.1a*解码算法
    7.5语音的声学处理
    7.5.1声波
    7.5.2怎样解释波形
    7.5.3声谱
    7.5.4特征抽取
    7.6声学概率的计算
    7.7语音识别系统的训练
    7.8用于语音合成的波形生成
    7.8.1音高和音延的修正
    7.8.2单元选择
    7.9人的语音识别
    7.10小结
    7.11文献和历史说明

    第二部分句法的计算机处理
    第8章词的分类与词类标注
    8.1大多数英语词的分类
    8.2英语的标记集
    8.3词类标注
    8.4基于规则的词类标注
    8.5随机词类标注
    8.5.1说明问题的一个例子
    8.5.2实际的hmm标注算法
    8.6基于转换的标注
    8.6.1怎样应用tbl规则
    8.6.2怎样学习tbl规则
    8.7其他问题
    8.7.1多重标记和多项词
    8.7.2未知词
    8.7.3基于类的n元语法
    8.8小结
    8.9文献和历史说明

    第9章英语的上下文无关语法
    9.1组成性
    9.2上下文无关规则和树
    9.3句子级的结构
    9.4名词短语
    9.4.1在中心名词前的成分
    9.4.2名词后的成分
    9.5并列关系
    9.6一致关系
    9.7动词短语和次范畴化
    9.8助动词
    9.9口语的句法
    9.9.1不流畅现象
    9.10语法等价与范式
    9.11有限状态语法和上下文无关语法
    9.12语法和人的语言处理
    9.13小结
    9.14文献和历史说明

    第10章基于上下文无关语法的剖析
    10.1剖析就是搜索
    10.1.1自顶向下剖析
    10.1.2自底向上剖析
    10.1.3自顶向下剖析与自底向上剖析的对比
    10.2基本的自顶向下剖析
    10.2.1增加自底向上过滤
    10.3基本的自顶向下剖析的问题
    10.3.1左递归
    10.3.2歧义
    10.3.3子树的重复剖析
    10.4earley算法
    10.4.1预测
    10.4.2扫描
    10.4.3完成
    10.4.4示例
    10.4.5从线图中检索剖析树
    10.5有限状态剖析方法
    10.6小结
    10.7文献和历史说明

    第11章特征与合一
    11.1特征结构
    11.2特征结构的合一
    11.3语法中的特征结构
    11.3.1一致关系
    11.3.2中心语特征
    11.3.3次范畴化
    11.3.4其他词类的次范畴化
    11.3.5长距离依存关系
    11.4合一的实现
    11.4.1合一的数据结构
    11.4.2合一算法
    11.5带有合一约束的剖析
    11.5.1把合一结合到earley剖析器中
    11.5.2复制的必要性
    11.5.3合一剖析
    11.6类型与继承
    11.6.1类型的扩充
    11.6.2合一的其他扩充
    11.7小结
    11.8文献和历史说明

    第12章词汇化剖析与概率剖析
    12.1概率上下文无关语法
    12.1.1pcfg的概率cyk剖析
    12.1.2pcfg概率的学习
    12.2pcfg的问题
    12.3概率词汇化的cfg
    12.4依存语法
    12.4.1范畴语法
    12.5人的剖析
    12.6小结
    12.7文献和历史说明

    第13章语言的复杂性
    13.1chomsky层级
    13.2怎么判断一种语言不是正则的
    13.2.1抽吸引理
    13.2.2英语和其他自然语言是正则语言吗
    13.3自然语言是上下文无关的吗
    13.4计算复杂性和人的语言处理
    13.5小结
    13.6文献和历史说明

    第三部分语义的计算机处理
    第14章意义的表示法
    14.1意义表示的计算要求
    14.1.1可能性验证
    14.1.2无歧义表示
    14.1.3规范形式
    14.1.4推论与变元
    14.1.5表达能力
    14.2语言的意义结构
    14.2.1谓词论元结构
    14.3一阶谓词演算
    14.3.1fopc基础
    14.3.2fopc的语义
    14.3.3变量和逻辑量词
    14.3.4推论
    14.4某些与语言学相关的概念
    14.4.1范畴
    14.4.2事件
    14.4.3时间表示
    14.4.4体
    14.4.5信念表示
    14.4.6缺陷
    14.5有关的表示方法
    14.6意义的其他表示方法
    14.6.1作为行动的意义
    14.6.2作为真值的意义
    14.7小结
    14.8文献和历史说明

    第15章语义分析
    15.1句法驱动的语义分析
    15.1.1给上下文无关语法规则扩充语义
    15.1.2量词辖域和复杂项的转译
    15.2给英语片断附加语义分析
    15.2.1句子
    15.2.2名词短语
    15.2.3动词短语
    15.2.4介词短语
    15.3把语义分析结合到earley剖析中
    15.4惯用语和组成性
    15.5鲁棒的语义分析
    15.5.1语义语法
    15.5.2信息抽取
    15.6小结
    15.7文献和历史说明

    第16章词汇语义学
    16.1词位及其涵义之间的关系
    16.1.1同形关系
    16.1.2多义关系
    16.1.3同义关系
    16.1.4上下位关系
    16.2wordnet:词汇关系信息库
    16.3词的内在结构
    16.3.1题元角色
    16.3.2选择限制
    16.3.3基元分解
    16.3.4语义场
    16.4语言的创造性与词典
    16.4.1隐喻
    16.4.2换喻
    16.4.3隐喻和换喻的计算方法
    16.5小结
    16.6文献和历史说明

    第17章词义排歧与信息检索
    17.1基于选择限制的排歧
    17.1.1选择限制的局限性
    17.2鲁棒的词义排歧
    17.2.1机器学习方法
    17.2.2基于词典的方法
    17.3信息检索
    17.3.1向量空间模型
    17.3.2检索词加权
    17.3.3检索词的选择和创造
    17.3.4同形关系、多义关系和同义关系
    17.3.5改进用户的查询条件
    17.4信息检索的其他任务
    17.5小结
    17.6文献和历史说明

    第四部分语用的计算机处理
    第18章话语
    18.1所指判定
    18.1.1所指现象
    18.1.2同指的句法和语义约束
    18.1.3代词解释中的优先关系
    18.1.4代词判定算法
    18.2文本的连贯
    18.2.1现象
    18.2.2基于推理的判定算法
    18.3话语结构
    18.4所指和连贯的心理语言学研究
    18.5小结
    18.6文献和历史说明

    第19章对话与会话智能代理
    19.1什么使对话出现差别
    19.1.1话轮和话段
    19.1.2对话的共同基础
    19.1.3会话隐涵
    19.2对话行为
    19.3对话行为的自动解释
    19.3.1对话行为的计划推理解释
    19.3.2对话行为的基于提示的解释
    19.3.3要点
    19.4对话结构与连贯性
    19.5会话智能代理中的对话管理
    19.6小结
    19.7文献和历史说明

    第20章自然语言生成
    20.1语言生成导引
    20.2生成的体系结构
    20.3表层实现
    20.3.1系统语法
    20.3.2功能合一语法
    20.3.3要点
    20.4话语规划
    20.4.1文本说明图
    20.4.2修辞关系
    20.4.3小结
    20.5其他问题
    20.5.1微规划
    20.5.2词汇选择
    20.5.3生成系统评价
    20.5.4语音生成
    20.6小结
    20.7文献和历史说明

    第21章机器翻译
    21.1语言的相似性和差异性
    21.2转换模型
    21.2.1句法转换
    21.2.2词汇转换
    21.3中间语的思想:使用意义
    21.4直接转换
    21.5使用统计技术
    21.5.1流畅性的量化
    21.5.2忠实性的量化
    21.5.3输出的搜索
    21.6可用性与系统开发
    21.7小结
    21.8文献和历史说明

    附录a正则表达式的算符
    附录bporterstemming算法
    附录c标记集c5和c7
    附录dhmm模型的训练:向前-向后算法
    参考文献
    术语表
查看详情