Python自然语言处理

Python自然语言处理
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , , , , , , ,
2014-06
版次: 01
ISBN: 9787115333681
定价: 89.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 487页
字数: 559千字
正文语种: 简体中文
原版书名: Natural Language Processing With Python
419人买过
  •   自然语言处理(NaturalLanguageProcessing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及所有用计算机对自然语言进行的操作。
      《Python自然语言处理》是自然语言处理领域的一本实用入门指南,旨在帮助读者学习如何编写程序来分析书面语言。《Python自然语言处理》基于Python编程语言以及一个名为NLTK的自然语言工具包的开源库,但并不要求读者有Python编程的经验。全书共11章,按照难易程度顺序编排。第1章到第3章介绍了语言处理的基础,讲述如何使用小的Python程序分析感兴趣的文本信息。第4章讨论结构化程序设计,以巩固前面几章中介绍的编程要点。第5章到第7章介绍语言处理的基本原理,包括标注、分类和信息提取等。第8章到第10章介绍了句子解析、句法结构识别和句意表达方法。第11章介绍了如何有效管理语言数据。后记部分简要讨论了NLP领域的过去和未来。
      《Python自然语言处理》的实践性很强,包括上百个实际可用的例子和分级练习。《Python自然语言处理》可供读者用于自学,也可以作为自然语言处理或计算语言学课程的教科书,还可以作为人工智能、文本挖掘、语料库语言学等课程的补充读物。   Steven Bird是墨尔本大学计算机科学和软件工程系副教授,宾夕法尼亚大学语言学数据联盟高级研究助理。

      Ewan Klein是爱丁堡大学信息学院语言技术教授。

      Edward Loper是毕业于宾夕法尼亚大学专注于机器学习的自然语言处理方向的博士,现在在波士顿的BBN Technologies担任研究员。 目 录

    第1章 语言处理与Python 1
    1.1 语言计算:文本和词汇 1
    1.2 近观Python:将文本当做词链表 10
    1.3 计算语言:简单的统计 17
    1.4 回到Python:决策与控制 24
    1.5 自动理解自然语言 29
    1.6 小结 35
    1.7 深入阅读 36
    1.8 练习 37

    第2章 获得文本语料和词汇资源 41
    2.1 获取文本语料库 41
    2.2 条件频率分布 55
    2.3 更多关于Python:代码重用 60
    2.4 词典资源 63
    2.5 WordNet 72
    2.6 小结 78
    2.7 深入阅读 79
    2.8 练习 80

    第3章 处理原始文本 84
    3.1 从网络和硬盘访问文本 84
    3.2 字符串:最底层的文本处理 93
    3.3 使用Unicode进行文字处理 100
    3.4 使用正则表达式检测词组搭配 105
    3.5 正则表达式的有益应用 109
    3.6 规范化文本 115
    3.7 用正则表达式为文本分词 118
    3.8 分割 121
    3.9 格式化:从链表到字符串 126
    3.10 小结 132
    3.11 深入阅读 133
    3.12 练习 134

    第4章 编写结构化程序 142
    4.1 回到基础 142
    4.2 序列 147
    4.3 风格的问题 152
    4.4 函数:结构化编程的基础 156
    4.5 更多关于函数 164
    4.6 程序开发 169
    4.7 算法设计 175
    4.8 Python库的样例 183
    4.9 小结 188
    4.10 深入阅读 189
    4.11 练习 189

    第5章 分类和标注词汇 195
    5.1 使用词性标注器 195
    5.2 标注语料库 197
    5.3 使用Python字典映射词及其属性 206
    5.4 自动标注 216
    5.5 N-gram标注 221
    5.6 基于转换的标注 228
    5.7 如何确定一个词的分类 230
    5.8 小结 233
    5.9 深入阅读 234
    5.10 练习 235

    第6章 学习分类文本 241
    6.1 监督式分类 241
    6.2 监督式分类的举例 254
    6.3 评估 258
    6.4 决策树 263
    6.5 朴素贝叶斯分类器 266
    6.6 最大熵分类器 271
    6.7 为语言模式建模 275
    6.8 小结 276
    6.9 深入阅读 277
    6.10 练习 278

    第7章 从文本提取信息 281
    7.1 信息提取 281
    7.2 分块 284
    7.3 开发和评估分块器 291
    7.4 语言结构中的递归 299
    7.5 命名实体识别 302
    7.6 关系抽取 306
    7.7 小结 307
    7.8 深入阅读 308
    7.9 练习 308

    第8章 分析句子结构 312
    8.1 一些语法困境 312
    8.2 文法的用途 316
    8.3 上下文无关文法 319
    8.4 上下文无关文法分析 323
    8.5 依存关系和依存文法 332
    8.6 文法开发 336
    8.7 小结 343
    8.8 深入阅读 344
    8.9 练习 344

    第9章 建立基于特征的文法 349
    9.1 文法特征 349
    9.2 处理特征结构 359
    9.3 扩展基于特征的文法 367
    9.4 小结 379
    9.5 深入阅读 380
    9.6 练习 381

    第10章 分析语句的含义 384
    10.1 自然语言理解 384
    10.2 命题逻辑 391
    10.3 一阶逻辑 395
    10.4 英语语句的语义 409
    10.5 段落语义层 422
    10.6 小结 428
    10.7 深入阅读 429
    10.8 练习 430

    第11章 语言数据管理 434
    11.1 语料库结构:案例研究 434
    11.2 语料库生命周期 439
    11.3 数据采集 443
    11.4 使用XML 452
    11.5 使用Toolbox数据 459
    11.6 使用OLAC元数据描述语言资源 463
    11.7 小结 466
    11.8 深入阅读 466
    11.9 练习 467

    后记 470
    参考文献 476
  • 内容简介:
      自然语言处理(NaturalLanguageProcessing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及所有用计算机对自然语言进行的操作。
      《Python自然语言处理》是自然语言处理领域的一本实用入门指南,旨在帮助读者学习如何编写程序来分析书面语言。《Python自然语言处理》基于Python编程语言以及一个名为NLTK的自然语言工具包的开源库,但并不要求读者有Python编程的经验。全书共11章,按照难易程度顺序编排。第1章到第3章介绍了语言处理的基础,讲述如何使用小的Python程序分析感兴趣的文本信息。第4章讨论结构化程序设计,以巩固前面几章中介绍的编程要点。第5章到第7章介绍语言处理的基本原理,包括标注、分类和信息提取等。第8章到第10章介绍了句子解析、句法结构识别和句意表达方法。第11章介绍了如何有效管理语言数据。后记部分简要讨论了NLP领域的过去和未来。
      《Python自然语言处理》的实践性很强,包括上百个实际可用的例子和分级练习。《Python自然语言处理》可供读者用于自学,也可以作为自然语言处理或计算语言学课程的教科书,还可以作为人工智能、文本挖掘、语料库语言学等课程的补充读物。
  • 作者简介:
      Steven Bird是墨尔本大学计算机科学和软件工程系副教授,宾夕法尼亚大学语言学数据联盟高级研究助理。

      Ewan Klein是爱丁堡大学信息学院语言技术教授。

      Edward Loper是毕业于宾夕法尼亚大学专注于机器学习的自然语言处理方向的博士,现在在波士顿的BBN Technologies担任研究员。
  • 目录:
    目 录

    第1章 语言处理与Python 1
    1.1 语言计算:文本和词汇 1
    1.2 近观Python:将文本当做词链表 10
    1.3 计算语言:简单的统计 17
    1.4 回到Python:决策与控制 24
    1.5 自动理解自然语言 29
    1.6 小结 35
    1.7 深入阅读 36
    1.8 练习 37

    第2章 获得文本语料和词汇资源 41
    2.1 获取文本语料库 41
    2.2 条件频率分布 55
    2.3 更多关于Python:代码重用 60
    2.4 词典资源 63
    2.5 WordNet 72
    2.6 小结 78
    2.7 深入阅读 79
    2.8 练习 80

    第3章 处理原始文本 84
    3.1 从网络和硬盘访问文本 84
    3.2 字符串:最底层的文本处理 93
    3.3 使用Unicode进行文字处理 100
    3.4 使用正则表达式检测词组搭配 105
    3.5 正则表达式的有益应用 109
    3.6 规范化文本 115
    3.7 用正则表达式为文本分词 118
    3.8 分割 121
    3.9 格式化:从链表到字符串 126
    3.10 小结 132
    3.11 深入阅读 133
    3.12 练习 134

    第4章 编写结构化程序 142
    4.1 回到基础 142
    4.2 序列 147
    4.3 风格的问题 152
    4.4 函数:结构化编程的基础 156
    4.5 更多关于函数 164
    4.6 程序开发 169
    4.7 算法设计 175
    4.8 Python库的样例 183
    4.9 小结 188
    4.10 深入阅读 189
    4.11 练习 189

    第5章 分类和标注词汇 195
    5.1 使用词性标注器 195
    5.2 标注语料库 197
    5.3 使用Python字典映射词及其属性 206
    5.4 自动标注 216
    5.5 N-gram标注 221
    5.6 基于转换的标注 228
    5.7 如何确定一个词的分类 230
    5.8 小结 233
    5.9 深入阅读 234
    5.10 练习 235

    第6章 学习分类文本 241
    6.1 监督式分类 241
    6.2 监督式分类的举例 254
    6.3 评估 258
    6.4 决策树 263
    6.5 朴素贝叶斯分类器 266
    6.6 最大熵分类器 271
    6.7 为语言模式建模 275
    6.8 小结 276
    6.9 深入阅读 277
    6.10 练习 278

    第7章 从文本提取信息 281
    7.1 信息提取 281
    7.2 分块 284
    7.3 开发和评估分块器 291
    7.4 语言结构中的递归 299
    7.5 命名实体识别 302
    7.6 关系抽取 306
    7.7 小结 307
    7.8 深入阅读 308
    7.9 练习 308

    第8章 分析句子结构 312
    8.1 一些语法困境 312
    8.2 文法的用途 316
    8.3 上下文无关文法 319
    8.4 上下文无关文法分析 323
    8.5 依存关系和依存文法 332
    8.6 文法开发 336
    8.7 小结 343
    8.8 深入阅读 344
    8.9 练习 344

    第9章 建立基于特征的文法 349
    9.1 文法特征 349
    9.2 处理特征结构 359
    9.3 扩展基于特征的文法 367
    9.4 小结 379
    9.5 深入阅读 380
    9.6 练习 381

    第10章 分析语句的含义 384
    10.1 自然语言理解 384
    10.2 命题逻辑 391
    10.3 一阶逻辑 395
    10.4 英语语句的语义 409
    10.5 段落语义层 422
    10.6 小结 428
    10.7 深入阅读 429
    10.8 练习 430

    第11章 语言数据管理 434
    11.1 语料库结构:案例研究 434
    11.2 语料库生命周期 439
    11.3 数据采集 443
    11.4 使用XML 452
    11.5 使用Toolbox数据 459
    11.6 使用OLAC元数据描述语言资源 463
    11.7 小结 466
    11.8 深入阅读 466
    11.9 练习 467

    后记 470
    参考文献 476
查看详情
相关图书 / 更多
Python自然语言处理
Python游戏开发从入门到进阶实战
明日科技 编著
Python自然语言处理
Pylon
Faulkner;William
Python自然语言处理
PyTorch深度学习指南:计算机视觉 卷II 王兆宇
(巴西)丹尼尔·沃格特·戈多伊
Python自然语言处理
PyTorch深度学习指南:序列与自然语言处理 卷III
(巴西)丹尼尔·沃格特·戈多伊(Daniel Voigt Godoy)
Python自然语言处理
PyTorch深度学习指南:编程基础 卷I
(巴西)丹尼尔·沃格特·戈多伊
Python自然语言处理
Python数据分析快速上手
王靖、商艳红、张洪波、卢军
Python自然语言处理
Python在结构动力计算中的应用
龙晓鸿 等
Python自然语言处理
Python金融量化实战固定收益类产品分析
欧晨
Python自然语言处理
Python量子计算实践:基于Qiskit和IBM Quantum Experience平台
(美)哈西·诺伦(Hassi Norlén)
Python自然语言处理
Python Streamlit从入门到实战——快速构建机器学习和数据科学Web应用(微课视频版)
王鑫
Python自然语言处理
Python编程:时间序列分析入门与实战应用
王恺
Python自然语言处理
Python语言科研绘图与学术图表绘制从入门到精通 科技绘图与科学可视化专业教程
关东升 编著
您可能感兴趣 / 更多
Python自然语言处理
从一到无穷大(爱因斯坦亲笔推荐的科普入门书,清华大学校长送给新生的礼物;世界著名物理学家、宇宙大爆炸学说的先驱)
[美]乔治·伽莫夫 著;栗子文化 出品;有容书邦 发行
Python自然语言处理
明信片(《断背山》作者又一力作,荣获福克纳文学奖,49张明信片背后是100种离奇人生)
[美]安妮·普鲁 著;黄宜思 译
Python自然语言处理
欲望行星:人类时代的地球
[美]唐纳德·沃斯特(Donald Worster) 著;侯深 译;汉唐阳光 出品
Python自然语言处理
超大规模集成电路物理设计:从图分割到时序收敛(原书第2版) [美国]安德·B.卡恩
[美]安德·B.卡恩
Python自然语言处理
海外中国研究·文化、权力与国家:1900—1942年的华北农村(海外中国研究丛书精选版第四辑)
[美]杜赞奇 著;王福明 译
Python自然语言处理
全新正版图书 改变世界的6种力亨利·波卓斯基浙江科学技术出版社9787573910929
[美] 亨利·波卓斯基
Python自然语言处理
(守望者·传记)身体的疯狂朝圣:田纳西·威廉斯传
[美]约翰·拉尔 著;张敏 凌建娥 译
Python自然语言处理
哥白尼
[美]欧文·金格里奇(Owen Gingerich)
Python自然语言处理
玻璃底片上的宇宙
[美]达娃·索贝尔 后浪
Python自然语言处理
数学侦探 珠宝行里的X劫匪
[美]丹尼尔·肯尼 艾米丽·博艾尔 著 刘玙婧、王婧 译;小博集出品
Python自然语言处理
十大经济学家
[美]约瑟夫·熊彼特
Python自然语言处理
闲散一些也无可厚非
[美]艾莉森·孙 著;李昂 译