自然语言处理基础教程

自然语言处理基础教程
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: , ,
2021-11
版次: 1
ISBN: 9787111692591
定价: 69.00
装帧: 其他
开本: 16开
纸张: 胶版纸
字数: 140千字
35人买过
  • 本书面向初学者介绍了自然语言处理的基础知识,包括词法分析、句法分析、基于机器学习的文本分析、深度学习与神经网络、词嵌入与词向量以及自然语言处理与卷积神经网络、循环神经网络技术及应用。本书深入浅出,案例丰富,可作为高校人工智能、大数据、计算机及相关专业本科生的教材,也可供对自然语言处理有兴趣的技术人员作为参考书。 前言

    第1章 自然语言处理概述1

    1.1 自然语言处理的基本概念1

    1.1.1 什么是自然语言处理1

    1.1.2 自然语言处理的层次2

    1.1.3 自然语言处理的发展历程3

    1.2 自然语言处理技术面临的困难6

    1.2.1 歧义6

    1.2.2 知识的获取、表达及运用7

    1.2.3 计算问题8

    1.3 自然语言处理的主要研究任务和应用8

    1.3.1 自然语言处理的主要研究任务8

    1.3.2 自然语言处理的典型应用10

    1.4 搭建自然语言处理开发环境11

    1.4.1 Anaconda11

    1.4.2 scikit-learn15

    1.4.3 Jupyter Notebook15

    1.5 本章小结16

    1.6 习题17

    第2章 词法分析18

    2.1 什么是词法分析18

    2.2 分词19

    2.2.1 中文分词简介19

    2.2.2 基于词典的分词方法20

    2.2.3 基于统计的分词方法21

    2.2.4 实例—使用N-gram语言模型进行语法纠正24

    2.2.5 中文分词工具简介27

    2.2.6 实例—使用jieba进行高频词提取30

    2.3 关键词提取32

    2.3.1 TF-IDF算法32

    2.3.2 TextRank算法33

    2.3.3 实例—提取文本关键词34

    2.4 词性标注40

    2.4.1 词性标注简介40

    2.4.2 隐马尔可夫模型41

    2.4.3 Viterbi算法43

    2.4.4 熵模型44

    2.5 命名实体识别46

    2.5.1 命名实体识别简介46

    2.5.2 条件随机场模型47

    2.5.3 实例—使用jieba进行日期识别48

    2.6 本章小结52

    2.7 习题53

    第3章 句法分析54

    3.1 什么是句法分析54

    3.2 句法分析树库及性能评测56

    3.2.1 句法分析语料库56

    3.2.2 句法分析模型的性能评测59

    3.3 概率上下文无关文法59

    3.4 依存句法分析62

    3.4.1 基于图模型的依存句法分析63

    3.4.2 基于转移模型的依存句法分析63

    3.5 中文句法分析工具简介65

    3.6 实例—中文句法分析66

    3.7 本章小结68

    3.8 习题68

    第4章 基于机器学习的文本分类69

    4.1 机器学习简介69

    4.1.1 scikit-learn简介71

    4.1.2 机器学习基本概念72

    4.1.3 机器学习问题分类73

    4.2 朴素贝叶斯分类器76

    4.3 逻辑回归分类器80

    4.4 支持向量机分类器84

    4.5 文本聚类89

    4.6 实例—垃圾邮件分类94

    4.7 本章小结99

    4.8 习题99

    第5章 深度学习与神经网络101

    5.1 深度学习与神经网络简介101

    5.2 人工神经网络102

    5.2.1 生物神经元102

    5.2.2 感知器103

    5.2.3 激活函数105

    5.2.4 神经网络110

    5.3 前馈神经网络110

    5.3.1 前馈神经网络的结构110

    5.3.2 前向传播111

    5.3.3 损失函数112

    5.3.4 反向传播算法113

    5.3.5 优化方法114

    5.4 深度学习框架116

    5.4.1 TensorFlow116

    5.4.2 Keras118

    5.4.3 PyTorch119

    5.4.4 PaddlePaddle120

    5.5 实例—使用MLP实现手写数字识别122

    5.5.1 数据准备122

    5.5.2 创建MLP122

    5.5.3 模型训练123

    5.5.4 模型评价124

    5.6 本章小结125

    5.7 习题126

    第6章 词嵌入与词向量127

    6.1 文本向量化127

    6.2 One-Hot编码128

    6.3 词嵌入130

    6.3.1 什么是词嵌入130

    6.3.2 词嵌入的实现131

    6.3.3 语义信息132

    6.4 Word2Vec133

    6.4.1 Word2Vec简介133

    6.4.2 Word2Vec的应用134

    6.4.3 使用gensim包训练词向量136

    6.5 Doc2Vec138

    6.5.1 PV-DM139

    6.5.2 PV-DBOW140

    6.6 实例—利用Doc2Vec计算文档相似度140

    6.6.1 准备语料库140

    6.6.2 定义和训练模型141

    6.6.3 分析文本相似度142

    6.7 本章小结145

    6.8 习题145

    第7章 卷积神经网络与自然语言处理146

    7.1 卷积神经网络简介146

    7.1.1 深层神经网络用于图像处理存在的问题146

    7.1.2 什么是卷积148

    7.1.3 填充150

    7.1.4 步长151

    7.1.5 什么是卷积神经网络151

    7.2 应用卷积神经网络解决自然语言处理问题152

    7.2.1 NLP中的卷积层152

    7.2.2 NLP中的池化层154

    7.2.3 NLP中CNN的基本架构155

    7.3 CNN在应用中的超参数选择156

    7.3.1 激活函数156

    7.3.2 卷积核的大小和个数156

    7.3.3 dropout层156

    7.3.4 softmax分类器157

    7.4 实例—使用CNN实现新闻文本分类158

    7.4.1 准备数据158

    7.4.2 定义和训练模型163

    7.5 本章小结165

    7.6 习题166

    第8章 循环神经网络与自然语言处理167

    8.1 循环神经网络的基本结构168

    8.2 循环神经网络应用于自然语言处理170

    8.2.1 序列到类别170

    8.2.2 同步序列到序列171

    8.2.3 异步序列到序列172

    8.3 循环神经网络的训练173

    8.3.1 随时间反向传播算法173

    8.3.2 权重的更新174

    8.3.3 梯度消失与梯度爆炸175

    8.4 长短期记忆网络175

    8.4.1 细胞状态177

    8.4.2 门控机制177

    8.5 门控循环单元网络181

    8.6 更深的网络184

    8.6.1 堆叠循环神经网络184

    8.6.2 双向循环神经网络185

    8.7 实例—使用LSTM网络实现文本情感分析186

    8.7.1 数据准备186

    8.7.2 构建和训练模型187

    8.8 本章小结190

    8.9 习题191

    第9章 序列到序列模型与注意力机制192

    9.1 序列到序列模型192

    9.1.1 什么是序列到序列模型192

    9.1.2 编码–解码架构193

    9.1.3 编码器194

    9.1.4 解码器195

    9.1.5 模型训练197

    9.2 注意力机制198

    9.2.1 什么是注意力机制198

    9.2.2 计算语义
  • 内容简介:
    本书面向初学者介绍了自然语言处理的基础知识,包括词法分析、句法分析、基于机器学习的文本分析、深度学习与神经网络、词嵌入与词向量以及自然语言处理与卷积神经网络、循环神经网络技术及应用。本书深入浅出,案例丰富,可作为高校人工智能、大数据、计算机及相关专业本科生的教材,也可供对自然语言处理有兴趣的技术人员作为参考书。
  • 目录:
    前言

    第1章 自然语言处理概述1

    1.1 自然语言处理的基本概念1

    1.1.1 什么是自然语言处理1

    1.1.2 自然语言处理的层次2

    1.1.3 自然语言处理的发展历程3

    1.2 自然语言处理技术面临的困难6

    1.2.1 歧义6

    1.2.2 知识的获取、表达及运用7

    1.2.3 计算问题8

    1.3 自然语言处理的主要研究任务和应用8

    1.3.1 自然语言处理的主要研究任务8

    1.3.2 自然语言处理的典型应用10

    1.4 搭建自然语言处理开发环境11

    1.4.1 Anaconda11

    1.4.2 scikit-learn15

    1.4.3 Jupyter Notebook15

    1.5 本章小结16

    1.6 习题17

    第2章 词法分析18

    2.1 什么是词法分析18

    2.2 分词19

    2.2.1 中文分词简介19

    2.2.2 基于词典的分词方法20

    2.2.3 基于统计的分词方法21

    2.2.4 实例—使用N-gram语言模型进行语法纠正24

    2.2.5 中文分词工具简介27

    2.2.6 实例—使用jieba进行高频词提取30

    2.3 关键词提取32

    2.3.1 TF-IDF算法32

    2.3.2 TextRank算法33

    2.3.3 实例—提取文本关键词34

    2.4 词性标注40

    2.4.1 词性标注简介40

    2.4.2 隐马尔可夫模型41

    2.4.3 Viterbi算法43

    2.4.4 熵模型44

    2.5 命名实体识别46

    2.5.1 命名实体识别简介46

    2.5.2 条件随机场模型47

    2.5.3 实例—使用jieba进行日期识别48

    2.6 本章小结52

    2.7 习题53

    第3章 句法分析54

    3.1 什么是句法分析54

    3.2 句法分析树库及性能评测56

    3.2.1 句法分析语料库56

    3.2.2 句法分析模型的性能评测59

    3.3 概率上下文无关文法59

    3.4 依存句法分析62

    3.4.1 基于图模型的依存句法分析63

    3.4.2 基于转移模型的依存句法分析63

    3.5 中文句法分析工具简介65

    3.6 实例—中文句法分析66

    3.7 本章小结68

    3.8 习题68

    第4章 基于机器学习的文本分类69

    4.1 机器学习简介69

    4.1.1 scikit-learn简介71

    4.1.2 机器学习基本概念72

    4.1.3 机器学习问题分类73

    4.2 朴素贝叶斯分类器76

    4.3 逻辑回归分类器80

    4.4 支持向量机分类器84

    4.5 文本聚类89

    4.6 实例—垃圾邮件分类94

    4.7 本章小结99

    4.8 习题99

    第5章 深度学习与神经网络101

    5.1 深度学习与神经网络简介101

    5.2 人工神经网络102

    5.2.1 生物神经元102

    5.2.2 感知器103

    5.2.3 激活函数105

    5.2.4 神经网络110

    5.3 前馈神经网络110

    5.3.1 前馈神经网络的结构110

    5.3.2 前向传播111

    5.3.3 损失函数112

    5.3.4 反向传播算法113

    5.3.5 优化方法114

    5.4 深度学习框架116

    5.4.1 TensorFlow116

    5.4.2 Keras118

    5.4.3 PyTorch119

    5.4.4 PaddlePaddle120

    5.5 实例—使用MLP实现手写数字识别122

    5.5.1 数据准备122

    5.5.2 创建MLP122

    5.5.3 模型训练123

    5.5.4 模型评价124

    5.6 本章小结125

    5.7 习题126

    第6章 词嵌入与词向量127

    6.1 文本向量化127

    6.2 One-Hot编码128

    6.3 词嵌入130

    6.3.1 什么是词嵌入130

    6.3.2 词嵌入的实现131

    6.3.3 语义信息132

    6.4 Word2Vec133

    6.4.1 Word2Vec简介133

    6.4.2 Word2Vec的应用134

    6.4.3 使用gensim包训练词向量136

    6.5 Doc2Vec138

    6.5.1 PV-DM139

    6.5.2 PV-DBOW140

    6.6 实例—利用Doc2Vec计算文档相似度140

    6.6.1 准备语料库140

    6.6.2 定义和训练模型141

    6.6.3 分析文本相似度142

    6.7 本章小结145

    6.8 习题145

    第7章 卷积神经网络与自然语言处理146

    7.1 卷积神经网络简介146

    7.1.1 深层神经网络用于图像处理存在的问题146

    7.1.2 什么是卷积148

    7.1.3 填充150

    7.1.4 步长151

    7.1.5 什么是卷积神经网络151

    7.2 应用卷积神经网络解决自然语言处理问题152

    7.2.1 NLP中的卷积层152

    7.2.2 NLP中的池化层154

    7.2.3 NLP中CNN的基本架构155

    7.3 CNN在应用中的超参数选择156

    7.3.1 激活函数156

    7.3.2 卷积核的大小和个数156

    7.3.3 dropout层156

    7.3.4 softmax分类器157

    7.4 实例—使用CNN实现新闻文本分类158

    7.4.1 准备数据158

    7.4.2 定义和训练模型163

    7.5 本章小结165

    7.6 习题166

    第8章 循环神经网络与自然语言处理167

    8.1 循环神经网络的基本结构168

    8.2 循环神经网络应用于自然语言处理170

    8.2.1 序列到类别170

    8.2.2 同步序列到序列171

    8.2.3 异步序列到序列172

    8.3 循环神经网络的训练173

    8.3.1 随时间反向传播算法173

    8.3.2 权重的更新174

    8.3.3 梯度消失与梯度爆炸175

    8.4 长短期记忆网络175

    8.4.1 细胞状态177

    8.4.2 门控机制177

    8.5 门控循环单元网络181

    8.6 更深的网络184

    8.6.1 堆叠循环神经网络184

    8.6.2 双向循环神经网络185

    8.7 实例—使用LSTM网络实现文本情感分析186

    8.7.1 数据准备186

    8.7.2 构建和训练模型187

    8.8 本章小结190

    8.9 习题191

    第9章 序列到序列模型与注意力机制192

    9.1 序列到序列模型192

    9.1.1 什么是序列到序列模型192

    9.1.2 编码–解码架构193

    9.1.3 编码器194

    9.1.4 解码器195

    9.1.5 模型训练197

    9.2 注意力机制198

    9.2.1 什么是注意力机制198

    9.2.2 计算语义
查看详情
相关图书 / 更多
自然语言处理基础教程
自然的概念(科学人文名著译丛)
怀特海
自然语言处理基础教程
自然拼读记单词
本书编写组
自然语言处理基础教程
自然的童话:毕翠克丝·波特的艺术世界
英国维多利亚与艾尔伯特博物馆(V&A) 编者;赵娟 译者;[英]毕翠克丝·波特 绘者;中国国家地理·图书 出品;赵世玲
自然语言处理基础教程
自然资源管理的重新构想:运用系统生态学范式(自然资源与生态文明译丛)
(美)罗伯特·G.伍德曼斯
自然语言处理基础教程
自然灾害学
尚志海 主编
自然语言处理基础教程
自然资源遥感综合调查技术要求(1:10000DB23\\T2761-2020)/黑龙江省地方标准
丁宇雪
自然语言处理基础教程
自然图鉴
[法]热内·梅特莱尔
自然语言处理基础教程
自然收藏家 会讲故事的植物科普书 专家审订 精装2册 [5~12岁]
[俄]安娜·瓦西里耶娃
自然语言处理基础教程
自然保护地生态旅游发展研究(广西篇)
李玉清
自然语言处理基础教程
自然语言处理导论
沈颖 丁宁 等
自然语言处理基础教程
自然灾害应对理念与应对机制演变研究
刘川,孙莹
自然语言处理基础教程
自然语言处理 口袋里的人工智能 人工智能知识启蒙科普读物 Chatgpt核心技术 大数据与智能机器人 机器学习技术 广东科技
谭明奎 杜卿
您可能感兴趣 / 更多
自然语言处理基础教程
大道之成:〈共产党宣言〉与中国共产党
王刚;李贵贺
自然语言处理基础教程
煤体微观三维重构及其渗流特征
王刚;韩冬阳;程卫民
自然语言处理基础教程
汽车轻量化——材料、工艺与设计
王刚;安玉民;刘海涛
自然语言处理基础教程
普通人也能掌握的超级记忆法
王刚;裴照阳
自然语言处理基础教程
高级网络技术实践
王刚;杨兴春;王方华
自然语言处理基础教程
基于竞争力视角的黑龙江省林业产业发展综合研究:以黑龙江为例
王刚;曹秋红
自然语言处理基础教程
计算机网络技术实践
王刚;杨兴春
自然语言处理基础教程
《寻找茯茶》
王刚;王晓飞;史宝龙;王闷闷
自然语言处理基础教程
矿山物联网安全感知与预警技术(煤矿灾害防控新技术丛书)
王刚;丁恩杰
自然语言处理基础教程
社区康复学学习指导及习题集(第2版/本科康复配教)
王刚;赵凯