自然语言处理基础教程

自然语言处理基础教程
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: , ,
2021-11
版次: 1
ISBN: 9787111692591
定价: 69.00
装帧: 其他
开本: 16开
纸张: 胶版纸
字数: 140千字
  • 本书面向初学者介绍了自然语言处理的基础知识,包括词法分析、句法分析、基于机器学习的文本分析、深度学习与神经网络、词嵌入与词向量以及自然语言处理与卷积神经网络、循环神经网络技术及应用。本书深入浅出,案例丰富,可作为高校人工智能、大数据、计算机及相关专业本科生的教材,也可供对自然语言处理有兴趣的技术人员作为参考书。 前言

    第1章 自然语言处理概述1

    1.1 自然语言处理的基本概念1

    1.1.1 什么是自然语言处理1

    1.1.2 自然语言处理的层次2

    1.1.3 自然语言处理的发展历程3

    1.2 自然语言处理技术面临的困难6

    1.2.1 歧义6

    1.2.2 知识的获取、表达及运用7

    1.2.3 计算问题8

    1.3 自然语言处理的主要研究任务和应用8

    1.3.1 自然语言处理的主要研究任务8

    1.3.2 自然语言处理的典型应用10

    1.4 搭建自然语言处理开发环境11

    1.4.1 Anaconda11

    1.4.2 scikit-learn15

    1.4.3 Jupyter Notebook15

    1.5 本章小结16

    1.6 习题17

    第2章 词法分析18

    2.1 什么是词法分析18

    2.2 分词19

    2.2.1 中文分词简介19

    2.2.2 基于词典的分词方法20

    2.2.3 基于统计的分词方法21

    2.2.4 实例—使用N-gram语言模型进行语法纠正24

    2.2.5 中文分词工具简介27

    2.2.6 实例—使用jieba进行高频词提取30

    2.3 关键词提取32

    2.3.1 TF-IDF算法32

    2.3.2 TextRank算法33

    2.3.3 实例—提取文本关键词34

    2.4 词性标注40

    2.4.1 词性标注简介40

    2.4.2 隐马尔可夫模型41

    2.4.3 Viterbi算法43

    2.4.4 熵模型44

    2.5 命名实体识别46

    2.5.1 命名实体识别简介46

    2.5.2 条件随机场模型47

    2.5.3 实例—使用jieba进行日期识别48

    2.6 本章小结52

    2.7 习题53

    第3章 句法分析54

    3.1 什么是句法分析54

    3.2 句法分析树库及性能评测56

    3.2.1 句法分析语料库56

    3.2.2 句法分析模型的性能评测59

    3.3 概率上下文无关文法59

    3.4 依存句法分析62

    3.4.1 基于图模型的依存句法分析63

    3.4.2 基于转移模型的依存句法分析63

    3.5 中文句法分析工具简介65

    3.6 实例—中文句法分析66

    3.7 本章小结68

    3.8 习题68

    第4章 基于机器学习的文本分类69

    4.1 机器学习简介69

    4.1.1 scikit-learn简介71

    4.1.2 机器学习基本概念72

    4.1.3 机器学习问题分类73

    4.2 朴素贝叶斯分类器76

    4.3 逻辑回归分类器80

    4.4 支持向量机分类器84

    4.5 文本聚类89

    4.6 实例—垃圾邮件分类94

    4.7 本章小结99

    4.8 习题99

    第5章 深度学习与神经网络101

    5.1 深度学习与神经网络简介101

    5.2 人工神经网络102

    5.2.1 生物神经元102

    5.2.2 感知器103

    5.2.3 激活函数105

    5.2.4 神经网络110

    5.3 前馈神经网络110

    5.3.1 前馈神经网络的结构110

    5.3.2 前向传播111

    5.3.3 损失函数112

    5.3.4 反向传播算法113

    5.3.5 优化方法114

    5.4 深度学习框架116

    5.4.1 TensorFlow116

    5.4.2 Keras118

    5.4.3 PyTorch119

    5.4.4 PaddlePaddle120

    5.5 实例—使用MLP实现手写数字识别122

    5.5.1 数据准备122

    5.5.2 创建MLP122

    5.5.3 模型训练123

    5.5.4 模型评价124

    5.6 本章小结125

    5.7 习题126

    第6章 词嵌入与词向量127

    6.1 文本向量化127

    6.2 One-Hot编码128

    6.3 词嵌入130

    6.3.1 什么是词嵌入130

    6.3.2 词嵌入的实现131

    6.3.3 语义信息132

    6.4 Word2Vec133

    6.4.1 Word2Vec简介133

    6.4.2 Word2Vec的应用134

    6.4.3 使用gensim包训练词向量136

    6.5 Doc2Vec138

    6.5.1 PV-DM139

    6.5.2 PV-DBOW140

    6.6 实例—利用Doc2Vec计算文档相似度140

    6.6.1 准备语料库140

    6.6.2 定义和训练模型141

    6.6.3 分析文本相似度142

    6.7 本章小结145

    6.8 习题145

    第7章 卷积神经网络与自然语言处理146

    7.1 卷积神经网络简介146

    7.1.1 深层神经网络用于图像处理存在的问题146

    7.1.2 什么是卷积148

    7.1.3 填充150

    7.1.4 步长151

    7.1.5 什么是卷积神经网络151

    7.2 应用卷积神经网络解决自然语言处理问题152

    7.2.1 NLP中的卷积层152

    7.2.2 NLP中的池化层154

    7.2.3 NLP中CNN的基本架构155

    7.3 CNN在应用中的超参数选择156

    7.3.1 激活函数156

    7.3.2 卷积核的大小和个数156

    7.3.3 dropout层156

    7.3.4 softmax分类器157

    7.4 实例—使用CNN实现新闻文本分类158

    7.4.1 准备数据158

    7.4.2 定义和训练模型163

    7.5 本章小结165

    7.6 习题166

    第8章 循环神经网络与自然语言处理167

    8.1 循环神经网络的基本结构168

    8.2 循环神经网络应用于自然语言处理170

    8.2.1 序列到类别170

    8.2.2 同步序列到序列171

    8.2.3 异步序列到序列172

    8.3 循环神经网络的训练173

    8.3.1 随时间反向传播算法173

    8.3.2 权重的更新174

    8.3.3 梯度消失与梯度爆炸175

    8.4 长短期记忆网络175

    8.4.1 细胞状态177

    8.4.2 门控机制177

    8.5 门控循环单元网络181

    8.6 更深的网络184

    8.6.1 堆叠循环神经网络184

    8.6.2 双向循环神经网络185

    8.7 实例—使用LSTM网络实现文本情感分析186

    8.7.1 数据准备186

    8.7.2 构建和训练模型187

    8.8 本章小结190

    8.9 习题191

    第9章 序列到序列模型与注意力机制192

    9.1 序列到序列模型192

    9.1.1 什么是序列到序列模型192

    9.1.2 编码–解码架构193

    9.1.3 编码器194

    9.1.4 解码器195

    9.1.5 模型训练197

    9.2 注意力机制198

    9.2.1 什么是注意力机制198

    9.2.2 计算语义
  • 内容简介:
    本书面向初学者介绍了自然语言处理的基础知识,包括词法分析、句法分析、基于机器学习的文本分析、深度学习与神经网络、词嵌入与词向量以及自然语言处理与卷积神经网络、循环神经网络技术及应用。本书深入浅出,案例丰富,可作为高校人工智能、大数据、计算机及相关专业本科生的教材,也可供对自然语言处理有兴趣的技术人员作为参考书。
  • 目录:
    前言

    第1章 自然语言处理概述1

    1.1 自然语言处理的基本概念1

    1.1.1 什么是自然语言处理1

    1.1.2 自然语言处理的层次2

    1.1.3 自然语言处理的发展历程3

    1.2 自然语言处理技术面临的困难6

    1.2.1 歧义6

    1.2.2 知识的获取、表达及运用7

    1.2.3 计算问题8

    1.3 自然语言处理的主要研究任务和应用8

    1.3.1 自然语言处理的主要研究任务8

    1.3.2 自然语言处理的典型应用10

    1.4 搭建自然语言处理开发环境11

    1.4.1 Anaconda11

    1.4.2 scikit-learn15

    1.4.3 Jupyter Notebook15

    1.5 本章小结16

    1.6 习题17

    第2章 词法分析18

    2.1 什么是词法分析18

    2.2 分词19

    2.2.1 中文分词简介19

    2.2.2 基于词典的分词方法20

    2.2.3 基于统计的分词方法21

    2.2.4 实例—使用N-gram语言模型进行语法纠正24

    2.2.5 中文分词工具简介27

    2.2.6 实例—使用jieba进行高频词提取30

    2.3 关键词提取32

    2.3.1 TF-IDF算法32

    2.3.2 TextRank算法33

    2.3.3 实例—提取文本关键词34

    2.4 词性标注40

    2.4.1 词性标注简介40

    2.4.2 隐马尔可夫模型41

    2.4.3 Viterbi算法43

    2.4.4 熵模型44

    2.5 命名实体识别46

    2.5.1 命名实体识别简介46

    2.5.2 条件随机场模型47

    2.5.3 实例—使用jieba进行日期识别48

    2.6 本章小结52

    2.7 习题53

    第3章 句法分析54

    3.1 什么是句法分析54

    3.2 句法分析树库及性能评测56

    3.2.1 句法分析语料库56

    3.2.2 句法分析模型的性能评测59

    3.3 概率上下文无关文法59

    3.4 依存句法分析62

    3.4.1 基于图模型的依存句法分析63

    3.4.2 基于转移模型的依存句法分析63

    3.5 中文句法分析工具简介65

    3.6 实例—中文句法分析66

    3.7 本章小结68

    3.8 习题68

    第4章 基于机器学习的文本分类69

    4.1 机器学习简介69

    4.1.1 scikit-learn简介71

    4.1.2 机器学习基本概念72

    4.1.3 机器学习问题分类73

    4.2 朴素贝叶斯分类器76

    4.3 逻辑回归分类器80

    4.4 支持向量机分类器84

    4.5 文本聚类89

    4.6 实例—垃圾邮件分类94

    4.7 本章小结99

    4.8 习题99

    第5章 深度学习与神经网络101

    5.1 深度学习与神经网络简介101

    5.2 人工神经网络102

    5.2.1 生物神经元102

    5.2.2 感知器103

    5.2.3 激活函数105

    5.2.4 神经网络110

    5.3 前馈神经网络110

    5.3.1 前馈神经网络的结构110

    5.3.2 前向传播111

    5.3.3 损失函数112

    5.3.4 反向传播算法113

    5.3.5 优化方法114

    5.4 深度学习框架116

    5.4.1 TensorFlow116

    5.4.2 Keras118

    5.4.3 PyTorch119

    5.4.4 PaddlePaddle120

    5.5 实例—使用MLP实现手写数字识别122

    5.5.1 数据准备122

    5.5.2 创建MLP122

    5.5.3 模型训练123

    5.5.4 模型评价124

    5.6 本章小结125

    5.7 习题126

    第6章 词嵌入与词向量127

    6.1 文本向量化127

    6.2 One-Hot编码128

    6.3 词嵌入130

    6.3.1 什么是词嵌入130

    6.3.2 词嵌入的实现131

    6.3.3 语义信息132

    6.4 Word2Vec133

    6.4.1 Word2Vec简介133

    6.4.2 Word2Vec的应用134

    6.4.3 使用gensim包训练词向量136

    6.5 Doc2Vec138

    6.5.1 PV-DM139

    6.5.2 PV-DBOW140

    6.6 实例—利用Doc2Vec计算文档相似度140

    6.6.1 准备语料库140

    6.6.2 定义和训练模型141

    6.6.3 分析文本相似度142

    6.7 本章小结145

    6.8 习题145

    第7章 卷积神经网络与自然语言处理146

    7.1 卷积神经网络简介146

    7.1.1 深层神经网络用于图像处理存在的问题146

    7.1.2 什么是卷积148

    7.1.3 填充150

    7.1.4 步长151

    7.1.5 什么是卷积神经网络151

    7.2 应用卷积神经网络解决自然语言处理问题152

    7.2.1 NLP中的卷积层152

    7.2.2 NLP中的池化层154

    7.2.3 NLP中CNN的基本架构155

    7.3 CNN在应用中的超参数选择156

    7.3.1 激活函数156

    7.3.2 卷积核的大小和个数156

    7.3.3 dropout层156

    7.3.4 softmax分类器157

    7.4 实例—使用CNN实现新闻文本分类158

    7.4.1 准备数据158

    7.4.2 定义和训练模型163

    7.5 本章小结165

    7.6 习题166

    第8章 循环神经网络与自然语言处理167

    8.1 循环神经网络的基本结构168

    8.2 循环神经网络应用于自然语言处理170

    8.2.1 序列到类别170

    8.2.2 同步序列到序列171

    8.2.3 异步序列到序列172

    8.3 循环神经网络的训练173

    8.3.1 随时间反向传播算法173

    8.3.2 权重的更新174

    8.3.3 梯度消失与梯度爆炸175

    8.4 长短期记忆网络175

    8.4.1 细胞状态177

    8.4.2 门控机制177

    8.5 门控循环单元网络181

    8.6 更深的网络184

    8.6.1 堆叠循环神经网络184

    8.6.2 双向循环神经网络185

    8.7 实例—使用LSTM网络实现文本情感分析186

    8.7.1 数据准备186

    8.7.2 构建和训练模型187

    8.8 本章小结190

    8.9 习题191

    第9章 序列到序列模型与注意力机制192

    9.1 序列到序列模型192

    9.1.1 什么是序列到序列模型192

    9.1.2 编码–解码架构193

    9.1.3 编码器194

    9.1.4 解码器195

    9.1.5 模型训练197

    9.2 注意力机制198

    9.2.1 什么是注意力机制198

    9.2.2 计算语义
查看详情
相关图书 / 更多
自然语言处理基础教程
自然化的意义
鲁艺杰 著
自然语言处理基础教程
自然拼读背单词:基础英语4000词(微课版)
陈雪 编著
自然语言处理基础教程
自然资源法
阎其华
自然语言处理基础教程
自然物语丛书(第四辑)—在动物中间
埃诺斯·米尔斯 著;董继平 译
自然语言处理基础教程
自然观察笔记
首都绿化委员会办公室 主办;北京市野生动物救护中心 组编
自然语言处理基础教程
自然物语丛书(第四辑)—山巅乐园
埃诺斯·米尔斯 著;董继平 译
自然语言处理基础教程
自然教育通识/全国自然教育网络丛书
全国自然教育网络 编著
自然语言处理基础教程
自然与人生(洞察真理的智慧,感悟自然与生命的力量)
[日]德富芦花
自然语言处理基础教程
自然灾害与生活(第9版)(修订版)
[美]Patrick Leon Abbott(帕特里克·李昂·艾博特
自然语言处理基础教程
自然生长 这里是一所学校
孙银峰
自然语言处理基础教程
自然物语丛书(第四辑)—追踪野生动物
埃诺斯·米尔斯 著;董继平 译
自然语言处理基础教程
自然的馈赠(博物馆精品标本图鉴)(精)
江雪、王丹 编
您可能感兴趣 / 更多
自然语言处理基础教程
汽车轻量化——材料、工艺与设计
王刚;安玉民;刘海涛
自然语言处理基础教程
普通人也能掌握的超级记忆法
王刚;裴照阳
自然语言处理基础教程
高级网络技术实践
王刚;杨兴春;王方华
自然语言处理基础教程
基于竞争力视角的黑龙江省林业产业发展综合研究:以黑龙江为例
王刚;曹秋红
自然语言处理基础教程
计算机网络技术实践
王刚;杨兴春
自然语言处理基础教程
《寻找茯茶》
王刚;王晓飞;史宝龙;王闷闷
自然语言处理基础教程
矿山物联网安全感知与预警技术(煤矿灾害防控新技术丛书)
王刚;丁恩杰
自然语言处理基础教程
社区康复学学习指导及习题集(第2版/本科康复配教)
王刚;赵凯