语音识别理论与实践()
出版时间:
2023-10
版次:
1
ISBN:
9787522619026
定价:
42.00
装帧:
其他
开本:
16开
页数:
188页
字数:
257千字
1人买过
-
本书主要介绍语音识别原理及其相关应用。全书共9章,分为五大部分:第一部分(第1章)介绍语音识别的发展历史和语音识别领域常用的数据集与工具箱;第二部分(第2章)介绍在语音识别领域常用的语音信号基础知识和声学特征的提取;第三部分(第3章至第7章)详细介绍语音识别的声学模型、语言模型、解码工具,并对语音识别领域的研究热点(端到端语音识别)进行探讨;第四部分(第8章)利用语音识别开源工具包Kaldi进行语音识别实战,包括Kaldi的安装以及如何训练aishell语音识别工程;第五部分(第9章)结合序列到序列的语音识别模型和序列到序列的问答模型来构建语音交互系统。本书既可作为计算机科学与技术、电子科学与技术、控制工程与科学、智能科学与技术等专业的本科教材,也可作为研究生教材,还可供从事语音识别、人工智能等研究的科研人员参考。 前言
第1章 绪论
1.1 语音识别简史
1.1.1 语音识别早期探索
1.1.2 概率模型一统江湖
1.1.3 神经网络异军突起
1.1.4 商业应用推波助澜
1.2 国内发展现状
1.3 语音识别框架
1.3.1 经典方法
1.3.2 概率模型
1.3.3 深度神经网络-隐马尔可夫(DNN-HMM)模型
1.3.4 端到端语音识别
1.4 开源工具与数据集
1.4.1 深度学习框架
1.4.2 开源工具
1.4.3 数据集
本章小结
课后习题
第2章 语音基础知识
2.1 语音信号基础
2.1.1 声波的特性
2.1.2 声音的采集装置
2.1.3 声音的采样
2.1.4 声音的量化
2.1.5 语音的编码
2.2 声学特征提取
2.2.1 预处理
2.2.2 傅里叶变换
2.2.3 听觉特性
2.2.4 线性预测
2.2.5 倒谱分析
2.2.6 声学特征
本章小结
课后习题
第3章 声学模型
3.1 高斯混合模型
3.1.1 概率统计
3.1.2 高斯分布
3.1.3 GMM的组成和表示
3.2 隐马尔可夫模型
3.2.1 隐马尔可夫模型基本概念
3.2.2 隐马尔可夫模型的定义
3.2.3 隐马尔可夫模型的三个基本问题
3.3 高斯混合模型-隐马尔可夫模型
3.4 基于隐马尔可夫模型的语音识别
3.4.1 建模单元
3.4.2 发音过程与隐马尔可夫模型状态
3.4.3 串接隐马尔可夫模型
本章小结
课后习题
第4章 语言模型
4.1 n-gram模型
4.2 评价指标
4.3 平滑技术
4.3.1 Good-Turing折扣法
4.3.2 Jelinek-Mercer插值法
4.3.3 Kneser-Ney插值法
4.3.4 Katz回退法
4.4 语言模型的训练
4.5 预训练语言模型
4.5.1 基于自回归语言模型的预训练技术
4.5.2 基于自编码语言模型的预训练技术
4.5.3 基于序列到序列语言模型的预训练技术
4.5.4 基于前缀语言模型的预训练技术
4.5.5 基于排列语言模型的预训练技术
4.5.6 预训练技术的改进方法
本章小结
课后习题
第5章 加权有限状态解码器
5.1 基于动态网络的Viterbi解码
5.2 加权有限状态转换器理论
5.2.1 基本概念
5.2.2 半环
5.3 HCLG构建
5.3.1 语料准备
5.3.2 构建语法模型
……
第6章 深度神经网络模型
第7章 端到端语音识别
第8章 Kaldi实战
第9章 语音交互系统
参考文献
附录 课后习题答案
-
内容简介:
本书主要介绍语音识别原理及其相关应用。全书共9章,分为五大部分:第一部分(第1章)介绍语音识别的发展历史和语音识别领域常用的数据集与工具箱;第二部分(第2章)介绍在语音识别领域常用的语音信号基础知识和声学特征的提取;第三部分(第3章至第7章)详细介绍语音识别的声学模型、语言模型、解码工具,并对语音识别领域的研究热点(端到端语音识别)进行探讨;第四部分(第8章)利用语音识别开源工具包Kaldi进行语音识别实战,包括Kaldi的安装以及如何训练aishell语音识别工程;第五部分(第9章)结合序列到序列的语音识别模型和序列到序列的问答模型来构建语音交互系统。本书既可作为计算机科学与技术、电子科学与技术、控制工程与科学、智能科学与技术等专业的本科教材,也可作为研究生教材,还可供从事语音识别、人工智能等研究的科研人员参考。
-
目录:
前言
第1章 绪论
1.1 语音识别简史
1.1.1 语音识别早期探索
1.1.2 概率模型一统江湖
1.1.3 神经网络异军突起
1.1.4 商业应用推波助澜
1.2 国内发展现状
1.3 语音识别框架
1.3.1 经典方法
1.3.2 概率模型
1.3.3 深度神经网络-隐马尔可夫(DNN-HMM)模型
1.3.4 端到端语音识别
1.4 开源工具与数据集
1.4.1 深度学习框架
1.4.2 开源工具
1.4.3 数据集
本章小结
课后习题
第2章 语音基础知识
2.1 语音信号基础
2.1.1 声波的特性
2.1.2 声音的采集装置
2.1.3 声音的采样
2.1.4 声音的量化
2.1.5 语音的编码
2.2 声学特征提取
2.2.1 预处理
2.2.2 傅里叶变换
2.2.3 听觉特性
2.2.4 线性预测
2.2.5 倒谱分析
2.2.6 声学特征
本章小结
课后习题
第3章 声学模型
3.1 高斯混合模型
3.1.1 概率统计
3.1.2 高斯分布
3.1.3 GMM的组成和表示
3.2 隐马尔可夫模型
3.2.1 隐马尔可夫模型基本概念
3.2.2 隐马尔可夫模型的定义
3.2.3 隐马尔可夫模型的三个基本问题
3.3 高斯混合模型-隐马尔可夫模型
3.4 基于隐马尔可夫模型的语音识别
3.4.1 建模单元
3.4.2 发音过程与隐马尔可夫模型状态
3.4.3 串接隐马尔可夫模型
本章小结
课后习题
第4章 语言模型
4.1 n-gram模型
4.2 评价指标
4.3 平滑技术
4.3.1 Good-Turing折扣法
4.3.2 Jelinek-Mercer插值法
4.3.3 Kneser-Ney插值法
4.3.4 Katz回退法
4.4 语言模型的训练
4.5 预训练语言模型
4.5.1 基于自回归语言模型的预训练技术
4.5.2 基于自编码语言模型的预训练技术
4.5.3 基于序列到序列语言模型的预训练技术
4.5.4 基于前缀语言模型的预训练技术
4.5.5 基于排列语言模型的预训练技术
4.5.6 预训练技术的改进方法
本章小结
课后习题
第5章 加权有限状态解码器
5.1 基于动态网络的Viterbi解码
5.2 加权有限状态转换器理论
5.2.1 基本概念
5.2.2 半环
5.3 HCLG构建
5.3.1 语料准备
5.3.2 构建语法模型
……
第6章 深度神经网络模型
第7章 端到端语音识别
第8章 Kaldi实战
第9章 语音交互系统
参考文献
附录 课后习题答案
查看详情
-
全新
广东省广州市
平均发货17小时
成功完成率95.31%
-
全新
广东省广州市
平均发货18小时
成功完成率95.57%
-
全新
北京市通州区
平均发货10小时
成功完成率83.94%
-
全新
广东省广州市
24小时内发货
成功完成率93.44%
-
全新
江西省南昌市
平均发货22小时
成功完成率82.21%
-
语音识别理论与实践
①全新正版,现货速发,7天无理由退换货②天津、成都、无锡、广东等多仓就近发货,订单最迟48小时内发出③无法指定快递④可开电子发票,不清楚的请咨询客服。
全新
湖北省武汉市
平均发货18小时
成功完成率92.31%
-
全新
-
全新
湖北省武汉市
平均发货17小时
成功完成率92.16%
-
全新
北京市朝阳区
平均发货17小时
成功完成率93.03%
-
全新
广东省广州市
平均发货18小时
成功完成率95.69%
-
全新
广东省广州市
平均发货18小时
成功完成率95.08%
-
全新
广东省广州市
平均发货18小时
成功完成率95.79%
-
全新
-
全新
天津市东丽区
平均发货15小时
成功完成率89.7%
-
全新
山东省泰安市
平均发货27小时
成功完成率81.29%
-
全新
河北省保定市
平均发货15小时
成功完成率85.87%
-
语音识别理论与实践(
全新正版书籍,假一罚十,节假日发货(图片为标准图,仅供参考。以标题为准,不了解的可以询问客服。)
全新
北京市朝阳区
平均发货17小时
成功完成率93.6%
-
八五品
湖南省长沙市
平均发货11小时
成功完成率92.99%
-
全新
-
全新
河北省保定市
平均发货30小时
成功完成率80.45%
-
全新
北京市丰台区
平均发货9小时
成功完成率87.99%
-
全新
河北省保定市
平均发货7小时
成功完成率93.77%
-
全新
浙江省嘉兴市
平均发货18小时
成功完成率92.31%
-
全新
天津市西青区
平均发货16小时
成功完成率93.36%
-
全新
广东省东莞市
平均发货17小时
成功完成率92.6%
-
全新
四川省成都市
平均发货26小时
成功完成率89.35%
-
全新
山东省泰安市
平均发货26小时
成功完成率88.87%
-
全新
浙江省嘉兴市
平均发货10小时
成功完成率92.95%
-
全新
广东省广州市
24小时内发货
成功完成率91.19%
-
八五品
上海市黄浦区
平均发货11小时
成功完成率91.94%
-
全新
江苏省无锡市
平均发货6小时
成功完成率95.95%
-
八五品
江西省南昌市
平均发货15小时
成功完成率75.28%
-
全新
河北省保定市
平均发货24小时
成功完成率77.06%
-
全新
北京市房山区
平均发货10小时
成功完成率93.3%
-
全新
四川省成都市
平均发货8小时
成功完成率98.73%
-
4
全新
北京市丰台区
平均发货25小时
成功完成率87.1%
-
全新
北京市西城区
平均发货19小时
成功完成率83.12%
-
全新
江苏省南京市
平均发货25小时
成功完成率53.06%
-
八五品
浙江省杭州市
平均发货11小时
成功完成率93.37%
-
全新
江苏省无锡市
平均发货18小时
成功完成率89.56%
-
全新
河北省保定市
平均发货25小时
成功完成率91.88%
-
语音识别理论与实践
本店所售图书,保证正版新书,有个别图片和实书封面不一样,以实书封面为准,有需要确定的可以联系客服。我店不能开发票。当天下单第二天发货。
全新
四川省成都市
平均发货38小时
成功完成率82.61%
-
全新
河北省保定市
平均发货15小时
成功完成率92.78%
-
八五品
江西省南昌市
平均发货11小时
成功完成率87.73%
-
全新
江西省南昌市
平均发货25小时
成功完成率90.34%
-
全新
四川省成都市
平均发货16小时
成功完成率89.3%
-
九五品
北京市丰台区
平均发货7小时
成功完成率81.21%
-
全新
湖北省武汉市
平均发货15小时
成功完成率72.11%
-
全新
浙江省嘉兴市
平均发货9小时
成功完成率94.74%
-
全新
河南省平顶山市
平均发货10小时
成功完成率92.96%