语音识别理论与实践()

语音识别理论与实践()
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2023-10
版次: 1
ISBN: 9787522619026
定价: 42.00
装帧: 其他
开本: 16开
页数: 188页
字数: 257千字
分类: 工程技术
1人买过
  • 本书主要介绍语音识别原理及其相关应用。全书共9章,分为五大部分:第一部分(第1章)介绍语音识别的发展历史和语音识别领域常用的数据集与工具箱;第二部分(第2章)介绍在语音识别领域常用的语音信号基础知识和声学特征的提取;第三部分(第3章至第7章)详细介绍语音识别的声学模型、语言模型、解码工具,并对语音识别领域的研究热点(端到端语音识别)进行探讨;第四部分(第8章)利用语音识别开源工具包Kaldi进行语音识别实战,包括Kaldi的安装以及如何训练aishell语音识别工程;第五部分(第9章)结合序列到序列的语音识别模型和序列到序列的问答模型来构建语音交互系统。本书既可作为计算机科学与技术、电子科学与技术、控制工程与科学、智能科学与技术等专业的本科教材,也可作为研究生教材,还可供从事语音识别、人工智能等研究的科研人员参考。 前言

    第1章 绪论

    1.1 语音识别简史

    1.1.1 语音识别早期探索

    1.1.2 概率模型一统江湖

    1.1.3 神经网络异军突起

    1.1.4 商业应用推波助澜

    1.2 国内发展现状

    1.3 语音识别框架

    1.3.1 经典方法

    1.3.2 概率模型

    1.3.3 深度神经网络-隐马尔可夫(DNN-HMM)模型

    1.3.4 端到端语音识别

    1.4 开源工具与数据集

    1.4.1 深度学习框架

    1.4.2 开源工具

    1.4.3 数据集

    本章小结

    课后习题

    第2章 语音基础知识

    2.1 语音信号基础

    2.1.1 声波的特性

    2.1.2 声音的采集装置

    2.1.3 声音的采样

    2.1.4 声音的量化

    2.1.5 语音的编码

    2.2 声学特征提取

    2.2.1 预处理

    2.2.2 傅里叶变换

    2.2.3 听觉特性

    2.2.4 线性预测

    2.2.5 倒谱分析

    2.2.6 声学特征

    本章小结

    课后习题

    第3章 声学模型

    3.1 高斯混合模型

    3.1.1 概率统计

    3.1.2 高斯分布

    3.1.3 GMM的组成和表示

    3.2 隐马尔可夫模型

    3.2.1 隐马尔可夫模型基本概念

    3.2.2 隐马尔可夫模型的定义

    3.2.3 隐马尔可夫模型的三个基本问题

    3.3 高斯混合模型-隐马尔可夫模型

    3.4 基于隐马尔可夫模型的语音识别

    3.4.1 建模单元

    3.4.2 发音过程与隐马尔可夫模型状态

    3.4.3 串接隐马尔可夫模型

    本章小结

    课后习题

    第4章 语言模型

    4.1 n-gram模型

    4.2 评价指标

    4.3 平滑技术

    4.3.1 Good-Turing折扣法

    4.3.2 Jelinek-Mercer插值法

    4.3.3 Kneser-Ney插值法

    4.3.4 Katz回退法

    4.4 语言模型的训练

    4.5 预训练语言模型

    4.5.1 基于自回归语言模型的预训练技术

    4.5.2 基于自编码语言模型的预训练技术

    4.5.3 基于序列到序列语言模型的预训练技术

    4.5.4 基于前缀语言模型的预训练技术

    4.5.5 基于排列语言模型的预训练技术

    4.5.6 预训练技术的改进方法

    本章小结

    课后习题

    第5章 加权有限状态解码器

    5.1 基于动态网络的Viterbi解码

    5.2 加权有限状态转换器理论

    5.2.1 基本概念

    5.2.2 半环

    5.3 HCLG构建

    5.3.1 语料准备

    5.3.2 构建语法模型

    ……

    第6章 深度神经网络模型

    第7章 端到端语音识别

    第8章 Kaldi实战

    第9章 语音交互系统

    参考文献

    附录 课后习题答案
  • 内容简介:
    本书主要介绍语音识别原理及其相关应用。全书共9章,分为五大部分:第一部分(第1章)介绍语音识别的发展历史和语音识别领域常用的数据集与工具箱;第二部分(第2章)介绍在语音识别领域常用的语音信号基础知识和声学特征的提取;第三部分(第3章至第7章)详细介绍语音识别的声学模型、语言模型、解码工具,并对语音识别领域的研究热点(端到端语音识别)进行探讨;第四部分(第8章)利用语音识别开源工具包Kaldi进行语音识别实战,包括Kaldi的安装以及如何训练aishell语音识别工程;第五部分(第9章)结合序列到序列的语音识别模型和序列到序列的问答模型来构建语音交互系统。本书既可作为计算机科学与技术、电子科学与技术、控制工程与科学、智能科学与技术等专业的本科教材,也可作为研究生教材,还可供从事语音识别、人工智能等研究的科研人员参考。
  • 目录:
    前言

    第1章 绪论

    1.1 语音识别简史

    1.1.1 语音识别早期探索

    1.1.2 概率模型一统江湖

    1.1.3 神经网络异军突起

    1.1.4 商业应用推波助澜

    1.2 国内发展现状

    1.3 语音识别框架

    1.3.1 经典方法

    1.3.2 概率模型

    1.3.3 深度神经网络-隐马尔可夫(DNN-HMM)模型

    1.3.4 端到端语音识别

    1.4 开源工具与数据集

    1.4.1 深度学习框架

    1.4.2 开源工具

    1.4.3 数据集

    本章小结

    课后习题

    第2章 语音基础知识

    2.1 语音信号基础

    2.1.1 声波的特性

    2.1.2 声音的采集装置

    2.1.3 声音的采样

    2.1.4 声音的量化

    2.1.5 语音的编码

    2.2 声学特征提取

    2.2.1 预处理

    2.2.2 傅里叶变换

    2.2.3 听觉特性

    2.2.4 线性预测

    2.2.5 倒谱分析

    2.2.6 声学特征

    本章小结

    课后习题

    第3章 声学模型

    3.1 高斯混合模型

    3.1.1 概率统计

    3.1.2 高斯分布

    3.1.3 GMM的组成和表示

    3.2 隐马尔可夫模型

    3.2.1 隐马尔可夫模型基本概念

    3.2.2 隐马尔可夫模型的定义

    3.2.3 隐马尔可夫模型的三个基本问题

    3.3 高斯混合模型-隐马尔可夫模型

    3.4 基于隐马尔可夫模型的语音识别

    3.4.1 建模单元

    3.4.2 发音过程与隐马尔可夫模型状态

    3.4.3 串接隐马尔可夫模型

    本章小结

    课后习题

    第4章 语言模型

    4.1 n-gram模型

    4.2 评价指标

    4.3 平滑技术

    4.3.1 Good-Turing折扣法

    4.3.2 Jelinek-Mercer插值法

    4.3.3 Kneser-Ney插值法

    4.3.4 Katz回退法

    4.4 语言模型的训练

    4.5 预训练语言模型

    4.5.1 基于自回归语言模型的预训练技术

    4.5.2 基于自编码语言模型的预训练技术

    4.5.3 基于序列到序列语言模型的预训练技术

    4.5.4 基于前缀语言模型的预训练技术

    4.5.5 基于排列语言模型的预训练技术

    4.5.6 预训练技术的改进方法

    本章小结

    课后习题

    第5章 加权有限状态解码器

    5.1 基于动态网络的Viterbi解码

    5.2 加权有限状态转换器理论

    5.2.1 基本概念

    5.2.2 半环

    5.3 HCLG构建

    5.3.1 语料准备

    5.3.2 构建语法模型

    ……

    第6章 深度神经网络模型

    第7章 端到端语音识别

    第8章 Kaldi实战

    第9章 语音交互系统

    参考文献

    附录 课后习题答案
查看详情
12
相关图书 / 更多
语音识别理论与实践()
语音形式移位理论与汉语相关语序类型研究
倪广妍 著
语音识别理论与实践()
语音障碍:全面评估与治疗(书内附视频)
(美),凯利·维斯(Kelly,Vess)
语音识别理论与实践()
语音识别:原理与应用(第2版)
洪青阳
语音识别理论与实践()
语音识别:模式、算法设计与实践
董雪燕
语音识别理论与实践()
语音类型(语言学及应用语言学名著译丛)
伊恩·麦迪森
语音识别理论与实践()
语音优先:智能语音技术驱动的交互界面设计与语音机器人设计
[美]艾哈迈德·布齐德;[美]马伟业
语音识别理论与实践()
语音频隐写与隐写分析
易小伟
语音识别理论与实践()
语音信号数字处理技术
王晶,易伟明编著
语音识别理论与实践()
语音及语音习得研究
曹文
语音识别理论与实践()
语音发声·看图认物小百科
余非鱼
语音识别理论与实践()
语音信号处理
洪弘;陶华伟;薛彪;赵力
语音识别理论与实践()
语音教程(第2版修订版)
戴炜栋 著;刘森 编
您可能感兴趣 / 更多
语音识别理论与实践()
脑科学导论
莫宏伟
语音识别理论与实践()
移动机器人SLAM技术
莫宏伟
语音识别理论与实践()
智能医疗影像技术
莫宏伟
语音识别理论与实践()
人工智能导论(第2版)
莫宏伟
语音识别理论与实践()
人工智能通论
莫宏伟
语音识别理论与实践()
人工智能伦理导论
莫宏伟
语音识别理论与实践()
人工智能导论
莫宏伟 著
语音识别理论与实践()
磁性细菌优化算法
莫宏伟、徐立芳 著
语音识别理论与实践()
基于GIS的关中地区土地利用变化及土地生态安全动态研究
莫宏伟 著
语音识别理论与实践()
新中国成立初期的广东土地改革研究
莫宏伟 著
语音识别理论与实践()
苏南土地改革研究
莫宏伟 著
语音识别理论与实践()
房地产全程策划实战教程
莫宏伟 编