语音信号处理
出版时间:
2023-06
版次:
1
ISBN:
9787302635482
定价:
69.80
-
本书为语音信号处理领域的指导书。作者在东南大学、南京理工大学开设的本科生课程的基础上,介绍了语音信号处理的基本原理、分析方法以及该学科领域近年来取得的一些研究成果和技术,在理论和应用之间达到了极好的平衡。全书共11章,内容包括: 绪论、语音信号处理的声学理论与模型、传统语音信号分析方法、现代语音信号处理方法、语音信号的参数估计、语音编码、语音增强、语音合成、语音识别、说话人识别、语音信号中的情感信息处理。另外,在本书的每章中都加入了复习题,供读者思考。 本书可作为高等院校计算机应用、信号与信息处理、通信与信息系统等专业的高年级本科生、研究生教材,同时也可供语音信号处理等领域的工程技术人员参考。 第1章绪论
1.1语音信号处理的发展历史
1.1.1经典语音信号处理技术
1.1.2新兴的语音信号处理技术
1.2语音信号处理的研究内容
1.3本书的结构
第2章语音信号处理的声学理论与模型
2.1概述
2.2语音信号处理的声学基础
2.2.1语音的产生
2.2.2语音信号的感知
2.2.3掩蔽效应
2.3语音生成的数学模型
2.3.1激励模型
2.3.2声道模型
2.3.3辐射模型
2.4语音信号的特性分析
2.4.1语音信号的时域波形和频谱特性
2.4.2语音信号的语谱图
2.4.3语音信号的统计特性
2.5语音学基本概念
2.5.1语音学
2.5.2语音的分类及其声学特征
2.5.3汉语语音学
2.6小结
复习思考题
第3章传统语音信号分析方法
3.1概述
3.2语音信号数字化和预处理
3.2.1数字化
3.2.2预处理
3.3端点检测
3.3.1双门限法
3.3.2相关法的端点检测
3.3.3能零比双门限法
3.4语音信号的时域分析
3.4.1短时能量及短时平均幅度分析
3.4.2短时过零率分析
3.4.3短时相关分析
3.4.4短时平均幅度差函数
3.5语音信号的频域分析
3.5.1利用短时傅里叶变换求语音的短时谱
3.5.2语音的短时谱的临界带特征矢量
3.6语音信号的线性预测(LPC)分析
3.6.1线性预测分析的基本原理
3.6.2线性预测方程组的求解
3.6.3LPC谱估计和LPC复倒谱
3.6.4线谱对(LSP)分析
3.7小结
复习思考题
第4章现代语音信号处理方法
4.1概述
4.2同态信号处理
4.2.1同态信号处理的基本原理
4.2.2语音信号的复倒谱
4.2.3语音信号两个卷积分量的复倒谱
4.2.4语音信号倒谱分析实例
4.3小波变换
4.3.1小波变换的基本原理
4.3.2常用小波函数的介绍
4.3.3小波基和分解层数的选择
4.3.4语音信号小波变换分析实例
4.4Teager能量操作
4.4.1连续时间和离散时间的能量操作
4.4.2连续时间和离散时间的能量分离(ESA)
4.4.3语音信号Teager能量算子分析实例
4.5希尔伯特黄变换
4.5.1希尔伯特黄变换的起源
4.5.2经验模式分解
4.5.3希尔伯特黄变换的时频谱
4.6经验小波变换
4.6.1经验小波的定义
4.6.2傅里叶频谱划分
4.6.3窗的选取
4.6.4经验小波变换及其改进算法
4.6.5语音信号经验小波变换分析实例
4.7小结
复习思考题
第5章语音信号的参数估计
5.1概述
5.2基音周期估计
5.2.1基音周期估计分类
5.2.2基于自相关的基音周期估计
5.2.3基于平均幅度差函数(AMDF)的基音周期估计
5.2.4基于倒谱法(CEP)的基音周期估计
5.2.5基于简化的逆滤波跟踪(SIFT)的基音周期估计
5.2.6基于小波变换的基音周期估计
5.2.7基于倒谱和希尔伯特黄变换的基音周期估计
5.2.8基于系综经验模式分解的动态基音周期估计
5.2.9基于系综经验模式分解和倒谱法的基音周期估计
5.2.10基音周期估计的后处理
5.3共振峰估计
5.3.1传统的共振峰估计方法
5.3.2基于希尔伯特黄变换的汉语共振峰估计
5.4梅尔频率倒谱系数
5.4.1梅尔滤波器组
5.4.2MFCC特征参数提取
5.5小结
复习思考题
第6章语音编码
6.1概述
6.2语音信号压缩编码的原理
6.2.1语音编码分类
6.2.2语音压缩的基本原理
6.3语音编码的关键技术
6.3.1线性预测
6.3.2合成分析法(AnalysisBySynthesis)
6.3.3感觉加权滤波器
6.4语音编码的性能指标和评测方法
6.4.1主观评价
6.4.2客观评价
6.5语音信号的波形编码
6.5.1脉冲编码调制(PCM)
6.5.2自适应预测编码(APC)
6.5.3自适应增量调制(ADM)
6.5.4自适应差分脉冲编码调制(ADPCM)
6.5.5子带编码(SBC)
6.5.6自适应变换编码(ATC)
6.6语音信号的参数编码
6.6.1线性预测声码器
6.6.2LPC10编码器
6.7语音信号的混合编码
6.8现代通信中的语音信号编码方法
6.8.1EVS编码器概述
6.8.2EVS编码器设计指标
6.8.3EVS编码涉及的关键技术
6.8.4EVS编码器评价
6.9小结
复习思考题
第7章语音增强
7.1概述
7.2语音特性、人耳感知特性
7.2.1语音特性
7.2.2人耳感知特性
7.3传统语音增强技术
7.3.1基于滤波法的语音增强技术
7.3.2基于减谱法的语音增强技术
7.3.3基于Weiner滤波法的语音增强技术
7.3.4基于模型的语音增强技术
7.3.5基于听觉掩蔽的语音增强技术
7.3.6基于时域处理的语音增强技术
7.4现代语音增强技术
7.4.1基于非负矩阵分解的语音增强技术
7.4.2基于DNN频谱映射的语音增强技术
7.5小结
复习思考题
第8章语音合成
8.1概述
8.2共振峰合成法
8.3线性预测合成法
8.4神经网络语音合成法
8.5语音合成专用硬件简介
8.6PSOLA算法合成语音
8.7文语转换系统(TTS)
8.7.1文语转换系统的组成
8.7.2连读语音的韵律特性
8.7.3文本分析方法
8.7.4语音合成方法
8.7.5语音合成中的韵律控制
8.8小结
复习思考题
第9章语音识别
9.1概述
9.2语音识别原理和识别系统的组成
9.2.1预处理和参数分析
9.2.2语音识别
9.2.3语音识别系统的基本数据库
9.3动态时间规整(DTW)
9.4孤立字(词)识别系统
9.4.1基于MQDF的汉语塞音语音识别系统
9.4.2基于概率尺度DP识别方法的孤立字(词)识别系统
9.5连续语音识别系统
9.5.1声学基元模型
9.5.2系统语言模型
9.5.3句法分析和单词的预测方法
9.6连续语音识别系统的性能评测
9.6.1连续语音识别系统的评测方法以及系统复杂性和识别能力的测度
9.6.2综合评估连续语音识别系统时需要考虑的其他因素
9.7基于DNNHMM的语音识别系统
9.8小结
复习思考题
第10章说话人识别
10.1概述
10.2说话人识别方法和系统结构
10.2.1预处理
10.2.2说话人识别的特征提取
10.2.3特征参量评价方法
10.2.4模式匹配方法
10.2.5说话人识别中判别方法和阈值的选择
10.2.6说话人识别系统的评价
10.3应用DTW的说话人确认系统
10.4应用VQ的说话人识别系统
10.5应用HMM的说话人识别系统
10.5.1基于HMM的与文本有关的说话人识别
10.5.2基于HMM的与文本无关的说话人识别
10.5.3基于HMM的指定文本型说话人识别
10.5.4说话人识别HMM的学习方法
10.5.5鲁棒的HMM说话人识别技术
10.6应用GMM的说话人识别系统
10.6.1GMM模型的基本概念
10.6.2GMM模型的参数估计
10.6.3训练数据不充分的问题
10.6.4GMM模型的识别问题
10.6.5应用GMM和BP网络的说话人识别系统
10.7应用深度学习的说话人识别
10.7.1基于DNNUBM模型的说话人识别
10.7.2说话人识别中的embeddings特征
10.8说话人识别中尚需进一步探索的研究课题
10.8.1基础性的课题
10.8.2实用性的问题
10.9语种辨识的原理和应用
10.9.1语种辨识的基本原理和方法
10.9.2语种辨识的应用领域
10.10小结
复习思考题
第11章语音信号中的情感信息处理
11.1概述
11.2语言信号中的情感分类和情感特征分析
11.2.1语音情感识别系统模型
11.2.2语音信号中的情感分类
11.2.3语料库
11.2.4语音情感特征分析
11.2.5语音情感识别特征分析方法
11.3基于融合特征的语音情感识别方法
11.3.1特征提取
11.3.2分类器
11.3.3仿真实验
11.4基于LSTM的语音情感识别方法
11.4.1LSTM实现原理
11.4.2应用LSTM的语音情感识别
11.4.3仿真实验
11.5基于CNN的语音情感识别方法
11.5.1卷积神经网络(CNN)
11.5.2基于CNN的语音情感识别模型
11.5.3仿真实验
11.6小结
复习思考题
汉英名词术语对照
-
内容简介:
本书为语音信号处理领域的指导书。作者在东南大学、南京理工大学开设的本科生课程的基础上,介绍了语音信号处理的基本原理、分析方法以及该学科领域近年来取得的一些研究成果和技术,在理论和应用之间达到了极好的平衡。全书共11章,内容包括: 绪论、语音信号处理的声学理论与模型、传统语音信号分析方法、现代语音信号处理方法、语音信号的参数估计、语音编码、语音增强、语音合成、语音识别、说话人识别、语音信号中的情感信息处理。另外,在本书的每章中都加入了复习题,供读者思考。 本书可作为高等院校计算机应用、信号与信息处理、通信与信息系统等专业的高年级本科生、研究生教材,同时也可供语音信号处理等领域的工程技术人员参考。
-
目录:
第1章绪论
1.1语音信号处理的发展历史
1.1.1经典语音信号处理技术
1.1.2新兴的语音信号处理技术
1.2语音信号处理的研究内容
1.3本书的结构
第2章语音信号处理的声学理论与模型
2.1概述
2.2语音信号处理的声学基础
2.2.1语音的产生
2.2.2语音信号的感知
2.2.3掩蔽效应
2.3语音生成的数学模型
2.3.1激励模型
2.3.2声道模型
2.3.3辐射模型
2.4语音信号的特性分析
2.4.1语音信号的时域波形和频谱特性
2.4.2语音信号的语谱图
2.4.3语音信号的统计特性
2.5语音学基本概念
2.5.1语音学
2.5.2语音的分类及其声学特征
2.5.3汉语语音学
2.6小结
复习思考题
第3章传统语音信号分析方法
3.1概述
3.2语音信号数字化和预处理
3.2.1数字化
3.2.2预处理
3.3端点检测
3.3.1双门限法
3.3.2相关法的端点检测
3.3.3能零比双门限法
3.4语音信号的时域分析
3.4.1短时能量及短时平均幅度分析
3.4.2短时过零率分析
3.4.3短时相关分析
3.4.4短时平均幅度差函数
3.5语音信号的频域分析
3.5.1利用短时傅里叶变换求语音的短时谱
3.5.2语音的短时谱的临界带特征矢量
3.6语音信号的线性预测(LPC)分析
3.6.1线性预测分析的基本原理
3.6.2线性预测方程组的求解
3.6.3LPC谱估计和LPC复倒谱
3.6.4线谱对(LSP)分析
3.7小结
复习思考题
第4章现代语音信号处理方法
4.1概述
4.2同态信号处理
4.2.1同态信号处理的基本原理
4.2.2语音信号的复倒谱
4.2.3语音信号两个卷积分量的复倒谱
4.2.4语音信号倒谱分析实例
4.3小波变换
4.3.1小波变换的基本原理
4.3.2常用小波函数的介绍
4.3.3小波基和分解层数的选择
4.3.4语音信号小波变换分析实例
4.4Teager能量操作
4.4.1连续时间和离散时间的能量操作
4.4.2连续时间和离散时间的能量分离(ESA)
4.4.3语音信号Teager能量算子分析实例
4.5希尔伯特黄变换
4.5.1希尔伯特黄变换的起源
4.5.2经验模式分解
4.5.3希尔伯特黄变换的时频谱
4.6经验小波变换
4.6.1经验小波的定义
4.6.2傅里叶频谱划分
4.6.3窗的选取
4.6.4经验小波变换及其改进算法
4.6.5语音信号经验小波变换分析实例
4.7小结
复习思考题
第5章语音信号的参数估计
5.1概述
5.2基音周期估计
5.2.1基音周期估计分类
5.2.2基于自相关的基音周期估计
5.2.3基于平均幅度差函数(AMDF)的基音周期估计
5.2.4基于倒谱法(CEP)的基音周期估计
5.2.5基于简化的逆滤波跟踪(SIFT)的基音周期估计
5.2.6基于小波变换的基音周期估计
5.2.7基于倒谱和希尔伯特黄变换的基音周期估计
5.2.8基于系综经验模式分解的动态基音周期估计
5.2.9基于系综经验模式分解和倒谱法的基音周期估计
5.2.10基音周期估计的后处理
5.3共振峰估计
5.3.1传统的共振峰估计方法
5.3.2基于希尔伯特黄变换的汉语共振峰估计
5.4梅尔频率倒谱系数
5.4.1梅尔滤波器组
5.4.2MFCC特征参数提取
5.5小结
复习思考题
第6章语音编码
6.1概述
6.2语音信号压缩编码的原理
6.2.1语音编码分类
6.2.2语音压缩的基本原理
6.3语音编码的关键技术
6.3.1线性预测
6.3.2合成分析法(AnalysisBySynthesis)
6.3.3感觉加权滤波器
6.4语音编码的性能指标和评测方法
6.4.1主观评价
6.4.2客观评价
6.5语音信号的波形编码
6.5.1脉冲编码调制(PCM)
6.5.2自适应预测编码(APC)
6.5.3自适应增量调制(ADM)
6.5.4自适应差分脉冲编码调制(ADPCM)
6.5.5子带编码(SBC)
6.5.6自适应变换编码(ATC)
6.6语音信号的参数编码
6.6.1线性预测声码器
6.6.2LPC10编码器
6.7语音信号的混合编码
6.8现代通信中的语音信号编码方法
6.8.1EVS编码器概述
6.8.2EVS编码器设计指标
6.8.3EVS编码涉及的关键技术
6.8.4EVS编码器评价
6.9小结
复习思考题
第7章语音增强
7.1概述
7.2语音特性、人耳感知特性
7.2.1语音特性
7.2.2人耳感知特性
7.3传统语音增强技术
7.3.1基于滤波法的语音增强技术
7.3.2基于减谱法的语音增强技术
7.3.3基于Weiner滤波法的语音增强技术
7.3.4基于模型的语音增强技术
7.3.5基于听觉掩蔽的语音增强技术
7.3.6基于时域处理的语音增强技术
7.4现代语音增强技术
7.4.1基于非负矩阵分解的语音增强技术
7.4.2基于DNN频谱映射的语音增强技术
7.5小结
复习思考题
第8章语音合成
8.1概述
8.2共振峰合成法
8.3线性预测合成法
8.4神经网络语音合成法
8.5语音合成专用硬件简介
8.6PSOLA算法合成语音
8.7文语转换系统(TTS)
8.7.1文语转换系统的组成
8.7.2连读语音的韵律特性
8.7.3文本分析方法
8.7.4语音合成方法
8.7.5语音合成中的韵律控制
8.8小结
复习思考题
第9章语音识别
9.1概述
9.2语音识别原理和识别系统的组成
9.2.1预处理和参数分析
9.2.2语音识别
9.2.3语音识别系统的基本数据库
9.3动态时间规整(DTW)
9.4孤立字(词)识别系统
9.4.1基于MQDF的汉语塞音语音识别系统
9.4.2基于概率尺度DP识别方法的孤立字(词)识别系统
9.5连续语音识别系统
9.5.1声学基元模型
9.5.2系统语言模型
9.5.3句法分析和单词的预测方法
9.6连续语音识别系统的性能评测
9.6.1连续语音识别系统的评测方法以及系统复杂性和识别能力的测度
9.6.2综合评估连续语音识别系统时需要考虑的其他因素
9.7基于DNNHMM的语音识别系统
9.8小结
复习思考题
第10章说话人识别
10.1概述
10.2说话人识别方法和系统结构
10.2.1预处理
10.2.2说话人识别的特征提取
10.2.3特征参量评价方法
10.2.4模式匹配方法
10.2.5说话人识别中判别方法和阈值的选择
10.2.6说话人识别系统的评价
10.3应用DTW的说话人确认系统
10.4应用VQ的说话人识别系统
10.5应用HMM的说话人识别系统
10.5.1基于HMM的与文本有关的说话人识别
10.5.2基于HMM的与文本无关的说话人识别
10.5.3基于HMM的指定文本型说话人识别
10.5.4说话人识别HMM的学习方法
10.5.5鲁棒的HMM说话人识别技术
10.6应用GMM的说话人识别系统
10.6.1GMM模型的基本概念
10.6.2GMM模型的参数估计
10.6.3训练数据不充分的问题
10.6.4GMM模型的识别问题
10.6.5应用GMM和BP网络的说话人识别系统
10.7应用深度学习的说话人识别
10.7.1基于DNNUBM模型的说话人识别
10.7.2说话人识别中的embeddings特征
10.8说话人识别中尚需进一步探索的研究课题
10.8.1基础性的课题
10.8.2实用性的问题
10.9语种辨识的原理和应用
10.9.1语种辨识的基本原理和方法
10.9.2语种辨识的应用领域
10.10小结
复习思考题
第11章语音信号中的情感信息处理
11.1概述
11.2语言信号中的情感分类和情感特征分析
11.2.1语音情感识别系统模型
11.2.2语音信号中的情感分类
11.2.3语料库
11.2.4语音情感特征分析
11.2.5语音情感识别特征分析方法
11.3基于融合特征的语音情感识别方法
11.3.1特征提取
11.3.2分类器
11.3.3仿真实验
11.4基于LSTM的语音情感识别方法
11.4.1LSTM实现原理
11.4.2应用LSTM的语音情感识别
11.4.3仿真实验
11.5基于CNN的语音情感识别方法
11.5.1卷积神经网络(CNN)
11.5.2基于CNN的语音情感识别模型
11.5.3仿真实验
11.6小结
复习思考题
汉英名词术语对照
查看详情
-
全新
河北省保定市
平均发货29小时
成功完成率89.02%
-
全新
北京市房山区
平均发货34小时
成功完成率83.12%
-
全新
河北省保定市
平均发货32小时
成功完成率87.81%
-
全新
河北省保定市
平均发货30小时
成功完成率88.52%
-
6
全新
广东省广州市
平均发货17小时
成功完成率94.23%
-
6
全新
北京市房山区
平均发货12小时
成功完成率96.84%
-
6
全新
江苏省无锡市
平均发货15小时
成功完成率95.56%
-
6
全新
广东省广州市
平均发货17小时
成功完成率94.43%
-
6
全新
天津市河东区
平均发货24小时
成功完成率88.64%
-
6
全新
北京市海淀区
平均发货9小时
成功完成率97.77%
-
6
全新
北京市西城区
平均发货12小时
成功完成率93.96%
-
6
全新
天津市西青区
平均发货15小时
成功完成率91.07%
-
全新
天津市东丽区
平均发货20小时
成功完成率91.52%
-
全新
江苏省南京市
平均发货14小时
成功完成率83.69%
-
2
全新
江苏省无锡市
平均发货10小时
成功完成率96.6%
-
全新
河北省保定市
平均发货15小时
成功完成率92.68%
-
语音信号处理、
全新正版书籍,假一罚十(图片为标准图,仅供参考。以标题为准,不了解的可以询问客服。) 可开发票
全新
北京市朝阳区
平均发货12小时
成功完成率96.77%
-
语音信号处理
全新正版书籍,假一罚十(图片为标准图,仅供参考。以标题为准,不了解的可以询问客服。)
全新
北京市朝阳区
平均发货11小时
成功完成率96.29%
-
2
全新
江苏省南京市
平均发货6小时
成功完成率96.44%
-
2
全新
江苏省南京市
平均发货5小时
成功完成率98.3%
-
2
全新
江苏省南京市
平均发货5小时
成功完成率98.37%
-
2
全新
江苏省南京市
平均发货14小时
成功完成率83.69%
-
语音信号处理
大中专理科电工电子 本书采用实战编程,精选实用案例,方便操作掌握 新华书店全新正版书籍
全新
江苏省无锡市
平均发货8小时
成功完成率96.02%
-
全新
河北省保定市
平均发货18小时
成功完成率91.93%
-
全新
江苏省无锡市
平均发货19小时
成功完成率89.72%
-
全新
河北省保定市
平均发货17小时
成功完成率93.8%
-
全新
四川省成都市
平均发货52小时
成功完成率85.52%
-
全新
北京市朝阳区
平均发货17小时
成功完成率85.94%
-
全新
河北省保定市
平均发货28小时
成功完成率88.95%
-
全新
北京市房山区
平均发货14小时
成功完成率88.77%
-
语音信号处理
正版书籍如有疑问请咨询客服支持开票书友放心购买
全新
江苏省无锡市
平均发货19小时
成功完成率89.72%
-
语言信号处理
本店所售图书,保证正版新书,有个别图片和实书封面不一样,以实书封面为准,有需要确定的可以联系客服。我店不能开发票。当天下单第二天发货。
全新
四川省成都市
平均发货33小时
成功完成率83.23%
-
全新
北京市海淀区
平均发货16小时
成功完成率88.46%
-
2
全新
河北省保定市
平均发货25小时
成功完成率90.54%
-
全新
河北省保定市
平均发货29小时
成功完成率90.68%
-
全新
河北省保定市
平均发货27小时
成功完成率90.24%
-
全新
江苏省无锡市
平均发货19小时
成功完成率89.72%
-
全新
河北省保定市
平均发货27小时
成功完成率86.33%
-
语言信号处理
正版图书,放心下单,请核对以书号和标题书名为准
全新
河北省保定市
平均发货27小时
成功完成率89.06%
-
全新
天津市河北区
平均发货25小时
成功完成率78.71%
-
全新
河北省保定市
平均发货26小时
成功完成率84.28%
-
全新
河北省保定市
平均发货24小时
成功完成率82.23%
-
2
全新
河北省保定市
平均发货27小时
成功完成率89.06%
-
全新
山东省潍坊市
平均发货20小时
成功完成率79.22%
-
2023-06 印刷
九五品
河北省廊坊市
平均发货12小时
成功完成率92.04%
-
语言信号处理
正版库存新书☞无阅读划线☞图片与标题不符时以标题为主☞套书售价较底的为单册价。
全新
河北省廊坊市
平均发货9小时
成功完成率89.25%
-
全新
山东省潍坊市
平均发货20小时
成功完成率79.22%
-
6
全新
广东省广州市
平均发货7小时
成功完成率89.75%
-
九五品
北京市丰台区
平均发货8小时
成功完成率78.6%
-
全新
北京市朝阳区
平均发货12小时
成功完成率92.86%