研究生用书：数字语音处理

作者: 姚天任编

出版社: 华中科技大学出版社

出版时间: 1992-04

版次: 1

ISBN: 9787560906188

定价: 20.00

装帧: 平装

开本: 32开

纸张: 胶版纸

页数: 399页

分类: 教材教辅考试>教材>研究生教材>工程技术

《研究生用书：数字语音处理》系统全面地讨论了语言信号数字处理的理论基础、各种方法和某些重要应用领域。全书十章，分别论及语音信号的基本性质和数字模型，短时时域处理技术，短时傅里叶分析，语音波形数字编码，同态语音处理和倒谱分析，线性预测编码，矢量量化，隐马尔柯夫模型，以及语音压缩、语音合成、语音识别和语音增强等典型应用领域。《研究生用书：数字语音处理》主要是为研究生和本科高年级学生写的，但也可作为工程技术人员和科学研究工作者的一本有用的参考书。　　姚天任，1962年毕业于北京清华大学无线电电子学系。1982年至1984年为美国辛辛那提大学访问学者。现任华中科技大学教授、博士生导师，中国电子学会信号处理分会副理事长《信号处理》学报编委会副主编。

　　作者主要著作有《高频电子线路》、《数字信号处理》、《数字语音处理》和《现代数字信号处理》，分别获全国高等学校优秀教材奖、原电子部优秀教材一等奖、湖北省科技进步三等奖。主要科研成果有“数论变换和多项式变换的理论和应用”等4项国家自然科学基金项目，“蓝绿激光对潜通信”等3项“八五”和“九五”国防科技重点预研项目，分别获中船总科技进步一等奖。在国内外重要刊物和学术会议上发表论文百余篇。

　　作者目前的主要研究方向是多媒体信息处理和通信、现代数字信号处理、语音压缩编码、汉语语音识别和语音增强等。第一章绪论

1.1 数字语音处理研究的内容

1.2 语音处理的发展历史

1.3 本书的内容

第二章语音信号产生的数字模型

2.1 人类的语言器官

2.2 语音产生过程

2.3 语音信号产生的数字模型

2.4 语音信号的特性

2.4.1 语音的声学特性

2.4.2 语音的时间波形和频谱特性

2.4.3 语音信号的统计特性

2.5 人类的听觉功能

第三章语音波形的数字编码

3.1 脉冲编码调制（PCM）

3.1.1 语音信号的取样

3.1.2 取样语音信号的量化

3.1.3 减小量化噪声影响的方法

3.2 差分脉冲编码调制（DPCM）

3.2.1 DPCM原理

3.2.2 DPCM的信噪比

3.2.3 预测系数对差分增益的影响

3.3 增量调制（DM）

3.3.1 DM原理

3.3.2 DM的斜率过载失真和颗粒噪声

3.3.3 DM的信噪比

3.4 自适应技术在语音波形编码中的应用

3.4.1 一般原理

3.4.2 自适应量化

3.4.3 自适应增量调制（ADM）

3.4.4 自适应线性预测

3.5 压缩比特率的其它方法

3.5.1 残差信号压缩

3.5.2 噪声整形

3.5.3 多脉冲技术

第四章短时时域处理技术

4.1 语音信号的短时处理方法

4.2 短时能量和短时平均幅度

4.2.1 短时能量

4.2.2 短时平均幅度

4.3 短时平均过零率

4.4 短时自相关函数

4.4.1 短时自相关函数的定义

4.4.2 减少短时自相关函数计算量的方法

4.4.3 语音信号的短时自相关函数的实例

4.4.4 短时自相关函数的另一种计算方法

4.4.5 短时平均幅度差函数

4.5 短时时域处理技术应用举例

4.5.1 语音段起止端点判别

4.5.2 基音周期的估计

4.6 中值滤波在语音短时时域处理中的应用

第五章短时傅里叶分析

5.1 短时傅里叶变换的定义

5.1.1 定义

5.1.2 移动窗形状对短时傅里叶变换的影响

5.1.3 窗宽对短时频谱的影响

5.1.4 结论

5.2 短时傅里叶变换的某些性质

5.3 短时傅里叶变换的线性滤波实现

5.4 短时傅里叶谱的取样

5.4.1 短时傅里叶变换的时域取样

5.4.2 短时傅里叶变换的频域取样

5.4.3 短时傅里叶变换时域和频域总取样率

5.5 语音的短时合成技术

5.5.1 语音短时合成的滤波器组相加法

5.5.2 短时傅里叶变换的欠速率取样

5.5.3 语音短时合成的叠接相加法

5.5.4 短时频谱变化对合成结果的影响

5.6 短时分析-合成数字滤波器组的设计

5.6.1 设计中需要考虑的实际问题

5.6.2 IIR滤波器组的设计

5.6.3 FIR带通滤波器组的设计

5.7用快速傅里叶变换进行短时傅里叶分析

5.7.1 基本原理

5.7.2 减少计算量的其它考虑

5.7.3 用FFT节省短时谱合成语音信号的计算量

第六章语音信号的线性预测

6.1 线性预测基本原理

6.2 线性预测和信号模型之间的关系

6.3 Levinson-Durbin算法

6.4 格型滤波器

6.4.1 前向预测和反向预测

6.4.2 格型滤波器的结构

6.4.3 格型滤波器的性质

6.5 由已知数据计算预测系数的方法

6.5.1 自相关法或Yule-Walker法

6.5.2 协方差法

6.5.3 Burg法

6.6 线性预测的频域解释

6.6.1 最小预测误差

6.6.2 线性预测谱匹配性质

6.7线性预测模型的局限性

6.7.1 基音频率对预测系数的影响

6.7.2 高频损失问题

6.8线性预测分析应用举例

6.8.1 基音检测

6.8.2 共振峰估计

6.9对数面积比（LAR）参数

第七章语音信号的同态滤波和倒谱分析

7.1 广义叠加原理

7.2 卷积同态系统

7.3 复倒谱的定义

7.3.1 复对数的多值性问题

7.3.2 X（z）的解析性问题

7.4 复倒谱的性质和计算方法

7.4.1 复倒谱的性质

7.4.2 复倒谱的计算方法

7.5 语音的倒谱分析

第八章矢量量化

8.1 矢量量化基本原理

8.1.1 矢量量化过程

8.1.2 失真的测度

8.1.3 码本的设计

8.1.4 计算量和存贮量的估计

8.1.5 几个例子

8.2 矢量量化器的理论性能

8.2.1 率-失真理论

8.2.2 率-失真理论的一些结果

8.2.3 标量量化

8.2.4 矢量量化的一些理论结果

8.3 矢量源的标量量化和矢量量化

8.3.1 比特分配

8.3.2 相关源的矢量旋转

8.3.3 标量量化和矢量量化的比较

8.4 减少矢量量化中计算量和存贮量的方法

8.4.1 二叉树搜索

8.4.2 多级矢量量化

8.4.3 乘积码

8.5 码本的训练和测试

8.6 码本的鲁棒性

8.7时间依赖矢量量化

8.7.1 选帧传送

8.7.2 分段量化

8.7.3 自适应矢量量化器

8.8语音波形矢量量化

8.8.1 波形标量量化

8.8.2 波形矢量量化

第九章隐马尔柯夫模型（HMM）

9.1 隐马尔柯夫模型的定义

9.1.1 信号模型

9.1.2 离散马尔柯夫过程

9.1.3 隐马尔柯夫模型的概念

9.1.4 隐马尔柯夫模型的参数

9.2 隐马尔柯夫模型的三个基本问题

9.2.1 三个基本问题的提出

9.2.2 第1个问题的求解

9.2.3 第2个问题的求解

9.2.4 第3个问题的求解

9.3 隐马尔柯夫模型的类型

9.3.1 隐马尔柯夫模型中的连续观测密度

9.3.2 自回归隐马尔柯夫模型

9.3.3 隐马尔柯夫模型的变型

9.3.4 含有状态持续时间密度显函数的隐马尔柯夫模型

9.3.5 最佳判据

9.3.6 隐马尔柯夫模型的比较

9.4 隐马尔柯夫模型的实现问题

9.4.1 定标

9.4.2 多个观测序列

9.4.3 隐马尔柯夫模型参数的初始估计

9.4.4 训练数据不够的影响

9.4.5 模型选择

第十章数字语音处理的应用

10.1 语音压缩

10.1.1 声码器的基本结构

10.1.2 通道声码器

10.1.3 共振峰声码器

10.1.4 线性预测编码声码器

10.1.5 矢量量化在语音压缩中的应用

10.2 语音合成

10.2.1 以单词为基础的合成方法

10.2.2 以音节为基础的合成方法

10.2.3 以音素为基础的合成方法

10.2.4 语音合成器芯片和语音合成系统

10.3 浯音识别

10.3.1 孤立单词语音识别

10.3.2 线性时间归一化

10.3.3 非线性时间归一化

10.3.4 采用DTW的孤立单词语音识别

10.3.5 隐马尔柯夫模型在孤立单词语音识别中的应用

10.3.6 连续语音识别

10.4 语音增强

参考文献
内容简介:
《研究生用书：数字语音处理》系统全面地讨论了语言信号数字处理的理论基础、各种方法和某些重要应用领域。全书十章，分别论及语音信号的基本性质和数字模型，短时时域处理技术，短时傅里叶分析，语音波形数字编码，同态语音处理和倒谱分析，线性预测编码，矢量量化，隐马尔柯夫模型，以及语音压缩、语音合成、语音识别和语音增强等典型应用领域。《研究生用书：数字语音处理》主要是为研究生和本科高年级学生写的，但也可作为工程技术人员和科学研究工作者的一本有用的参考书。
作者简介:
　　姚天任，1962年毕业于北京清华大学无线电电子学系。1982年至1984年为美国辛辛那提大学访问学者。现任华中科技大学教授、博士生导师，中国电子学会信号处理分会副理事长《信号处理》学报编委会副主编。

　　作者主要著作有《高频电子线路》、《数字信号处理》、《数字语音处理》和《现代数字信号处理》，分别获全国高等学校优秀教材奖、原电子部优秀教材一等奖、湖北省科技进步三等奖。主要科研成果有“数论变换和多项式变换的理论和应用”等4项国家自然科学基金项目，“蓝绿激光对潜通信”等3项“八五”和“九五”国防科技重点预研项目，分别获中船总科技进步一等奖。在国内外重要刊物和学术会议上发表论文百余篇。

　　作者目前的主要研究方向是多媒体信息处理和通信、现代数字信号处理、语音压缩编码、汉语语音识别和语音增强等。
目录:
第一章绪论

1.1 数字语音处理研究的内容

1.2 语音处理的发展历史

1.3 本书的内容

第二章语音信号产生的数字模型

2.1 人类的语言器官

2.2 语音产生过程

2.3 语音信号产生的数字模型

2.4 语音信号的特性

2.4.1 语音的声学特性

2.4.2 语音的时间波形和频谱特性

2.4.3 语音信号的统计特性

2.5 人类的听觉功能

第三章语音波形的数字编码

3.1 脉冲编码调制（PCM）

3.1.1 语音信号的取样

3.1.2 取样语音信号的量化

3.1.3 减小量化噪声影响的方法

3.2 差分脉冲编码调制（DPCM）

3.2.1 DPCM原理

3.2.2 DPCM的信噪比

3.2.3 预测系数对差分增益的影响

3.3 增量调制（DM）

3.3.1 DM原理

3.3.2 DM的斜率过载失真和颗粒噪声

3.3.3 DM的信噪比

3.4 自适应技术在语音波形编码中的应用

3.4.1 一般原理

3.4.2 自适应量化

3.4.3 自适应增量调制（ADM）

3.4.4 自适应线性预测

3.5 压缩比特率的其它方法

3.5.1 残差信号压缩

3.5.2 噪声整形

3.5.3 多脉冲技术

第四章短时时域处理技术

4.1 语音信号的短时处理方法

4.2 短时能量和短时平均幅度

4.2.1 短时能量

4.2.2 短时平均幅度

4.3 短时平均过零率

4.4 短时自相关函数

4.4.1 短时自相关函数的定义

4.4.2 减少短时自相关函数计算量的方法

4.4.3 语音信号的短时自相关函数的实例

4.4.4 短时自相关函数的另一种计算方法

4.4.5 短时平均幅度差函数

4.5 短时时域处理技术应用举例

4.5.1 语音段起止端点判别

4.5.2 基音周期的估计

4.6 中值滤波在语音短时时域处理中的应用

第五章短时傅里叶分析

5.1 短时傅里叶变换的定义

5.1.1 定义

5.1.2 移动窗形状对短时傅里叶变换的影响

5.1.3 窗宽对短时频谱的影响

5.1.4 结论

5.2 短时傅里叶变换的某些性质

5.3 短时傅里叶变换的线性滤波实现

5.4 短时傅里叶谱的取样

5.4.1 短时傅里叶变换的时域取样

5.4.2 短时傅里叶变换的频域取样

5.4.3 短时傅里叶变换时域和频域总取样率

5.5 语音的短时合成技术

5.5.1 语音短时合成的滤波器组相加法

5.5.2 短时傅里叶变换的欠速率取样

5.5.3 语音短时合成的叠接相加法

5.5.4 短时频谱变化对合成结果的影响

5.6 短时分析-合成数字滤波器组的设计

5.6.1 设计中需要考虑的实际问题

5.6.2 IIR滤波器组的设计

5.6.3 FIR带通滤波器组的设计

5.7用快速傅里叶变换进行短时傅里叶分析

5.7.1 基本原理

5.7.2 减少计算量的其它考虑

5.7.3 用FFT节省短时谱合成语音信号的计算量

第六章语音信号的线性预测

6.1 线性预测基本原理

6.2 线性预测和信号模型之间的关系

6.3 Levinson-Durbin算法

6.4 格型滤波器

6.4.1 前向预测和反向预测

6.4.2 格型滤波器的结构

6.4.3 格型滤波器的性质

6.5 由已知数据计算预测系数的方法

6.5.1 自相关法或Yule-Walker法

6.5.2 协方差法

6.5.3 Burg法

6.6 线性预测的频域解释

6.6.1 最小预测误差

6.6.2 线性预测谱匹配性质

6.7线性预测模型的局限性

6.7.1 基音频率对预测系数的影响

6.7.2 高频损失问题

6.8线性预测分析应用举例

6.8.1 基音检测

6.8.2 共振峰估计

6.9对数面积比（LAR）参数

第七章语音信号的同态滤波和倒谱分析

7.1 广义叠加原理

7.2 卷积同态系统

7.3 复倒谱的定义

7.3.1 复对数的多值性问题

7.3.2 X（z）的解析性问题

7.4 复倒谱的性质和计算方法

7.4.1 复倒谱的性质

7.4.2 复倒谱的计算方法

7.5 语音的倒谱分析

第八章矢量量化

8.1 矢量量化基本原理

8.1.1 矢量量化过程

8.1.2 失真的测度

8.1.3 码本的设计

8.1.4 计算量和存贮量的估计

8.1.5 几个例子

8.2 矢量量化器的理论性能

8.2.1 率-失真理论

8.2.2 率-失真理论的一些结果

8.2.3 标量量化

8.2.4 矢量量化的一些理论结果

8.3 矢量源的标量量化和矢量量化

8.3.1 比特分配

8.3.2 相关源的矢量旋转

8.3.3 标量量化和矢量量化的比较

8.4 减少矢量量化中计算量和存贮量的方法

8.4.1 二叉树搜索

8.4.2 多级矢量量化

8.4.3 乘积码

8.5 码本的训练和测试

8.6 码本的鲁棒性

8.7时间依赖矢量量化

8.7.1 选帧传送

8.7.2 分段量化

8.7.3 自适应矢量量化器

8.8语音波形矢量量化

8.8.1 波形标量量化

8.8.2 波形矢量量化

第九章隐马尔柯夫模型（HMM）

9.1 隐马尔柯夫模型的定义

9.1.1 信号模型

9.1.2 离散马尔柯夫过程

9.1.3 隐马尔柯夫模型的概念

9.1.4 隐马尔柯夫模型的参数

9.2 隐马尔柯夫模型的三个基本问题

9.2.1 三个基本问题的提出

9.2.2 第1个问题的求解

9.2.3 第2个问题的求解

9.2.4 第3个问题的求解

9.3 隐马尔柯夫模型的类型

9.3.1 隐马尔柯夫模型中的连续观测密度

9.3.2 自回归隐马尔柯夫模型

9.3.3 隐马尔柯夫模型的变型

9.3.4 含有状态持续时间密度显函数的隐马尔柯夫模型

9.3.5 最佳判据

9.3.6 隐马尔柯夫模型的比较

9.4 隐马尔柯夫模型的实现问题

9.4.1 定标

9.4.2 多个观测序列

9.4.3 隐马尔柯夫模型参数的初始估计

9.4.4 训练数据不够的影响

9.4.5 模型选择

第十章数字语音处理的应用

10.1 语音压缩

10.1.1 声码器的基本结构

10.1.2 通道声码器

10.1.3 共振峰声码器

10.1.4 线性预测编码声码器

10.1.5 矢量量化在语音压缩中的应用

10.2 语音合成

10.2.1 以单词为基础的合成方法

10.2.2 以音节为基础的合成方法

10.2.3 以音素为基础的合成方法

10.2.4 语音合成器芯片和语音合成系统

10.3 浯音识别

10.3.1 孤立单词语音识别

10.3.2 线性时间归一化

10.3.3 非线性时间归一化

10.3.4 采用DTW的孤立单词语音识别

10.3.5 隐马尔柯夫模型在孤立单词语音识别中的应用

10.3.6 连续语音识别

10.4 语音增强

参考文献

查看详情

研究生用书：数字语音处理

内容简介:

作者简介:

目录: