语音信号识别技术与实践

作者: 姜囡著

出版社: 东北大学出版社

出版时间: 2019-12

版次: 1

ISBN: 9787551723800

定价: 58.00

装帧: 平装

开本: 16开

纸张: 胶版纸

页数: 246页

分类: 计算机与互联网

《语音信号识别技术与实践》内容分为8章。第1章为语音识别技术概述，介绍了语音识别技术的原理和发展与应用。第2章为语音信号处理基本技术，包括数字化预处理、短时时域处理和频域处理的内容。第3章是语音信号的端点检测和分割，介绍了端点检测的原理和常规检测方法，提出了基于复杂背景条件下的端点检测算法，包括算法流程和实验方法。第4章是语音分割聚类，研究了如何获取一段多人对话语音中说话人身份变动的信息，以及如何确定哪些语音段是由同一个人发出来的。详细介绍了三种方法，包括基于混合特征的分割聚类方法、基于改进双门限端点检测的分割法、基于自组织神经网络的改进K-means聚类算法。第5章为基于神经网络的语音识别，详述了基于自适应免疫克隆神经网络的语音识别算法原理、流程和实验方法。第6章是伪装语音识别，探讨了在语音被采用伪装手段（如在耳语、假声、模仿他人讲话、捏鼻子讲话以及用手绢或口罩等物品捂嘴讲话等）情况下，如何正确进行语音鉴定的问题。提出了基于GFCC与共振峰的声纹提取方法和基于深度置信网络模型的声纹提取方法。第7章是基于语音信号的心理压力分级与识别，探讨了反映心理压力的生理信号和分级实验方法，以及基于语音信号的心理压力识别方法。第8章是不同情感的语音声学特征分析，通过对生气、害怕、高兴、中性、惊讶、悲伤六种情感语音的共振峰频率特征、共振峰走向特征、音节间的过渡特征、音节内的过渡特征、基频曲线特征以及振幅曲线特征进行语音声学特征分析，探索了同一个人的语音在不同情感下表现的特征差异。
《语音信号识别技术与实践》较全面地总结了课题组近年来关于语音识别、语音与心理压力等级识别、语音与情感分析方面的研究内容。主要章节均以理论介绍、算法流程、实验步骤、结果分析为脉络撰写，内容详尽，循序渐进，适合语音识别及语音情感分析的初学者，希望为在此领域有求知欲的学子打开一扇探索之门。第1章语音识别技术概述
1．1 语音识别的基本原理
1．2 语音识别技术的发展
1．3 语音识别技术的应用
1．4 本章小结

第2章语音信号处理基本技术
2．1 语音信号的数字化预处理
2．1．1 预滤波
2．1．2 采样与量化
2．1．3 语音信号的A／D转化
2．1．4 预加重
2．1．5 分帧处理
2．1．6 加窗处理
2．2 语音信号的短时时域处理
2．2．1 短时能量
2．2．2 短时过零率
2．3 语音信号的短时频域处理
2．3．1 短时傅里叶变换
2．3．2 语谱图
2．3．3 短时功率谱密度
2．4 本章小结

第3章语音信号的端点检测和分割
3．1 端点检测的基本原理
3．2 语音端点检测的常规方法
3．2．1 基于短时能量和过零率的语音端点检测
3．2．2 基于自相关函数的语音端点检测
3．2．3 基于小波变换的语音端点检测
3．3 基于小波分析的语音端点检测
3．3．1 小波变换的基本原理
3．3．2 基于小波变换的语音端点检测
3．4 基于小波包和高阶累积量的语音端点检测
3．4．1 小波包变换
3．4．2 高阶累积量理论
3．4．3 基于小波包和高阶累积量的语音端点检测算法设计
3．4．4 实验分析
3．5 基于自适应门限的分形维数语音端点检测
3．5．1 基于分形维数的端点检测
3．5．2 基于自适应门限的分形维数端点检测算法设计
3．6 本章小结

第4章语音分割聚类
4．1 基于混合特征的说话人语音分割聚类
4．1．1 说话人语音分割聚类
4．1．2 基于混合特征的语音分割聚类算法设计
4．1．3 实验验证
4．2 基于改进双门限端点检测法的说话人语音分割
4．2．1 语音分割方法的选取
4．2．2 传统双门限端点检测算法研究
4．2．3 双门限端点检测算法的改进设计
4．2．4 基于改进双门限法的说话人语音分割步骤
4．2．5 实验验证
4．3 基于自组织神经网络的改进K-means说话人语音聚类
4．3．1 K-means说话人语音聚类算法
4．3．2 自组织神经网络说话人聚类算法设计
4．3．3 基于自组织神经网络的改进K-means说话人语音聚类算法设计
4．3．4 实验验证
4．4 本章小结

第5章基于神经网络的语音识别
5．1 自适应免疫克隆算法和神经网络基础知识
5．1．1 自适应免疫克隆算法
5．1．2 神经元
5．1．3 网络连接方式
5．1．4 学习（训练）算法
5．1．5 BP神经网络
5．2 基于自适应免疫克隆神经网络的语音识别算法设计
5．3 实验验证
5．4 本章小结

第6章伪装语音识别
6．1 基础知识
6．1．1 伪装语音声纹识别概述
6．1．2 深度学习概述
6．2 基于GFCC与共振峰的伪装语音声纹特征提取
6．2．1 倒谱法提取共振峰系数
6．2．2 GFCC参数的提取
6．2．3 高斯混合模型
6．2．4 基于混合参数的改进特征提取算法
6．2．5 实验及结果分析
6．3 基于DBN模型的伪装语音声纹识别系统
6．3．1 深度置信网络
6．3．2 基于DBN的改进模型算法
6．3．3 实验及结果分析
6．4 本章小结

第7章基于语音信号的心理压力分级与识别
7．1 基于语音和生理信号的心理压力分级
7．1．1 心理压力多模态参数影响分析
7．1．2 心理压力等级识别分析
7．1．3 基于语音信号的心理压力等级识别验证
7．2 基于MFCC和GFCC混合特征的语音情感识别研究
7．2．1 基于混合特征的语音情感特征提取
7．2．2 基于CNN的语音情感识别
7．2．3 实验分析
7．3 本章小结

第8章不同情感的语音声学特征分析
8．1 情感语音文本的选择
8．2 情感语音声学特征分析
8．2．1 共振峰频率特征
8．2．2 共振峰走向特征
8．2．3 音节内过渡特征
8．2．4 音节间过渡特征
8．2．5 基频曲线特征
8．2．6 振幅曲线特征
8．3 情感语音声学特征分析结果
8．4 本章小结
参考文献
内容简介:
《语音信号识别技术与实践》内容分为8章。第1章为语音识别技术概述，介绍了语音识别技术的原理和发展与应用。第2章为语音信号处理基本技术，包括数字化预处理、短时时域处理和频域处理的内容。第3章是语音信号的端点检测和分割，介绍了端点检测的原理和常规检测方法，提出了基于复杂背景条件下的端点检测算法，包括算法流程和实验方法。第4章是语音分割聚类，研究了如何获取一段多人对话语音中说话人身份变动的信息，以及如何确定哪些语音段是由同一个人发出来的。详细介绍了三种方法，包括基于混合特征的分割聚类方法、基于改进双门限端点检测的分割法、基于自组织神经网络的改进K-means聚类算法。第5章为基于神经网络的语音识别，详述了基于自适应免疫克隆神经网络的语音识别算法原理、流程和实验方法。第6章是伪装语音识别，探讨了在语音被采用伪装手段（如在耳语、假声、模仿他人讲话、捏鼻子讲话以及用手绢或口罩等物品捂嘴讲话等）情况下，如何正确进行语音鉴定的问题。提出了基于GFCC与共振峰的声纹提取方法和基于深度置信网络模型的声纹提取方法。第7章是基于语音信号的心理压力分级与识别，探讨了反映心理压力的生理信号和分级实验方法，以及基于语音信号的心理压力识别方法。第8章是不同情感的语音声学特征分析，通过对生气、害怕、高兴、中性、惊讶、悲伤六种情感语音的共振峰频率特征、共振峰走向特征、音节间的过渡特征、音节内的过渡特征、基频曲线特征以及振幅曲线特征进行语音声学特征分析，探索了同一个人的语音在不同情感下表现的特征差异。
《语音信号识别技术与实践》较全面地总结了课题组近年来关于语音识别、语音与心理压力等级识别、语音与情感分析方面的研究内容。主要章节均以理论介绍、算法流程、实验步骤、结果分析为脉络撰写，内容详尽，循序渐进，适合语音识别及语音情感分析的初学者，希望为在此领域有求知欲的学子打开一扇探索之门。
目录:
第1章语音识别技术概述
1．1 语音识别的基本原理
1．2 语音识别技术的发展
1．3 语音识别技术的应用
1．4 本章小结

第2章语音信号处理基本技术
2．1 语音信号的数字化预处理
2．1．1 预滤波
2．1．2 采样与量化
2．1．3 语音信号的A／D转化
2．1．4 预加重
2．1．5 分帧处理
2．1．6 加窗处理
2．2 语音信号的短时时域处理
2．2．1 短时能量
2．2．2 短时过零率
2．3 语音信号的短时频域处理
2．3．1 短时傅里叶变换
2．3．2 语谱图
2．3．3 短时功率谱密度
2．4 本章小结

第3章语音信号的端点检测和分割
3．1 端点检测的基本原理
3．2 语音端点检测的常规方法
3．2．1 基于短时能量和过零率的语音端点检测
3．2．2 基于自相关函数的语音端点检测
3．2．3 基于小波变换的语音端点检测
3．3 基于小波分析的语音端点检测
3．3．1 小波变换的基本原理
3．3．2 基于小波变换的语音端点检测
3．4 基于小波包和高阶累积量的语音端点检测
3．4．1 小波包变换
3．4．2 高阶累积量理论
3．4．3 基于小波包和高阶累积量的语音端点检测算法设计
3．4．4 实验分析
3．5 基于自适应门限的分形维数语音端点检测
3．5．1 基于分形维数的端点检测
3．5．2 基于自适应门限的分形维数端点检测算法设计
3．6 本章小结

第4章语音分割聚类
4．1 基于混合特征的说话人语音分割聚类
4．1．1 说话人语音分割聚类
4．1．2 基于混合特征的语音分割聚类算法设计
4．1．3 实验验证
4．2 基于改进双门限端点检测法的说话人语音分割
4．2．1 语音分割方法的选取
4．2．2 传统双门限端点检测算法研究
4．2．3 双门限端点检测算法的改进设计
4．2．4 基于改进双门限法的说话人语音分割步骤
4．2．5 实验验证
4．3 基于自组织神经网络的改进K-means说话人语音聚类
4．3．1 K-means说话人语音聚类算法
4．3．2 自组织神经网络说话人聚类算法设计
4．3．3 基于自组织神经网络的改进K-means说话人语音聚类算法设计
4．3．4 实验验证
4．4 本章小结

第5章基于神经网络的语音识别
5．1 自适应免疫克隆算法和神经网络基础知识
5．1．1 自适应免疫克隆算法
5．1．2 神经元
5．1．3 网络连接方式
5．1．4 学习（训练）算法
5．1．5 BP神经网络
5．2 基于自适应免疫克隆神经网络的语音识别算法设计
5．3 实验验证
5．4 本章小结

第6章伪装语音识别
6．1 基础知识
6．1．1 伪装语音声纹识别概述
6．1．2 深度学习概述
6．2 基于GFCC与共振峰的伪装语音声纹特征提取
6．2．1 倒谱法提取共振峰系数
6．2．2 GFCC参数的提取
6．2．3 高斯混合模型
6．2．4 基于混合参数的改进特征提取算法
6．2．5 实验及结果分析
6．3 基于DBN模型的伪装语音声纹识别系统
6．3．1 深度置信网络
6．3．2 基于DBN的改进模型算法
6．3．3 实验及结果分析
6．4 本章小结

第7章基于语音信号的心理压力分级与识别
7．1 基于语音和生理信号的心理压力分级
7．1．1 心理压力多模态参数影响分析
7．1．2 心理压力等级识别分析
7．1．3 基于语音信号的心理压力等级识别验证
7．2 基于MFCC和GFCC混合特征的语音情感识别研究
7．2．1 基于混合特征的语音情感特征提取
7．2．2 基于CNN的语音情感识别
7．2．3 实验分析
7．3 本章小结

第8章不同情感的语音声学特征分析
8．1 情感语音文本的选择
8．2 情感语音声学特征分析
8．2．1 共振峰频率特征
8．2．2 共振峰走向特征
8．2．3 音节内过渡特征
8．2．4 音节间过渡特征
8．2．5 基频曲线特征
8．2．6 振幅曲线特征
8．3 情感语音声学特征分析结果
8．4 本章小结
参考文献

查看详情

语音信号识别技术与实践

内容简介:

目录: