说话人识别模型与方法

说话人识别模型与方法

分享

作者: 吴朝晖著 , 杨莹春著

出版社: 清华大学出版社

出版时间: 2009-03

版次: 1

ISBN: 9787302189688

定价: 53.00

装帧: 平装

开本: 16开

纸张: 胶版纸

页数: 329页

正文语种: 简体中文

丛书: 中国计算机学会学术著作丛书

分类: 计算机与互联网

1 张插图图片

16人买过

　　说话人识别是根据语音波形中反映说话人生理和行为的特征的语音参数，自动识别说话人身份的技术。本书作者结合多年的科研丁作，分5个部分介绍了说话人识别的基本概念、方法以及最新研究进展。第1部分概括介绍说话人识别的主要概念、基本原理、研究历史与现状，以及测试语料库的构建；第2部分介绍作者对特征提取提出的不同改进方法，包括特征组合与特征变换；第3部分是作者提出的新的说话人识别模型，包括支持向量机、动态贝叶斯网络、主成分分析；第4部分介绍作者在基于信息融合的说话人识别上的创新工作；第5部分介绍作者开发的一个软件平台及其基础上的两个具体应用系统，最后是全书总结并展望发展趋势。
　　本书可供信息工程、电子工程、计算机科学与技术、公安、军事侦察等领域的科技工作者参考，也可以作为高等院校信号与信息处理、通信与电子系统、模式识别、生物医学等学科专业的研究生或高年级本科生的教学参考书。第一篇绪论
第1章背景与概述
1.1研究背景及意义
1.1.1说话人识别介绍
1.1.2说话人识别的优势与应用前景
1.2研究进展与趋势
1.2.1研究历史
1.2.2研究现状
1.2.3发展趋势
1.2.4存在的问题
1.3本书结构
参考文献

第2章技术基础与理论
2.1背景知识
2.2说话人识别系统结构
2.3特征提取
2.3.1预处理
2.3.2美尔倒谱特征
2.3.3线性预测系数
2.3.4Delta特征和Delta_Dclta特征的计算
2.3.5声门特征
2.4说话人识别模型
2.4.1高斯混合模型
2.4.2隐马尔可夫模型
2.4.3动态时间规整模型
2.4.4向量量化模型，
2.5得分规整
2.6系统性能评价
2.6.1评价指标
2.6.2性能与用户规模的关系
2.6.3实际使用要求
2.7小结
参考文献

第3章说话人识别语料库
3.1常用语料库
3.2面向移动互联环境的说话人识别语料库(SRMC)
3.2.1SRMC的设计思路
3.2.2SRMC录音方案
3.2.3SRMC录音内容
3.2.4SRMC存储与标注
3.3电话语音库(PHONE)
3.4多模态说话人识别库
3.5NOISEX-92数据库
3.6小结
参考文献

第二篇特征提取
第4章说话人特征分析与优化
4.1特征性能分析
4.1.1阶数的影响
4.1.2帧长的影响
4.1.3结论
4.2特征参数优化
4.2.1语音包络检测
4.2.2包络最小长度限制
4.2.3预加重参数选取
4.2.4语音起始点的去除
4.2.5Delta特征的引入
4.2.6训练音长度的影响
4.2.7结论
4.3特征组合
4.3.1单一特征组合
4.3.2不同特征组合(小规模用户)
4.3.3不同特征组合(中等规模用户)
4.4二次特征提取
4.5小结
参考文献

第5章基于主成分分析(PCA)的说话人特征变换
5.1高维说话人特征的缺陷
5.2说话人特征与PCA变换
5.2.1说话人特征
5.2.2PCA变换的流程与效果
5.2.3说话人特征的PCA变换
5.3PCA特征变换应用于说话人鉴别
5.3.1传统的说话人鉴别系统
5.3.2基于PCA特征变换的可行性
5.4局部PCA特征变换
5.4.1基于局部PCA特征变换的说话人鉴别系统
5.4.2实验结果分析
5.4.3结论
5.5全局PCA特征变换
5.5.1基于全局PCA特征变换的说话人鉴别系统
5.5.2实验结果分析
5.5.3结论
5.6基准系统、局部PCA变换与全局PCA变换的比较
5.6.1可扩充性比较
5.6.2识别性能比较
5.7小结
参考文献

第6章基于线性判别分析(LDA)的说话人特征变换
6.1LDA变换与PCA变换的联系与区别
6.1.1LDA转换公式与PCA转换公式
6.1.2LDA变换和PCA变换的原理的比较
6.1.3用LDA对说话人特征进行变换
6.2LDA特征变换
6.2.1基于LDA特征变换的说话人鉴别系统
6.2.2实验结果分析
6.2.3结论
6.3基准系统、全局PCA变换与LDA变换的比较
6.3.1可扩充性比较
6.3.2识别性能比较
6.4小结
参考文献

第7章基于轨线模型的说话人特征时序性发掘
7.1基于段模型的说话人特征时序性发掘
7.1.1段模型
7.1.2段模型在语音识别中的应用
7.1.3说话人特征时序性发掘方法
7.1.4时序性发掘实验
7.2基于TrendedHlMM的文本相关说话人识别
7.2.1TrendedHMM
7.2.2TrendedH1VIM在语音识别中的应用
7.2.3文本相关的说话人识别
7.2.4TrendedHMM与VIV
7.2.5TrendedHMM优缺点
7.3小结
参考文献

第三篇识别模型
第8章基于支持向量机的识别模型
8.1研究意义
8.2支持向量的区域描述
8.2.1闭集与开集
8.2.2支持向量的区域描述
8.2.3说话人辨认
8.3支持向量机的概率输出
8.3.1概率
8.3.2支持向量机的概率输出
8.3.3内嵌支持向量机(SVM)的隐马尔可夫模型(HMM)
8.3.4支持向量机(SVM)与高斯混合模型((3MM)的混合模型
8.4基于向量量化(VQ)模型的核方法
8.5基于GMM模型的核方法
8.6多SVM混合模型
8.7小结
参考文献

第9章基于动态贝叶斯网络的识别模型
9.1动态贝叶斯网络
9.1.1表达
9.1.2推导
9.1.3学习
9.1.4结论
9.2基于动态贝叶斯网络(DBN)的说话人识别
9.2.1基于动态贝叶斯网络的识别框架
9.2.2实验和讨论
9.3小结
参考文献

第10章基于主成分分析分类器的说话人识别
10.1说话人分类常用算法的局限性
10.2主成分分析分类原理
10.2.1主成分分析的递归定义
10.2.2主成分分析的分类依据
10.3两种主成分分析分类器及其决策融合
10.3.1基于主成分子空间的分类器
10.3.2基于截断误差子空间的分类器
10.3.3两种主成分分析分类器的决策融合
10.4主成分分析分类器应用于说话人鉴别
内容简介:
　　说话人识别是根据语音波形中反映说话人生理和行为的特征的语音参数，自动识别说话人身份的技术。本书作者结合多年的科研丁作，分5个部分介绍了说话人识别的基本概念、方法以及最新研究进展。第1部分概括介绍说话人识别的主要概念、基本原理、研究历史与现状，以及测试语料库的构建；第2部分介绍作者对特征提取提出的不同改进方法，包括特征组合与特征变换；第3部分是作者提出的新的说话人识别模型，包括支持向量机、动态贝叶斯网络、主成分分析；第4部分介绍作者在基于信息融合的说话人识别上的创新工作；第5部分介绍作者开发的一个软件平台及其基础上的两个具体应用系统，最后是全书总结并展望发展趋势。
　　本书可供信息工程、电子工程、计算机科学与技术、公安、军事侦察等领域的科技工作者参考，也可以作为高等院校信号与信息处理、通信与电子系统、模式识别、生物医学等学科专业的研究生或高年级本科生的教学参考书。
目录:
第一篇绪论
第1章背景与概述
1.1研究背景及意义
1.1.1说话人识别介绍
1.1.2说话人识别的优势与应用前景
1.2研究进展与趋势
1.2.1研究历史
1.2.2研究现状
1.2.3发展趋势
1.2.4存在的问题
1.3本书结构
参考文献

第2章技术基础与理论
2.1背景知识
2.2说话人识别系统结构
2.3特征提取
2.3.1预处理
2.3.2美尔倒谱特征
2.3.3线性预测系数
2.3.4Delta特征和Delta_Dclta特征的计算
2.3.5声门特征
2.4说话人识别模型
2.4.1高斯混合模型
2.4.2隐马尔可夫模型
2.4.3动态时间规整模型
2.4.4向量量化模型，
2.5得分规整
2.6系统性能评价
2.6.1评价指标
2.6.2性能与用户规模的关系
2.6.3实际使用要求
2.7小结
参考文献

第3章说话人识别语料库
3.1常用语料库
3.2面向移动互联环境的说话人识别语料库(SRMC)
3.2.1SRMC的设计思路
3.2.2SRMC录音方案
3.2.3SRMC录音内容
3.2.4SRMC存储与标注
3.3电话语音库(PHONE)
3.4多模态说话人识别库
3.5NOISEX-92数据库
3.6小结
参考文献

第二篇特征提取
第4章说话人特征分析与优化
4.1特征性能分析
4.1.1阶数的影响
4.1.2帧长的影响
4.1.3结论
4.2特征参数优化
4.2.1语音包络检测
4.2.2包络最小长度限制
4.2.3预加重参数选取
4.2.4语音起始点的去除
4.2.5Delta特征的引入
4.2.6训练音长度的影响
4.2.7结论
4.3特征组合
4.3.1单一特征组合
4.3.2不同特征组合(小规模用户)
4.3.3不同特征组合(中等规模用户)
4.4二次特征提取
4.5小结
参考文献

第5章基于主成分分析(PCA)的说话人特征变换
5.1高维说话人特征的缺陷
5.2说话人特征与PCA变换
5.2.1说话人特征
5.2.2PCA变换的流程与效果
5.2.3说话人特征的PCA变换
5.3PCA特征变换应用于说话人鉴别
5.3.1传统的说话人鉴别系统
5.3.2基于PCA特征变换的可行性
5.4局部PCA特征变换
5.4.1基于局部PCA特征变换的说话人鉴别系统
5.4.2实验结果分析
5.4.3结论
5.5全局PCA特征变换
5.5.1基于全局PCA特征变换的说话人鉴别系统
5.5.2实验结果分析
5.5.3结论
5.6基准系统、局部PCA变换与全局PCA变换的比较
5.6.1可扩充性比较
5.6.2识别性能比较
5.7小结
参考文献

第6章基于线性判别分析(LDA)的说话人特征变换
6.1LDA变换与PCA变换的联系与区别
6.1.1LDA转换公式与PCA转换公式
6.1.2LDA变换和PCA变换的原理的比较
6.1.3用LDA对说话人特征进行变换
6.2LDA特征变换
6.2.1基于LDA特征变换的说话人鉴别系统
6.2.2实验结果分析
6.2.3结论
6.3基准系统、全局PCA变换与LDA变换的比较
6.3.1可扩充性比较
6.3.2识别性能比较
6.4小结
参考文献

第7章基于轨线模型的说话人特征时序性发掘
7.1基于段模型的说话人特征时序性发掘
7.1.1段模型
7.1.2段模型在语音识别中的应用
7.1.3说话人特征时序性发掘方法
7.1.4时序性发掘实验
7.2基于TrendedHlMM的文本相关说话人识别
7.2.1TrendedHMM
7.2.2TrendedH1VIM在语音识别中的应用
7.2.3文本相关的说话人识别
7.2.4TrendedHMM与VIV
7.2.5TrendedHMM优缺点
7.3小结
参考文献

第三篇识别模型
第8章基于支持向量机的识别模型
8.1研究意义
8.2支持向量的区域描述
8.2.1闭集与开集
8.2.2支持向量的区域描述
8.2.3说话人辨认
8.3支持向量机的概率输出
8.3.1概率
8.3.2支持向量机的概率输出
8.3.3内嵌支持向量机(SVM)的隐马尔可夫模型(HMM)
8.3.4支持向量机(SVM)与高斯混合模型((3MM)的混合模型
8.4基于向量量化(VQ)模型的核方法
8.5基于GMM模型的核方法
8.6多SVM混合模型
8.7小结
参考文献

第9章基于动态贝叶斯网络的识别模型
9.1动态贝叶斯网络
9.1.1表达
9.1.2推导
9.1.3学习
9.1.4结论
9.2基于动态贝叶斯网络(DBN)的说话人识别
9.2.1基于动态贝叶斯网络的识别框架
9.2.2实验和讨论
9.3小结
参考文献

第10章基于主成分分析分类器的说话人识别
10.1说话人分类常用算法的局限性
10.2主成分分析分类原理
10.2.1主成分分析的递归定义
10.2.2主成分分析的分类依据
10.3两种主成分分析分类器及其决策融合
10.3.1基于主成分子空间的分类器
10.3.2基于截断误差子空间的分类器
10.3.3两种主成分分析分类器的决策融合
10.4主成分分析分类器应用于说话人鉴别

查看详情

相关分类

计算机理论编程与开发操作系统大数据与云计算图形图像/多媒体网站设计与网页开发网络与通讯硬件、嵌入式开发办公软件信息安全辅助设计与工程计算软件工程/开发项目管理

说话人识别模型与方法正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

新起点书店

北京市海淀区

平均发货23小时成功完成率89.86%

￥31.53

券

100减20

立即购买加入购物车
说话人识别模型与方法正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

图书-天下的书店

北京市东城区

平均发货25小时成功完成率89.19%

￥31.56

券

100减20

立即购买加入购物车
说话人识别模型与方法（中国计算机学会学术著作丛书）【正版九新】九品消毒塑封

九五品

文渊文化传媒

天津市宝坻区

平均发货15小时成功完成率90.36%

￥19.70

券

100减20

立即购买加入购物车不属于本条目
3

说话人识别模型与方法

九品

江南之路

江苏省徐州市

平均发货4小时成功完成率97.55%

￥48.00

券

100减20

立即购买加入购物车
说话人识别模型与方法正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

旧书香书城

北京市昌平区

平均发货23小时成功完成率88.75%

￥31.10

券

100减20

立即购买加入购物车
说话人识别模型与方法（中国计算机学会学术著作丛书）书籍均为精品二手图书品相85品以上，出库会经过高温消毒，书籍上架都会检测可保证正版!!

九品

粤读二手书店

天津市宝坻区

平均发货14小时成功完成率95.96%

￥13.70

券

100减20

立即购买加入购物车不属于本条目
12

说话人识别模型与方法无划线

八五品

玖玖书店

重庆市沙坪坝区

平均发货9小时成功完成率95.79%

￥6.00

券

100减20

立即购买加入购物车
说话人识别模型与方法

九五品

鲁是特

天津市武清区

平均发货31小时成功完成率87.75%

￥22.10

券

100减20

立即购买加入购物车不属于本条目
4

说话人识别模型与方法

八品

三瑞特价书店

江西省萍乡市

平均发货11小时成功完成率98.13%

￥18.00

券

100减20

立即购买加入购物车不属于本条目
17

说话人识别模型与方法

八品

谁逐风流的书摊

山东省烟台市

平均发货14小时成功完成率92.86%

￥8.00

券

100减20

立即购买加入购物车
说话人识别模型与方法【正版有货可开发票；库存情况请咨询，及标题与图片不一致时】

全新

心流图书

广东省广州市

平均发货10小时成功完成率89.26%

￥53.00

券

100减20

立即购买加入购物车不属于本条目
说话人识别模型与方法【正版有货可开发票；标题与图片不一致时,请质询】

全新

一叶知秋语的书店

广东省广州市

平均发货9小时成功完成率90.27%

￥57.00

券

100减20

立即购买加入购物车不属于本条目
7

说话人识别模型与方法

九品

淮阳县静文书屋

河南省周口市

平均发货7小时成功完成率98.12%

￥26.00

券

100减20

立即购买加入购物车
5

说话人识别模型与方法

九品

淡墨书屋

北京市大兴区

平均发货11小时成功完成率92.74%

￥25.00

券

100减20

立即购买加入购物车
2

说话人识别模型与方法

九五品

白茶清欢

上海市黄浦区

平均发货17小时成功完成率86.74%

￥25.00

券

100减20

立即购买加入购物车
5

说话人识别模型与方法

九品

杭州润博书店

浙江省嘉兴市

平均发货6小时成功完成率96.93%

￥48.00

券

100减20

立即购买加入购物车不属于本条目
6

说话人识别模型与方法

九品

深夜书店

北京市昌平区

平均发货7小时成功完成率97.67%

￥40.00

券

100减20

立即购买加入购物车
24

说话人识别模型与方法

七五品

知闻书屋

陕西省西安市

平均发货13小时成功完成率97.72%

￥30.00

券

100减20

立即购买加入购物车
4

说话人识别模型与方法

九品

祥福森商號

河南省郑州市

平均发货4小时成功完成率96.22%

￥49.00

券

100减20

立即购买加入购物车
4

说话人识别模型与方法（一版一印）正版，假一罚十，内页有少量划线

八五品

南京闻讯旧书店

江苏省南京市

平均发货4小时成功完成率97.23%

￥80.00

券

100减20

立即购买加入购物车
12

说话人识别模型与方法

九品

大爽爽的书摊的书店

天津市南开区

平均发货13小时成功完成率95.44%

￥8.00

券

100减20

立即购买加入购物车
5

说话人识别模型与方法 9787302189688

九品

知音知到

山西省运城市

平均发货5小时成功完成率97.8%

￥48.00

券

100减20

立即购买加入购物车不属于本条目
5

说话人识别模型与方法 9787302189688

九品

古月楼阁的书店

北京市房山区

平均发货11小时成功完成率88.51%

￥25.00

券

100减20

立即购买加入购物车不属于本条目
说话人识别模型与方法

八五品

易书云

湖南省湘潭市

平均发货9小时成功完成率94.94%

￥21.28

券

100减20

立即购买加入购物车
【9成新】说话人识别模型与方法（中国计算机学会学术著作丛书） 9品书籍大部分没有笔迹少量轻微笔迹。配件和光盘不包

九品

卓悦书店的书店

江苏省盐城市

平均发货17小时成功完成率93.42%

￥18.07

券

100减20

立即购买加入购物车不属于本条目
5

说话人识别模型与方法 9787302189688

九品

梅鸣梓的书店

北京市房山区

平均发货12小时成功完成率88.54%

￥25.00

券

100减20

立即购买加入购物车不属于本条目
说话人识别模型与方法（中国计算机学会学术著作丛书）正版旧书，高温消毒，如有套装图片默认为单本，可咨询客服

九五品

一嘉书店

天津市宝坻区

平均发货16小时成功完成率57.41%

￥14.62

券

100减20

立即购买加入购物车不属于本条目
说话人识别模型与方法批量上架图书只有1本不是套装

八五品

久居家书店

北京市东城区

平均发货11小时成功完成率83.29%

￥12.90

券

100减20

立即购买加入购物车
说话人识别模型与方法（中国计算机学会学术著作丛书）正版旧书，高温消毒，如有套装图片默认为单本，可咨询客服

九五品

轩轩豆豆的书店

天津市宝坻区

平均发货3小时成功完成率100%

￥14.63

券

100减20

立即购买加入购物车不属于本条目
说话人识别模型与方法（中国计算机学会学术著作丛书）正版旧书，高温消毒，如有套装图片默认为单本，可咨询客服

九五品

转转的图书店

天津市宝坻区

平均发货15小时成功完成率61.11%

￥14.62

券

100减20

立即购买加入购物车不属于本条目
说话人识别模型与方法

全新

琴扬书店

湖北省武汉市

平均发货15小时成功完成率80.78%

￥153.00

券

100减20

立即购买加入购物车