智能语音处理

智能语音处理

分享

作者: 张雄伟著 , 孙蒙著 , 杨吉斌著

出版社: 机械工业出版社

出版时间: 2020-09

版次: 1

ISBN: 9787111665328

定价: 79.00

装帧: 平装

开本: 16开

纸张: 胶版纸

页数: 248页

分类: 计算机与互联网

15人买过

本书系统性地阐述智能语音处理技术，并重点以机器学习等技术及其在语音处理中的典型应用，理论与实践联系紧密。前言

第1章智能语音处理导论1

11 概述1

12 经典语音处理2

   121 语音处理的发展2

   122 语音基本表示方法3

   123 语音处理基本方法3

   124 经典语音处理方法的不足4

13 智能语音处理5

   131 智能语音处理的基本概念5

   132 智能语音处理的基本框架5

   133 智能语音处理的基本模型6

14 语音处理的应用7

   141 语音处理的传统应用领域8

   142 语音处理的新应用领域11

15 小结14

参考文献14

第2章稀疏和压缩感知15

21 引言15

22 稀疏和稀疏表示16

   221 稀疏16

   222 稀疏表示18

23 冗余字典19

   231 基本概念19

   232 字典学习20

   233 字典学习算法22

   234 原子选择算法25

24 压缩感知27

   241 基本概念27

   242 压缩感知模型29

   243 观测矩阵30

   244 信号重构32

25 小结33

参考文献33

第3章隐变量模型36

31 引言36

32 高斯混合模型36

   321 基本概念37

   322 GMM参数估计37

33 隐马尔可夫模型39

   331 基本概念39

   332 HMM关键问题42

34 高斯过程隐变量模型48

   341 基本模型48

   342 GPLVM的理论来源49

   343 GPLVM模型训练50

35 小结51

参考文献51

第4章组合模型52

41 引言52

42 主成分分析53

   421 基本模型53

   422 求解算法54

43 非负矩阵分解56

   431 基本模型56

   432 求解算法57

   433 NMF与其他数据表示模型的关系58

44 鲁棒组合模型60

   441 组合模型的鲁棒性分析61

   442 鲁棒主成分分析61

   443 鲁棒非负矩阵分解63

45 小结64

参考文献64

第5章人工神经网络和深度学习65

51 引言65

52 神经网络基础66

   521 神经元模型66

   522 浅层神经网络67

   523 深度神经网络68

53 深度学习69

   531 基本概念和形式69

   532 深度网络的学习方法70

54 深度神经网络的典型结构71

   541 深度置信网络71

   542 自动编码器与栈式自动编码器72

   543 卷积神经网络74

   544 循环神经网络75

   545 生成式对抗网络77

55 小结79

参考文献79

第6章语音压缩编码81

61 引言81

62 基于字典学习的语音信号压缩感知82

   621 语音信号的稀疏性82

   622 语音在常见变换域的稀疏化83

   623 基于K-L展开的语音非相干字典84

   624 基于K-L非相干字典的语音压缩重构87

   625 实验仿真与性能分析88

63 基于梅尔倒谱系数重构的语音压缩编码93

   631 基于梅尔倒谱分析的抗噪语音编码模型94

   632 基于稀疏约束的梅尔倒谱合成96

   633 梅尔倒谱系数的量化算法99

   634 实验仿真与性能分析103

64 基于深度学习的语音压缩编码107

   641 基于DAE的幅度谱编码和量化107

   642 基于DAE的低速率语音编码110

   643 实验仿真与性能分析111

65 小结113

参考文献113

第7章语音增强115

71 引言115

72 语音增强技术基础116

   721 语音增强的估计参数116

   722 智能语音增强的语音特征117

   723 性能评价118

73 基于非负矩阵分解的语音增强120

   731 基本模型121

   732 基于不相交约束非负矩阵分解的语音增强122

   733 基于CNMF字典学习的语音增强127

74 基于深度学习的语音增强136

   741 基于听觉感知加权的深度神经网络语音增强方法136

   742 基于听觉感知掩蔽的深度神经网络语音增强方法141

75 小结151

参考文献152

第8章语音转换155

81 引言155

82 语音转换基本原理155

83 语音转换模型与评价156

   831 语音分析/合成模型156

   832 语音参数的选择157

   833 时间对齐157

   834 转换模型和规则158

   835 转换性能评价159

84 基于非负矩阵分解的谱转换160

   841 概述160

   842 基于卷积非负矩阵分解的谱转换161

   843 声道谱转换效果164

85 基于深度神经网络的谱转换168

   851 深度学习驱动下的语音转换168

   852 面向谱转换的神经网络模型选择168

   853 基于BLSTM和神经网络声码器交替训练的语音转换171

86 小结176

参考文献176

第9章说话人识别178

91 引言178

92 说话人识别基础179

   921 说话人识别系统框架179

   922 典型的说话人识别模型180

93 基于i-vector的说话人识别及其改进181

   931 基于i-vector的说话人识别概述181

   932 用于提高i-vector鲁棒性的帧加权方法182

   933 实验结果与分析187

94 基于深度神经网络的说话人识别187

   941 基于深度神经网络的说话人识别概述187

   942 基于对比度损失函数优化说话人矢量189

   943 实验结果与分析191

95 说话人识别系统的攻击与防御192

   951 攻击和防御的背景192

   952 说话人识别系统的攻击方法192

   953 说话人识别攻击的检测方法194

   954 实验结果与分析196

96 小结196

参考文献197

第10章骨导语音增强200

101 引言200

102 骨导语音增强基础201

    1021 骨导语音的产生与特性201

    1022 骨导语音盲增强的特点202

    1023 骨导语音盲增强的典型方法203

103 基于长短时记忆网络的骨导语音盲增强205

    1031 骨导/气导语音的谱映射206

    1032 基于深度残差BLSTM的骨导语音盲增强方法207

    1033 实验仿真及性能分析211

104 基于均衡-生成组合谱映射的骨导语音盲增强215

    1041 均衡法215

    1042 基于均衡-生成组合谱映射的骨导语音盲增强方法216

    1043 实验仿真及性能分析218

105 小结222

参考文献223

第11章智能语音处理展望224

111 智能语音处理的未来224

112 有待解决的关键技术225

    1121 语音识别226

    1122 语音合成228

    1123 语音增强229

    1124 语音处理中的安全问题230

113 小结230

参考文献230

缩略语232
内容简介:
本书系统性地阐述智能语音处理技术，并重点以机器学习等技术及其在语音处理中的典型应用，理论与实践联系紧密。
目录:
前言

第1章智能语音处理导论1

11 概述1

12 经典语音处理2

   121 语音处理的发展2

   122 语音基本表示方法3

   123 语音处理基本方法3

   124 经典语音处理方法的不足4

13 智能语音处理5

   131 智能语音处理的基本概念5

   132 智能语音处理的基本框架5

   133 智能语音处理的基本模型6

14 语音处理的应用7

   141 语音处理的传统应用领域8

   142 语音处理的新应用领域11

15 小结14

参考文献14

第2章稀疏和压缩感知15

21 引言15

22 稀疏和稀疏表示16

   221 稀疏16

   222 稀疏表示18

23 冗余字典19

   231 基本概念19

   232 字典学习20

   233 字典学习算法22

   234 原子选择算法25

24 压缩感知27

   241 基本概念27

   242 压缩感知模型29

   243 观测矩阵30

   244 信号重构32

25 小结33

参考文献33

第3章隐变量模型36

31 引言36

32 高斯混合模型36

   321 基本概念37

   322 GMM参数估计37

33 隐马尔可夫模型39

   331 基本概念39

   332 HMM关键问题42

34 高斯过程隐变量模型48

   341 基本模型48

   342 GPLVM的理论来源49

   343 GPLVM模型训练50

35 小结51

参考文献51

第4章组合模型52

41 引言52

42 主成分分析53

   421 基本模型53

   422 求解算法54

43 非负矩阵分解56

   431 基本模型56

   432 求解算法57

   433 NMF与其他数据表示模型的关系58

44 鲁棒组合模型60

   441 组合模型的鲁棒性分析61

   442 鲁棒主成分分析61

   443 鲁棒非负矩阵分解63

45 小结64

参考文献64

第5章人工神经网络和深度学习65

51 引言65

52 神经网络基础66

   521 神经元模型66

   522 浅层神经网络67

   523 深度神经网络68

53 深度学习69

   531 基本概念和形式69

   532 深度网络的学习方法70

54 深度神经网络的典型结构71

   541 深度置信网络71

   542 自动编码器与栈式自动编码器72

   543 卷积神经网络74

   544 循环神经网络75

   545 生成式对抗网络77

55 小结79

参考文献79

第6章语音压缩编码81

61 引言81

62 基于字典学习的语音信号压缩感知82

   621 语音信号的稀疏性82

   622 语音在常见变换域的稀疏化83

   623 基于K-L展开的语音非相干字典84

   624 基于K-L非相干字典的语音压缩重构87

   625 实验仿真与性能分析88

63 基于梅尔倒谱系数重构的语音压缩编码93

   631 基于梅尔倒谱分析的抗噪语音编码模型94

   632 基于稀疏约束的梅尔倒谱合成96

   633 梅尔倒谱系数的量化算法99

   634 实验仿真与性能分析103

64 基于深度学习的语音压缩编码107

   641 基于DAE的幅度谱编码和量化107

   642 基于DAE的低速率语音编码110

   643 实验仿真与性能分析111

65 小结113

参考文献113

第7章语音增强115

71 引言115

72 语音增强技术基础116

   721 语音增强的估计参数116

   722 智能语音增强的语音特征117

   723 性能评价118

73 基于非负矩阵分解的语音增强120

   731 基本模型121

   732 基于不相交约束非负矩阵分解的语音增强122

   733 基于CNMF字典学习的语音增强127

74 基于深度学习的语音增强136

   741 基于听觉感知加权的深度神经网络语音增强方法136

   742 基于听觉感知掩蔽的深度神经网络语音增强方法141

75 小结151

参考文献152

第8章语音转换155

81 引言155

82 语音转换基本原理155

83 语音转换模型与评价156

   831 语音分析/合成模型156

   832 语音参数的选择157

   833 时间对齐157

   834 转换模型和规则158

   835 转换性能评价159

84 基于非负矩阵分解的谱转换160

   841 概述160

   842 基于卷积非负矩阵分解的谱转换161

   843 声道谱转换效果164

85 基于深度神经网络的谱转换168

   851 深度学习驱动下的语音转换168

   852 面向谱转换的神经网络模型选择168

   853 基于BLSTM和神经网络声码器交替训练的语音转换171

86 小结176

参考文献176

第9章说话人识别178

91 引言178

92 说话人识别基础179

   921 说话人识别系统框架179

   922 典型的说话人识别模型180

93 基于i-vector的说话人识别及其改进181

   931 基于i-vector的说话人识别概述181

   932 用于提高i-vector鲁棒性的帧加权方法182

   933 实验结果与分析187

94 基于深度神经网络的说话人识别187

   941 基于深度神经网络的说话人识别概述187

   942 基于对比度损失函数优化说话人矢量189

   943 实验结果与分析191

95 说话人识别系统的攻击与防御192

   951 攻击和防御的背景192

   952 说话人识别系统的攻击方法192

   953 说话人识别攻击的检测方法194

   954 实验结果与分析196

96 小结196

参考文献197

第10章骨导语音增强200

101 引言200

102 骨导语音增强基础201

    1021 骨导语音的产生与特性201

    1022 骨导语音盲增强的特点202

    1023 骨导语音盲增强的典型方法203

103 基于长短时记忆网络的骨导语音盲增强205

    1031 骨导/气导语音的谱映射206

    1032 基于深度残差BLSTM的骨导语音盲增强方法207

    1033 实验仿真及性能分析211

104 基于均衡-生成组合谱映射的骨导语音盲增强215

    1041 均衡法215

    1042 基于均衡-生成组合谱映射的骨导语音盲增强方法216

    1043 实验仿真及性能分析218

105 小结222

参考文献223

第11章智能语音处理展望224

111 智能语音处理的未来224

112 有待解决的关键技术225

    1121 语音识别226

    1122 语音合成228

    1123 语音增强229

    1124 语音处理中的安全问题230

113 小结230

参考文献230

缩略语232

查看详情

相关分类

计算机理论编程与开发操作系统大数据与云计算图形图像/多媒体网站设计与网页开发网络与通讯硬件、嵌入式开发办公软件信息安全辅助设计与工程计算软件工程/开发项目管理

智能语音处理正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

图书-天下的书店

北京市东城区

平均发货25小时成功完成率89.25%

￥22.45

券

100减20

立即购买加入购物车
智能语音处理正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

新起点书店

北京市海淀区

平均发货23小时成功完成率89.81%

￥22.53

券

100减20

立即购买加入购物车
智能语音处理/智能科学与技术丛书全新正版极速发货

全新

谢岳书店

广东省广州市

平均发货17小时成功完成率94.8%

￥53.94

券

100减20

立即购买加入购物车不属于本条目
智能语音处理/智能科学与技术丛书全新正版极速发货

全新

大智慧小美丽

广东省广州市

平均发货17小时成功完成率93.32%

￥53.94

券

100减20

立即购买加入购物车不属于本条目
智能语音处理/智能科学与技术丛书 9787111665328 全新正版可开票支持7天无理由，不清楚的请咨询客服。

全新

倒爷图书专营店

浙江省嘉兴市

平均发货13小时成功完成率94.89%

￥58.64

券

100减20

立即购买加入购物车不属于本条目
智能语音处理/智能科学与技术丛书全新正版极速发货

全新

书香美美

广东省广州市

平均发货16小时成功完成率92.26%

￥53.94

券

100减20

立即购买加入购物车不属于本条目
全新正版智能语音处理/智能科学与技术丛书张雄伟 9787111665328 机械工业出版社本店所售图书，保证正版新书，有个别图片和实书封面不一样，以实书封面为准，最快当天，一般隔天发货。支持7天无理由退换货.开票联系客服

全新

剡溪书局

北京市西城区

平均发货16小时成功完成率92.03%

￥59.21

券

100减20

立即购买加入购物车不属于本条目
智能语音处理/智能科学与技术丛书正版图书，可开发票，请放心购买。

全新

淘书宝店

广东省广州市

平均发货7小时成功完成率93.75%

￥64.65

券

100减20

立即购买加入购物车不属于本条目
智能语音处理/智能科学与技术丛书普通图书/教材教辅/教材/大学教材/计算机与互联网张雄伟机械工业出版社 9787111665328 新华书店全新正版书籍图书保证_可开发票_极速发货支持7天无理由

全新

學源图书专营店

浙江省嘉兴市

平均发货9小时成功完成率95.57%

￥59.60

券

100减20

立即购买加入购物车不属于本条目
智能语音处理/智能科学与技术丛书 9787111665328 张雄伟机械工业出版社当天发货，全新正版书。

全新

白湘云书社

北京市通州区

平均发货9小时成功完成率89.53%

￥65.10

券

100减20

立即购买加入购物车不属于本条目
智能语音处理正版现货，品相完整，套书只发一本,多版面书籍只对书名

九品

旧书香书城

北京市昌平区

平均发货23小时成功完成率88.61%

￥22.00

券

100减20

立即购买加入购物车
智能语音处理下午5点前订单，当日发货！超时赔付

九五品

才华有限

四川省成都市

平均发货10小时成功完成率94.52%

￥10.35

券

100减20

立即购买加入购物车
智能语音处理

九五品

智愚图书

湖南省长沙市

平均发货10小时成功完成率94.98%

￥23.30

券

100减20

立即购买加入购物车
智能语音处理张雄伟孙蒙杨吉斌机械工业出版社 9787111665328

八五品

旧书云旗舰店

四川省成都市

平均发货8小时成功完成率93.64%

￥16.29

券

100减20

立即购买加入购物车不属于本条目
3

智能语音处理

八五品

江城凯文书店

湖北省武汉市

平均发货5小时成功完成率96.69%

￥10.00

券

100减20

立即购买加入购物车
智能语音处理全新正版未拆封

全新

天吾之青豆的书店

山东省济宁市

平均发货53小时成功完成率83.32%

￥32.98

券

100减20

立即购买加入购物车
智能语音处理张雄伟, 孙蒙, 杨吉斌

八品

星辰二手书的书店

河南省郑州市

平均发货9小时成功完成率95.51%

￥17.40

券

100减20

立即购买加入购物车不属于本条目
智能语音处理全新正版快速发货

全新

星尘大海书店

天津市河北区

平均发货25小时成功完成率78.71%

￥37.12

券

100减20

立即购买加入购物车
特价现货！智能语音处理张雄伟孙蒙杨吉斌著9787111665328机械工业出版社买书，就上二手书海旗舰店，清仓处理，真实库存，特价正版，收藏店铺，优先发货! ps：下午三点之前的订单当天发货，之后明天发货，特殊情况除外。

八五品

书嗨图书旗舰店

河南省鹤壁市

平均发货9小时成功完成率96.44%

￥11.82

券

100减20

立即购买加入购物车不属于本条目
智能语音处理

八五品

智愚图书

湖南省长沙市

平均发货10小时成功完成率94.98%

￥18.30

券

100减20

立即购买加入购物车
智能语音处理全新正版图书

全新

兴文书店

北京市海淀区

平均发货16小时成功完成率88.43%

￥59.85

券

100减20

立即购买加入购物车不属于本条目
4

智能语音处理

九五品

二龙轩书屋

河北省保定市

平均发货7小时成功完成率91.16%

￥13.00

券

100减20

立即购买加入购物车
智能语音处理塑封消毒，正版

九品

福宝书店

北京市丰台区

平均发货14小时成功完成率93.09%

￥16.10

券

100减20

立即购买加入购物车
智能语音处理买书，就上二手书海官方企业店，清仓处理，真实库存，特价正版，收藏店铺，优先发货! ps：下午三点之前的订单当天发货，之后明天发货，特殊情况除外。

八五品

二手书海官方企业店

河南省鹤壁市

平均发货10小时成功完成率96.35%

￥15.90

券

100减20

立即购买加入购物车
智能语音处理本店书籍，保证正版，多仓库发货，欢迎选购

八五品

再回首书店

重庆市沙坪坝区

平均发货9小时成功完成率90.59%

￥22.91

券

100减20

立即购买加入购物车
智能语音处理

八五品

重庆沙坪坝区星月书店

重庆市沙坪坝区

平均发货9小时成功完成率87.39%

￥28.00

券

100减20

立即购买加入购物车
3

智能语音处理全新正版现货

全新

天涯淘书阁

四川省成都市

平均发货22小时成功完成率91.19%

￥57.00

券

100减20

立即购买加入购物车不属于本条目
4

智能语音处理详情看图

九品

保龙书店

北京市海淀区

平均发货12小时成功完成率97.22%

￥30.00

券

100减20

立即购买加入购物车
4

智能语音处理页内干净新

九品

依依书店

北京市通州区

平均发货6小时成功完成率96.72%

￥30.00

券

100减20

立即购买加入购物车
【假一罚四】智能语音处理/智能科学与技术丛书张雄伟集团直发，全新正版书籍，假一罚四，放心选购。24小时内发货。可开发票

全新

朗朗图书书店

浙江省嘉兴市

平均发货10小时成功完成率92.99%

￥62.50

券

100减20

立即购买加入购物车不属于本条目
智能语音处理

八五品

橙亦二手书城

湖北省咸宁市

平均发货17小时成功完成率94.61%

￥6.40

券

100减20

立即购买加入购物车
智能语音处理

全新

钰唐佳轩

北京市丰台区

平均发货9小时成功完成率86.1%

￥31.60

券

100减20

立即购买加入购物车
智能语音处理

八品

环球书仓

湖南省长沙市

平均发货23小时成功完成率58.33%

￥10.70

券

100减20

立即购买加入购物车
智能语音处理张雄伟孙蒙杨吉斌智能语音处理技术机器学习等技术及其在语音处理中的典型应用机械工业出版社图书籍 9787111665328

全新

凯旋金融中心书店

江西省吉安市

平均发货47小时成功完成率85.17%

￥81.88

券

100减20

立即购买加入购物车不属于本条目
智能语音处理

九五品

伴我侗行

江苏省南京市

平均发货20小时成功完成率81.18%

￥19.00

券

100减20

立即购买加入购物车不属于本条目
智能语音处理正版消毒；订单正常3点发；套装书咨询下单，否则单本发货

九五品

夏鸣声的书店

山东省枣庄市

平均发货12小时成功完成率72.88%

￥16.92

券

100减20

立即购买加入购物车不属于本条目
智能语音处理张雄伟孙蒙杨吉斌智能语音处理技术机器学习等技术及其在语音处理中的典型应用机械工业出版社图书籍 9787111665328

全新

井大书店

江西省吉安市

平均发货55小时成功完成率84.3%

￥81.88

券

100减20

立即购买加入购物车不属于本条目
智能语音处理

九五品

ediboi的书摊

浙江省杭州市

平均发货22小时成功完成率100%

￥15.00

券

100减20

立即购买加入购物车