人与机器听觉:听见声音的意义

人与机器听觉:听见声音的意义
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] (Richard F.Lyon) , ,
2021-08
版次: 1
ISBN: 9787111684534
定价: 169.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 415页
  •   《人与机器听觉:听见声音的意义》由谷歌首席科学家Lyon撰写,是一部关于听觉研究的系统性学术著作。
      《人与机器听觉:听见声音的意义》中提出利用CARFAC模型模拟耳蜗对声音信号的分析,利用带有精细时序结构的SAI表征听觉神经模式,明确反对将耳蜗视作傅里叶频率分析器的做法。
      《人与机器听觉:听见声音的意义》内容系统且全面,涵盖人类听觉原理、机器听觉理论、精密听觉模型建模和机器听觉应用实例,还包括对听觉研究史上的标志性人物及事例的介绍。
      《人与机器听觉:听见声音的意义》对数学原理的阐释脉络清晰,并配有算法源码,适合相关领域的技术人员和研究人员参考,也适合作为高等院校相关研究生课程的教材。
      《人与机器听觉:听见声音的意义》构建了一套完整的听觉理论框架,具有鲜明的学术观点和创作特色:
      创造性地提出利用CARFAC模型模拟耳蜗对声音信号的分析,利用带有精细时序结构的SAI表征听觉神经模式,强调将听觉模型引入机器听觉应用,反对将耳蜗视作傅里叶频率分析器的做法。
      将听觉系统划分为四层,在底层听觉过程模拟的基础上探索高层信息处理机制并验证模型的有效性,为远近场模型等问题的解决以及CASA等技术的落地提供理论支撑,同时拓展了研究思路。
      全面涵盖人类听觉原理、机器听觉理论、精密听觉模型建模方法以及利用机器学习方法构建的应用实例,不仅对研究现状进行了系统梳理,而且穿插着对听觉研究史上标志性人物和事例的介绍。
      对听觉问题的阐释直击本质,对相关数学表述及推导过程的讲解尤为清晰明了,无须复杂的专业知识也能逐步理解。此外,所有听觉处理算法均配有可免费下载的源代码,便于读者实践。   理查德・F.里昂(Richard F.Lyon),谷歌公司首席科学家,IEEE Fellow,ACM Fellow。他目前主要负责谷歌机器听觉方向的研发工作,其团队开发了用于谷歌街景的相机系统。他的研究兴趣包括用于声音分析及可视化的耳蜗模型和听觉相关谱图,以及这些模型的模拟电路及VLSI数字实现。在加入谷歌之前,他曾在施乐公司、斯伦贝谢公司和苹果公司从事相关研发工作。此外,他还拥有包括光电鼠标在内的58项美国发明专利授权。
      
      朱维彬,博士,北京交通大学信息科学研究所副教授,主要从事言语信息处理理论及应用研究,涉及语义的言语表现及计算、言语情感分析及建模。曾在IBM中国研究中心任研究员,从事语音声学模型、韵律建模和言语数据库的研究。
      
      高莹莹,博士,毕业于北京交通大学信息科学研究所,研究方向为言语情感生成建模。现就职于中国移动研究院人工智能与智慧运营中心,主要从事语音识别、端到端一体化建模的研究。 译者序
    序言
    前言
    关于作者

    第一部分 声音分析与表征概述
    第1章 引言
    1.1 DavidMarr论视觉与听觉
    1.2 自上而下与自下而上分析
    1.3 神经模拟方法
    1.4 听觉图像
    1.5 耳朵是频率分析器吗
    1.6 第三音
    1.7 声音理解与意义提取
    1.8 机器视觉与机器学习技术的利用
    1.9 本书的内容安排
    第2章 听觉理论
    2.1 一种“新”的听觉理论
    2.2 更新的听觉理论
    2.3 主动与非线性听觉理论
    2.4 听觉三元理论
    2.5 听觉图像理论
    第3章 对数及幂律听觉
    3.1 对数与幂律
    3.2 对数频率
    3.3 对数功率
    3.4 Bode图
    3.5 感知映射
    3.6 恒Q值分析
    3.7 对数应用注意事项
    第4章 人类听觉概述
    4.1 人机对比
    4.2 听觉生理学
    4.3 听觉中的关键问题
    4.4 响度
    4.5 临界频带、掩蔽与抑制
    4.6 音高感知
    4.7 音色
    4.8 协和与不协和
    4.9 语音感知
    4.10 双耳听觉
    4.11 听觉流
    4.12 非线性
    4.13 后续建议
    第5章 声学方法与听觉修正
    5.1 声音、语音与音乐建模
    5.2 短时谱分析
    5.3 谱的平滑与变换
    5.4 源一滤波器模型与同态信号处理
    5.5 摆脱对数
    5.6 听觉频率尺度
    5.7 mel频率倒谱
    5.8 线性预测编码
    5.9 PLP与RASTA
    5.10 自动语音识别中的听觉技术
    5.11 必要的改进

    第二部分 听觉的系统理论
    第6章 线性系统引言
    6.1 平滑:恰当的起点
    6.2 线性时不变系统
    6.3 滤波器与频率
    6.4 微分方程与齐次解
    6.5 冲激响应
    6.6 因果性与稳定性
    6.7 卷积
    6.8 本征函数与传递函数
    6.9 频率响应
    6.10 变换与运算方法
    6.11 有理函数及其零极点
    6.12 传递函数增益与相位的图解计算
    6.13 卷积定理
    6.14 级联、并联与反馈结构中滤波器的互联
    6.15 总结及后续安排
    第7章 离散时间与数字系统
    7.1 计算机模拟系统
    7.2 离散时间线性移不变系统
    7.3 冲激响应与卷积
    7.4 离散时间系统中的频率
    7.5 Z变换及其逆变换
    7.6 单位超前算子与单位延迟算子
    7.7 滤波器与传递函数
    7.8 采样与混叠
    7.9 自连续时间系统的映射
    7.10 滤波器设计
    7.11 数字滤波器
    7.12 多输入输出
    7.13 傅里叶分析与频谱图
    7.14 观点及拓展阅读
    第8章 谐振器
    ……

    第三部分 听觉外周
    第四部分 听神经系统
    第五部分 机器学习及应用

    中英文术语对照表
    参考文献
  • 内容简介:
      《人与机器听觉:听见声音的意义》由谷歌首席科学家Lyon撰写,是一部关于听觉研究的系统性学术著作。
      《人与机器听觉:听见声音的意义》中提出利用CARFAC模型模拟耳蜗对声音信号的分析,利用带有精细时序结构的SAI表征听觉神经模式,明确反对将耳蜗视作傅里叶频率分析器的做法。
      《人与机器听觉:听见声音的意义》内容系统且全面,涵盖人类听觉原理、机器听觉理论、精密听觉模型建模和机器听觉应用实例,还包括对听觉研究史上的标志性人物及事例的介绍。
      《人与机器听觉:听见声音的意义》对数学原理的阐释脉络清晰,并配有算法源码,适合相关领域的技术人员和研究人员参考,也适合作为高等院校相关研究生课程的教材。
      《人与机器听觉:听见声音的意义》构建了一套完整的听觉理论框架,具有鲜明的学术观点和创作特色:
      创造性地提出利用CARFAC模型模拟耳蜗对声音信号的分析,利用带有精细时序结构的SAI表征听觉神经模式,强调将听觉模型引入机器听觉应用,反对将耳蜗视作傅里叶频率分析器的做法。
      将听觉系统划分为四层,在底层听觉过程模拟的基础上探索高层信息处理机制并验证模型的有效性,为远近场模型等问题的解决以及CASA等技术的落地提供理论支撑,同时拓展了研究思路。
      全面涵盖人类听觉原理、机器听觉理论、精密听觉模型建模方法以及利用机器学习方法构建的应用实例,不仅对研究现状进行了系统梳理,而且穿插着对听觉研究史上标志性人物和事例的介绍。
      对听觉问题的阐释直击本质,对相关数学表述及推导过程的讲解尤为清晰明了,无须复杂的专业知识也能逐步理解。此外,所有听觉处理算法均配有可免费下载的源代码,便于读者实践。
  • 作者简介:
      理查德・F.里昂(Richard F.Lyon),谷歌公司首席科学家,IEEE Fellow,ACM Fellow。他目前主要负责谷歌机器听觉方向的研发工作,其团队开发了用于谷歌街景的相机系统。他的研究兴趣包括用于声音分析及可视化的耳蜗模型和听觉相关谱图,以及这些模型的模拟电路及VLSI数字实现。在加入谷歌之前,他曾在施乐公司、斯伦贝谢公司和苹果公司从事相关研发工作。此外,他还拥有包括光电鼠标在内的58项美国发明专利授权。
      
      朱维彬,博士,北京交通大学信息科学研究所副教授,主要从事言语信息处理理论及应用研究,涉及语义的言语表现及计算、言语情感分析及建模。曾在IBM中国研究中心任研究员,从事语音声学模型、韵律建模和言语数据库的研究。
      
      高莹莹,博士,毕业于北京交通大学信息科学研究所,研究方向为言语情感生成建模。现就职于中国移动研究院人工智能与智慧运营中心,主要从事语音识别、端到端一体化建模的研究。
  • 目录:
    译者序
    序言
    前言
    关于作者

    第一部分 声音分析与表征概述
    第1章 引言
    1.1 DavidMarr论视觉与听觉
    1.2 自上而下与自下而上分析
    1.3 神经模拟方法
    1.4 听觉图像
    1.5 耳朵是频率分析器吗
    1.6 第三音
    1.7 声音理解与意义提取
    1.8 机器视觉与机器学习技术的利用
    1.9 本书的内容安排
    第2章 听觉理论
    2.1 一种“新”的听觉理论
    2.2 更新的听觉理论
    2.3 主动与非线性听觉理论
    2.4 听觉三元理论
    2.5 听觉图像理论
    第3章 对数及幂律听觉
    3.1 对数与幂律
    3.2 对数频率
    3.3 对数功率
    3.4 Bode图
    3.5 感知映射
    3.6 恒Q值分析
    3.7 对数应用注意事项
    第4章 人类听觉概述
    4.1 人机对比
    4.2 听觉生理学
    4.3 听觉中的关键问题
    4.4 响度
    4.5 临界频带、掩蔽与抑制
    4.6 音高感知
    4.7 音色
    4.8 协和与不协和
    4.9 语音感知
    4.10 双耳听觉
    4.11 听觉流
    4.12 非线性
    4.13 后续建议
    第5章 声学方法与听觉修正
    5.1 声音、语音与音乐建模
    5.2 短时谱分析
    5.3 谱的平滑与变换
    5.4 源一滤波器模型与同态信号处理
    5.5 摆脱对数
    5.6 听觉频率尺度
    5.7 mel频率倒谱
    5.8 线性预测编码
    5.9 PLP与RASTA
    5.10 自动语音识别中的听觉技术
    5.11 必要的改进

    第二部分 听觉的系统理论
    第6章 线性系统引言
    6.1 平滑:恰当的起点
    6.2 线性时不变系统
    6.3 滤波器与频率
    6.4 微分方程与齐次解
    6.5 冲激响应
    6.6 因果性与稳定性
    6.7 卷积
    6.8 本征函数与传递函数
    6.9 频率响应
    6.10 变换与运算方法
    6.11 有理函数及其零极点
    6.12 传递函数增益与相位的图解计算
    6.13 卷积定理
    6.14 级联、并联与反馈结构中滤波器的互联
    6.15 总结及后续安排
    第7章 离散时间与数字系统
    7.1 计算机模拟系统
    7.2 离散时间线性移不变系统
    7.3 冲激响应与卷积
    7.4 离散时间系统中的频率
    7.5 Z变换及其逆变换
    7.6 单位超前算子与单位延迟算子
    7.7 滤波器与传递函数
    7.8 采样与混叠
    7.9 自连续时间系统的映射
    7.10 滤波器设计
    7.11 数字滤波器
    7.12 多输入输出
    7.13 傅里叶分析与频谱图
    7.14 观点及拓展阅读
    第8章 谐振器
    ……

    第三部分 听觉外周
    第四部分 听神经系统
    第五部分 机器学习及应用

    中英文术语对照表
    参考文献
查看详情
相关图书 / 更多
人与机器听觉:听见声音的意义
人与自然和谐共生
黄泽颖 著
人与机器听觉:听见声音的意义
人与机器:思想人工智能
顾骏
人与机器听觉:听见声音的意义
人与自然和谐共生——山水林田湖草生命共同体建设的理论与实践
刘谟炎 著
人与机器听觉:听见声音的意义
人与家庭/IB MYP中文语言习得阅读训练
冯薇薇 叶颖颖 封文慧
人与机器听觉:听见声音的意义
人与自然(王天杨作品集)
王天杨 著
人与机器听觉:听见声音的意义
人与自然的和解:以乌梁素海为例的山水林田湖草沙生态保护修复试点工程技术指南
内蒙古乌梁素海流域投资建设有限公司、上海同济工程咨询有限公司 著
人与机器听觉:听见声音的意义
人与商业
Drucker 著;[美]彼得·德鲁克(Peter、F.、慈玉鹏 译
人与机器听觉:听见声音的意义
人与医学:西医文化史
[瑞士]亨利·E. 西格里 著;朱晓 译
人与机器听觉:听见声音的意义
人与绩效 德鲁克论管理精华
[美]彼得.德鲁克(Peter F.Drucker)
人与机器听觉:听见声音的意义
人与社会的责任——负责的社会哲学
Hans Lenk 著
人与机器听觉:听见声音的意义
人与机器:德语文学中的技术与机器主题研究
唐弦韵
人与机器听觉:听见声音的意义
人与自然
翟利沙 编
您可能感兴趣 / 更多
人与机器听觉:听见声音的意义
彼得2.0(比科幻小说更大胆的真实故事,一个人类赛博格的诞生记)
[美]彼得·斯科特-摩根(Peter Scott-Morgan) 著;博集天卷 出品
人与机器听觉:听见声音的意义
HTML5与CSS3基础教程(第9版)
[美]乔·卡萨博纳(Joe Casabona) 著;望以文 译
人与机器听觉:听见声音的意义
卓有成效的敏捷
[美]史蒂夫·迈克康奈尔(Steve McConnell) 著;任发科、林从羽 译
人与机器听觉:听见声音的意义
世界文学常识(精装精校典藏版)(著名学者和文学评论家梅西历时四年之作)
[美]约翰·梅西
人与机器听觉:听见声音的意义
什么是科学思维(第3版)(中文版)(思想者指南系列丛书)
[美]理查德·保罗(RICHARD PAUL);琳达·埃尔德(LINDA
人与机器听觉:听见声音的意义
计算机与人脑(中小学生阅读指导目录·高中)
[美]冯·诺依曼 著
人与机器听觉:听见声音的意义
超声医学:核心复习
[美]加琪·颜 主编;[美]鲁奇·斯雷斯塔
人与机器听觉:听见声音的意义
离散数学:面向计算机科学专业
[美]克利福德·斯坦;[美]罗伯特 L. 戴斯得尔;[美]肯尼斯·博加特
人与机器听觉:听见声音的意义
殊途:精神分析案例集
[美]沃米克·沃尔肯 著
人与机器听觉:听见声音的意义
城市与区域规划研究方法(第2版)
[美]王昕晧(Xinhao Wang);[德]冯鹤飞(Rainer vom Hofe)
人与机器听觉:听见声音的意义
恐龙侦探社(盒装)
[美]美国童光荟集出版社
人与机器听觉:听见声音的意义
单星的结构与演化:导论(英文)
[美]詹姆斯·麦克唐纳 著