申请认证 退出

您的申请提交成功

确定 取消

闻音识人?美专家发现人人都有“听觉面孔” | 科学有意思

2018-07-05 11:17

最近召开的美国声学协会会议上,加州大学洛杉矶分校语音感知实验室的首席研究员乔迪·克里曼介绍,你的声音就是你的听觉面孔。

作者 | 周亦川

来源 | 搜狐健康

一个人通过声音,被别人识别出来。声音除了传递语言本身的信息,还传递了你的情绪,传递了你的声音特色。

最新的研究发现,这种识别的过程,是双向的,声音还会在听者的大脑里,有一个信号对比的过程。听者对你原有的主观认知,加上声音传递过来后的叠加,最终让听者从人群中识别出你的存在。

网传“中年男人判断标准之一是,接电话第一句‘喂’,你说的是第二声还是第四声?”——网友纷纷留言,效果准确,一个字竟判明了“小鲜肉”和“中年油腻男”也正是这个道理。

最近召开的美国声学协会会议上,加州大学洛杉矶分校语音感知实验室的首席研究员乔迪·克里曼介绍,你的声音就是你的听觉面孔。

音调反映对话中的社会地位

斯特林大学一项心理学研究介绍,人类会根据与谁交谈、谈话中的主导地位来改变声音的音调。

研究发现,与人交谈的过程中,当你碰到地位更高的人,碰到让你感觉更强大的人,你往往会提高音调,这样更能让你感受到自信,无所畏惧。

相反,斯特林大学维托里亚·米列娃博士说,遇见比自己卑微的谈话对象,或没有威胁的谈话对象,让你有安全感的谈话对象,反而,你会降低你的音调水平。

研究人员还发现,自我感觉很好的人,很自信的人,认为自己有较高威望的人,他们相信自己受到尊重,别人会重视他们的意见,赋予他们更多的社会地位和权力。这种人,无论和谁说话,他们的音调都不会改变,这表明他们更平静,更能掌控局势。

从声音的“平均”表征辨别声音个体“特征”

多年不联络的朋友,我们常说连声音都听不出来了?而对于熟识的人,哪怕他的声音陷入一群人的说话声音中,你闭着眼也能分辨出哪个是老王,哪个是小赵?一个没有来电显示的电话,你能听一耳朵就分辨出是谁打的……这些对你来说,自然而然的事情,背后的机理可能还真挺复杂的。

克里曼在美国声学协会的报告中指出,个人的声音可能会随着时间的推移而变化,这是因为他们的情绪状态、健康状况、谈话内容,或者其他许多因素使得将其量化变得特别困难,即机器很难通过这些细微区别判断是哪一个人(举例来说,老王很生气或者心情很愉悦时说话,我们都可以听出是老王,但机器却可能认为是两个人);而通过语音学、认知心理学和神经心理学的大量证据表明,听者将所有这些说者组织成成一种“平均”表征,对比其它个体与原型的偏差。在这种情况下,即使是一个音节也能承载足够的信息来区分一个声音和另一个声音。

克里曼对50名妇女的录音进行了数字分析,这一分析考察了构成朗读句子的元音和辅音的多个声学参数,例如基频、谐波频率相对于彼此的强度,以及它们与语音内部潜在噪声水平的比较。这些句子为每个特征提供了一个量化的平均值和范围,通过使用她们的样本句子的随机集合,将所有说者的语音与这组特征进行比较,可以区分究竟是哪一个人说的。这项工作如果交给机器去做,可能需要一分钟完成去除混淆的工作,而人类只用几秒钟即可完成,确实很有意思。

换言之,人对于声音的判别,是一个双向的对比过程,而并非单向的接受判别。

为何有人丧失了闻音识人的功能?

声音的识别来源于我们的大脑,那么脑部疾病是否会导致我们分辨不出声音?发表于《大脑》杂志的一份研究中,莱比锡马克斯·普朗克人类认知和脑科学研究所科学家克劳迪娅·罗斯旺多维茨对58名脑损伤患者进行观察,测试他们学习和识别声音的能力,特别是中风患者。

科学家们观察了参与者的脑部扫描——他们脑部结构和损伤的高分辨率图像。结果发现脑内右后颞叶某些部位有病变的人,在辨认声音时会遇到困难。他们认为颞上后回(STG)是语音识别的关键。在参与研究的人中还有一名声音失认症的人,如同我们常说的“脸盲”,他们是“音盲”——无法通过声音识别人,甚至无法识别自己的母亲或孩子。他们的脑后右侧颞叶的变化导致了相应的缺陷。

罗斯旺多维茨指出,脑内右后颞叶的变化导致了相应的缺陷,这种缺陷在“音盲”患者中十分常见。有很少的一部分人出生时就存在,有些在中风后出现。

语音识别安全吗?你的声音会不会被黑客模仿

Siri、微信和其他基于语音的智能手机应用程序虽然方便,但可能会让你面临日益严重的安全威胁:语音黑客。只需几分钟的音频样本,攻击者就可以重放您的声音,以欺骗人们以及顶级数字安全系统,潜入你的银行账户,这些都是非常可怕的事情。

在第37届分布式计算系统国际会议上发表的一项研究报告中,来自于纽约布法罗大学领导的工程师团队创建一个阻止语音黑客攻击的应用程序,可以阻止基于机器的语音模拟攻击。

安全和隐私研究实验室主任、该研究的主要作者之一奎仁博士说:“你生活的方方面面内容现在都在你的手机上。不幸的是,黑客无处不在,有一个完整的地下灰色市场出售你的密码和你的个人信息。”

奎仁介绍:“技术快速进步,我们的防御策略是使用多道防线,称之为纵深防御。语音识别可能会成为更常见的安全工具,因为更多的互联网连接设备没有触摸屏或键盘。”

语音识别攻击有多种形式。黑客可以合成你的声音,但是这可以被现有的算法检测到;其他人可以模仿你的声音,现有技术也能够检测到这一点。

但是第三种方法是重播某人的真实声音,这是一项很强的攻击技术,这也正是奎仁的防御研究成果。奎仁指出,任何重播都必须在扬声器上播放,扬声器具有磁场,那么我们就可以使用手机中的磁强计来探测这个磁场。系统使用手机的轨迹映射算法来测量扬声器和手机之间的距离,它要求手机用户在解锁语音识别时靠近电话。也就是说,任何人想通过机械扬声器重播语音时都要让两者足够靠近,这样手机就可以检测到磁场,警告异常。

最后,当使用语音识别时,防御系统要求手机在嘴前移动-摆动。那么,当播放器的声音来源移动时,磁场也会发生变化,那么手机程序也可以检测到这一点。

将来是否会有机器人通过算法模拟人的声音情绪以假乱真呢?世界真奇妙啊!

资料来源:

https://www.eurekalert.org/pub_releases/2016-12/asoa-wmy112316.php

https://www.eurekalert.org/pub_releases/2018-05/asoa-wda042718.php

https://www.eurekalert.org/pub_releases/2017-12/mpif-aas122217.php

https://www.eurekalert.org/pub_releases/2017-06/uos-sso062917.php

https://www.eurekalert.org/pub_releases/2017-11/uoef-vic111417.php

https://www.eurekalert.org/pub_releases/2017-06/uab-aus060517.php

不感兴趣

看过了

取消

闻音识人,面孔,听觉,语音识别,扬声器,声音,黑客,算法

不感兴趣

看过了

取消

相关阅读

赞+1

您的申请提交成功

您的申请提交成功

确定 取消
海报

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交