空间定位感知机制


空间听觉

人的空间听觉感知机制受声源数量、声源类型、声学环境、人的生理结构及心理因素等多种因素共同作用。

单声源的空间感知

方向感知

人对声音的空间方向感知主要依靠以下几个因素

  • 单耳因素Monoaural cues,主要包括谱因素,即耳廓对来自不同方向的声信号具有不同的谱响应。原因主要是耳廓对入射声波的散射和多径反射作用造成。由于耳廓的物理尺寸限制,只有在高频情况下(5至6kHz以上)作用才明显,在2至3kHz以上才开始起作用。
  • 双耳因素Binaural cues,包括ITD和ILD。
    • 在低于1.5kHz的情况下,相延时差是声源定位的主要因素。频率大于1.5kHz以后,由于头部尺寸大于声波的波长,耳间相位差可能大于$2\pi$,从而造成混乱。
    • 在1.5kHz以上,耳间包络延时差是声源定位的一个因素。
    • 通常见到的由几何声学导出的ITD既非双耳相延时差,也非双耳包络延时差,可视为他们的一种近似。
    • ILD产生的原因时头部对声波的阴影和散射作用,因此,高频情况下更明显。
    • 在低频时$ka$很小,ILD也很小,随声源方向$\theta$变化平缓。
    • 大约在1.5kHz以上,ILD开始作为一个有效的方向定位因素。
  • 动态因素,头部转动。解决ITD和ILD均为零时造成的定位混乱。

总结起来说

  • 频率小于1.5kHz的情况下,双耳相延时差是方向定位的主要因素;
  • 频率在1.5kHz到4kHz的情况下,双耳包络延时差和声级差对方向定位起作用;
  • 在频率大于4kHz到5kHz的情况下,双耳声级差是方向定位的主要因素;
  • 在高频情况下(频率大于5至6kHz),耳廓对声波的散射和多径反射引起的频谱特征起重要的作用,尤其是对区分前后镜像方向及中垂面的声源定位起重要作用;
  • 头部转动对区分前后镜像方向及中垂面的声源定位起重要作用。

实验表明

  • 频率在1kHz以下时,方向定位的精度最高。
  • 在1.5kHz到3kHz之间,由于双耳相延时差不能作为有效的定位因素,双耳声级差才开始起作用,但作用不明显。此区间称为定位混乱区间。
  • 当声信号含有低频成分时,低频ITD对定位起主导作用,可忽略ILD因素。

距离感知

人的听觉系统对距离的感知不及方向感知的能力强。人对距离的感知是存在偏差的,一般情况下,远距离声源(大于1.6m)感知距离变近,近距离声源(小于1.6m)感知距离变远。

对声源的距离定位的影响因素由很多:

  • 声音的主观响度感觉。
  • 对声音信号的熟悉程度。
  • 空气对声波的高频衰减,即空气非线性的频谱响应。
  • 头部等对近场声波的散射和阴影作用。
  • 近场ILD以及谱因素影响。
  • 室内反射声。

多声源的合成定位

多声源的合成定位实质是多声源发出的相关声波线性叠加,从而使人产生一种错觉形成主观的空间听觉。

双扬声器

在$f\le 0.7 {\rm kHz}$的低频,略去头部的散射和阴影作用,将双耳简化为相距$2a$的点,并假设扬声器到头部中心距离为$r \gg a$的远场,左右耳的声压分别为左右扬声器在其上产生声压的叠加

且有

$\theta_0$为扬声器与头正前方的夹角。略去公共相位因子,可得双耳声压的相位差为

双耳相延时差为

由于在低频情况下,双耳相延时差是声源方向定位的主要因素,与单声源ITD进行比较,可得到两扬声器重放时的合成声像方向为

低频时,$ka \ll 1$,因此取按$ka$泰勒展开后取首项

这就是正弦定理。表明一对扬声器产生的声像方向与扬声器信号振幅之比以及扬声器之间的半张角有关。

优先效应

优先效应描述的是多声源之前本身就存在时间差的情形。

鸡尾酒会效应

当同时存在目标声源和干扰声源,且目标声源与干扰声源在空间上分离时,听觉系统可以在干扰背景中有效地获取目标声源的声信信息。


  目录