2020/6/15
一、 回音消除技术的基础概念
回音消除已经替代了早期的回音抑制,回音抑制早始于20世纪50年代,在卫星通讯环境中用来控制由于比较长的信号延时而听到的回音。早的回音消除理论在20世纪60年代在AT&T贝尔实验室中发展起来,但是直到20世纪70年代末,由于受到电子行业的技术能力限制,商用回音消除产品一直没有取得太大的发展。
随着DSP的飞速发展使得回音消除产品变得更小和更具有性价比。在20世纪90年代,回音消除器不再作为一个独立的设备,而是第一次被集成于语音网关中(加拿大北电公司DMS-250)。这个整合使得回音消除直接内置于语音网关中,意味着回音消除器可以在通话过程中非常可靠地被开启或者关闭,在语音通讯和数据通信中区分不同的干线组取得所需要的信号。
1、回声与延时的关系
回声和延时是两个不同的概念,延时不会加重或者改变回声的量值。声音有一个遮掩效应,例如我们在山谷里那么清楚的听到回声的原因是因为声音的传递时间长,声音反射回来的时间就长,超过1秒甚至2秒,声音的传递时间长了,声音的遮掩效应会失去,这样人的耳朵就会感觉到听到这个回声,回声是一直存在的,专门的研究机构做过专门的测试,声音的传递小于20毫秒左右的时候,遮掩效果发挥作用,人耳一般听不出来,超过20毫秒以后遮掩效应开始衰减,超过50毫秒,声音的遮掩效应就基本消失了,只要有微弱的回声人耳就能听得到。
2、回声和数字延时及语音压缩技术的关系
数字延时技术就是把线性的信号,语音信号从喇叭或者电话中传出去前,经过数字信号采样处理会延迟一段时间,就使得回音回来延迟的更长,所以我们能够听到。而语言压缩技术是对一段数字信号进行采样后压缩,然后再把这个压缩信号送出去,这一段数字信号一般是30毫秒、40毫秒左右,语音数据经过拿出来做处理,处理之后,再送出去,这样就增加了40毫秒的延时,导致的结果就是有回音回来被听到。例如我们现在的电话网络都采用用数字交换机,而以前都是模拟交换机,送出的都是模拟信号,这个信号是以光速传递的,所以在模拟交换机时代,打本地电话和长途电话感觉不到有回音,只有通过卫星打国际电话的时候听到有回音,因为延迟时间就变长了,那么打本地电话,电信号以光的速度传递,只有几毫秒,我们就听不见感觉不到回音的存在,而现在的电话网络全都用数字式的,它把电信号变成数字信号,而数字信号的处理,不是采一个数字就送出去,它是采集一段信号,可能是20毫秒40毫秒的信号进来了,把它处理一下,然后送出去,这样的数字处理的效率很高,把信号先压缩以后,再送出去,结果就是效率更高,本来一根线只能送一路电话,现在可能送10个电话,但是提高效率的同时,增加了延时作为结果,这是就导致回音的出现,例如我们打手机有回音,也是这种原因。
二、AEC(Adaptive Echo Control)回声消除回音器的原理
1、回声消除原理
回音的产生既复杂也简单。一般喇叭信号出来声音它会传递到麦克风,这个传递过程本身从技术上讲就有一个传递函数,传递本身就已经发生了一些变化,在传递过程中,高频和低频的传递系数是不一样的,通常低频传递的效率更高,高频传递的效率低一点 。麦克风跟喇叭的位置靠的越近,声音传递的时间越短,稍微离的远一点,那么延迟的时间会多一点,即使声音直接传过去,信号就已经有时间延时了,麦克风位置的改变,回音也随之改变,传递的声音随着距离位置的改变,它传递的时间也发生改变,接触到信号也就改变了,但声音除了这个直接信号以外,声音在空间中它是往各个方向传递的,它会碰到墙壁、碰到天花板反射回来,然后反射到麦克风,有的反射到桌面然后到麦克风,各个情况都存在,所以这是一个很复杂的问题,所有的信号终的结果是叠加在一起的,叠加的结果就是有的信号被增强了,有的信号被减弱了,各种各样的都有,然后墙壁对声音信号的反射也不一样,高频低频都不一样,所以结果是一个复杂的所有叠加的结果,有的早有的晚,有的强有的弱,朗谷做回音消除呢,就是把总的传递函数效果算出来,那么并不是简单的说两个信号一样,这个你算出来的回音信号,跟送出去的参考信号,送到喇叭去的信号并不一样,它已经经过了一些传递改变了,那么可能有些已经延迟了100个毫秒,这是总的结果,回音消除的原理就是信号出去,然后麦克风收的信号肯定是这些信号各种各样的直接间接的传递,反射回来的信号叠加到一起,我们把这些传递函数计算出来,叠加结果计算出来,这样就能得到一个回音信号和麦克风信号,在理想条件下如果计算出来的和麦克风信号一样,就可以把回声消除掉,如果计算出来的有误差,那么就不可能消除干净,这就是回声消除的原理。回声消除技术后面还有很复杂的数学问题,难的地方是变量太多,即回音模型的改变回音的叠加的结果都要计算出来。另外,还有采用回声抑制进行回声处理的方法——非线性的过度,就是两边同时说话的时候,它分辨不出那个是回音信号时,就剪切掉。这种处理不当,也可以说是单工。因为线性做的不够好,还有回音时,就多切掉一点,称之为回声抑制。因此回声消除和回音抑制是不同的。
2、回声消除技术关键性技术指标
(1)ITU-T的G.167
这是国际电信联盟有一个标准,这个标准要求任何回声消除必须要做到降低45分贝以上,但是达到这个标准不是好的,因为人还能听到这个回声,这个是基本的标准。原则上麦克风信号收的信号有一个电平,这个电平我们可以用分贝来标示,如果这个信号的电平比如说是-3dB,如果你消除了30dB,那么结果就变成了-30Db,因为10分贝能量上是10倍,20个分贝就是100倍,人耳能听到的声音范围值大约是100万倍,所以人耳朵能听到能量范围值是60分贝左右,回声处理要消除60分贝以上人耳才听不出来,如果只消除30或者40分贝,能量降低到千分之一,万分之一,虽然能量弱了很多,但还是能听到。
(2)回声消除的带宽
窄带模式频率: 300Hz—3.4kHz
宽带频率模式: 50Hz—7kHz(应用厂家ploycom/Cisco/skype)
超宽带模式:50Hz—14kHz,一般称HD高清音频模式
全音域模式:20Hz—20kHz
上海镇启信息技术有限公司 版权所有 沪ICP备18047461号-1 免责声明