Journal de AES Junio: Artículo recomendado

Analysis of and Experiments on Vertical Summing Localization of Multichannel Sound Reproduction with Amplitude Panning

Bosun Xie, Haiming Mai, Dan Rao y Xiaoli Zhong, del Acoustic Lab., School of Physics and Optoelectronics y el State Key Laboratory of Subtropical Building Science, South China University of Technology, Guangzhou, China; establecen las bases para el trabajo del paneo vertical mediante sumas de niveles con su paper: Analysis of and Experiments on Vertical Summing Localization of Multichannel Sound Reproduction with Amplitude Panning. (Análisis y experimentos sobre la localización en la suma vertical de la reproducción de sonido multicanal con paneo de amplitud.)

Partiendo de la hipótesis de Wallach, de que las variaciones en la diferencia de tiempo interaural causada por el giro de la cabeza proporciona señales dinámicas para la localización frontal y vertical, el paper desarrolla un marco para analizar la localización de suma vertical de la reproducción de varios canales con paneo de amplitud.

El trabajo comprende el análisis de las ecuaciones, que se basaron en el modelo simplificado de cabeza sin sombra; y se complementan las explicaciones psicoacústicas de estas ecuaciones. Proponen un método para analizar de forma más estricta la localización de sumas verticales para la amplitud por pares y analizan el paneo en el plano medio y los de ambisonic.

Esto provee nuevas herramientas para la reproducción de sonido multicanal, recreando de forma virtual fuentes o imágenes de sonido en diferentes direcciones; similares a las obtenidas por fuentes de sonido reales. Hay una revisión de los trabajos previos de J. Blauert (Spatial Hearing: The Psychophysics of Human Sound Localization), F. Rumsey (Spatial Audio), V. Pulkki (Virtual Sound Source Positioning Using Vector Base Amplitude Panning), M. A. Gerzon (Ambisonics in Multichannel Broadcasting and Video), G. Theile and G. Plenge, (Localization of Lateral Phantom Sources), D. H. Cooper (Problems with Shadowless Stereo Theory: Asymptotic Spectral Status), V. Pulkki, M. Karjalainen, and J. Huopaniemi (Analyzing Virtual Sound Source Attributes Using a Binaural Auditory Model), en todos estos temas.

Dichos trabajos intentaron analizar la localización en la suma del plano vertical o, más generalmente, la localización en direcciones espaciales arbitrarias incluyendo azimut y elevación. Las señales binaurales que incluyen la diferencia de tiempo interaural (ITD) y la diferencia de nivel interaural (ILD) son respetables para la localización horizontal o, más estrictamente, lateral. En esto, el ITD (más estrictamente, la diferencia interaural de retardo de fase) es una señal dominante para la calibración horizontal a bajas frecuencias por debajo de aproximadamente 1,5 kHz; mientras que ILD es más dominante a la localización en las frecuencias más altas.

Tanto las señales espectrales como las señales dinámicas contribuyen a la localización auditiva vertical. Sin embargo, la localización de la suma vertical en la reproducción de sonido multicanal no se puede explicar por señales espectrales a alta frecuencia.

El análisis y los experimentos confirman algunas observaciones previas que el paneo de amplitud por pares puede crear fuentes virtuales entre parlantes en el plano medio para algunas configuraciones de parlantes apropiadas (como un parlante dispuesto directamente en el frente y otro por encima o por debajo del plano horizontal). Sin embargo, en pareja, el paneo de amplitud no puede crear fuentes virtuales entre parlantes en el plano medio para otras configuraciones de parlantes inadecuadas (como dos parlantes dispuestos simétricamente arriba y abajo en el plano frontal medio). La reproducción de Ambisonic también es capaz de proporcionar una señal dinámica apropiada para la localización de suma vertical, específicamente, Ambisonic de tercer orden es capaz de recrear la ITD correcta y su variación dinámica hasta 1.8 kHz, dando un buen rendimiento de localización vertical. A través de la comparación con otros teoremas de localización, se ha encontrado que las ecuaciones de localización de suma utilizadas en el presente estudio y el teorema de Makita / Gerzon están relacionados; sin embargo, se basan en diferentes hipótesis psicoacústicas.

El teorema de Makita / Gerzon supuso que la percepción de la dirección de la suma de la fuente virtual es consistente con la dirección normal de la onda que suma el frente. Mientras el presente estudio supuso que la ITD determina el desplazamiento lateral de la fuente virtual desde el plano mediano y la variación dinámica de la ITD causada por el giro de la cabeza determina la localización vertical de fuentes virtuales.

Los resultados del presente estudio son aplicables al análisis y diseño de configuraciones de parlantes y señales en sonido espacial multicanal con altura.

El análisis más exacto para las señales de banda ancha debería estar basado sobre un complejo modelo auditivo binaural en el cual se tienen en cuenta los efectos dinámicos y espectrales de las mismas.

Acceso al paper (para miembros AES activos): http://www.aes.org/journal/online/JAES_V67/6/#paper2