De-essing - De-essing

De-essing (también desibilizante ) es cualquier técnica destinada a reducir o eliminar la prominencia excesiva de consonantes sibilantes , como los sonidos normalmente representados en inglés por " s ", "z", "ch", "j" y "sh" , en grabaciones de la voz humana. La sibilancia se encuentra en frecuencias entre 2 y 10  kHz , dependiendo de la voz individual. Este artículo analiza la causa del problema de la sibilancia registrada excesiva y varios enfoques para el proceso de solucionarlo.

Causas

El exceso de sibilancia puede deberse a la compresión , la elección y la técnica del micrófono , e incluso simplemente la forma en que se forma la anatomía de la boca de una persona . Las frecuencias de sonido Ess pueden ser irritantes para el oído, especialmente con auriculares o audífonos, e interferir con una transmisión de audio agradable y modulada.

Proceso de de-essing

Curva de ecualización que reduce los decibelios de un rango de frecuencia de ess para una voz humana

De-essing es un proceso de edición de audio dinámico, que solo funciona cuando el nivel de la señal en el rango sibilante (el sonido ess) excede un umbral establecido. De-essing reduce temporalmente el nivel de contenido de alta frecuencia en la señal cuando hay un sonido sibilante. De-essing se diferencia de la ecualización , que es un cambio estático de nivel entre muchas frecuencias. Sin embargo, la ecualización de las frecuencias ess por sí sola puede manipularse para reducir el nivel de sibilancia.

Hay varios algoritmos basados ​​en el tiempo y la frecuencia que pueden reducir la sibilancia o debilitar el sonido. Los enfoques basados ​​en el dominio del tiempo, como los filtros de paso de banda, son más adecuados para aplicaciones en tiempo real, como la radio en vivo, debido a la menor limitación del procesador de señal digital . Las aplicaciones de reproducción o fuera de línea incorporan métodos basados ​​en la Transformada Rápida de Fourier (FFT).

Usando un complemento de de-essing dedicado

En la actual fortaleza digital de la producción de audio, la herramienta más utilizada para reducir la sibilancia es un complemento de-esser. Se puede usar un ecualizador dinámico para lograr los mismos efectos que un de-esser; sin embargo, los fabricantes de complementos han adaptado estas herramientas para que funcionen de manera eficiente dentro de las frecuencias medias-altas y altas.

Un complemento de eliminación comprimirá la señal deseada de acuerdo con la amplitud de la frecuencia seleccionada a medida que pasa por encima de un umbral preestablecido. En el caso de una sibilancia excesiva, entre 4 y 10 k, a menudo será donde reside el problema. Ciertos complementos darán forma a la envolvente de la compresión para lograr un efecto más musical.

De-essing excesivo puede resultar en la manipulación excesiva de los transitorios, lo que resulta en el suavizado o endurecimiento de ciertas consonantes, produciendo efectos indeseables.

Compresión de cadena lateral o eliminación de eses de banda ancha

Eliminación de banda ancha mediante cadena lateral filtrada de paso de banda

Con esta técnica, la señal que alimenta la cadena lateral de un compresor de rango dinámico se ecualiza o filtra para que las frecuencias sibilantes sean más prominentes. Como resultado, el compresor solo reduce el nivel de la señal cuando hay un alto nivel de sibilancia. Esto reduce el nivel en todo el rango de frecuencias. Debido a esto, los tiempos de ataque y liberación son extremadamente importantes, y los ajustes de umbral no se pueden colocar tan bajos como con otros tipos de técnicas de de-essing sin experimentar artefactos de sonido más flagrantes .

Compresión de banda dividida

Eliminación de eses de banda dividida

Aquí, la señal se divide en dos rangos de frecuencia, un rango que contiene las frecuencias sibilantes y un rango que no las contiene. La señal que contiene las frecuencias sibilantes se envía a un compresor. El otro rango de frecuencia no se procesa. Finalmente, los dos rangos de frecuencia se vuelven a combinar en una sola señal.

La señal original puede dividirse en frecuencias altas (sibilantes) y bajas, o dividirse para que las frecuencias tanto por debajo como por encima de la sibilancia no se modifiquen. Esta técnica es similar a la compresión multibanda.

Ecualización dinámica

Eliminación de eses de ecualización dinámica

La ganancia de un ecualizador paramétrico se reduce a medida que aumenta el nivel de sibilancia. El rango de frecuencia del ecualizador se centra en las frecuencias sibilantes.

De-essing con automatización

Un método más reciente de de-essing implica la automatización del nivel vocal en una estación de trabajo de audio digital (DAW). Siempre que se produzca una sibilancia problemática, el nivel se puede configurar para que siga las curvas de automatización que el usuario dibuja manualmente.

Este método se hace factible editando los puntos de automatización directamente, en lugar de programar mediante la manipulación de controles deslizantes de ganancia en un modo de escritura. Un ingeniero de audio no podría reaccionar lo suficientemente rápido para reducir y restaurar con precisión los niveles vocales durante el breve período de sibilantes durante la reproducción en tiempo real.

De-essing sin automatización o con ecualización manual

La letra de la palabra hablada se resalta "instantáneamente" en la pantalla de forma de onda de una estación de trabajo de audio digital.

El software de edición de audio, ya sea profesional o amateur, como Audacity , puede utilizar los efectos de ecualización incorporados para reducir o eliminar los sonidos sibilantes que interfieren con una grabación. Aquí se describe un método común con Audacity. El proceso consta de dos fases:

  1. Analizar la frecuencia del sonido ess de la voz muestreando varias instancias y calculando el rango de frecuencias ess. La sibilancia de las voces masculinas oscila entre 3000 Hz y 6000 Hz, mientras que la voz femenina suele oscilar entre 6000 y 8000 Hz.
  2. Aplique un filtro de ecualización para silenciar la banda de frecuencia determinada de -4 dB a -11db durante los eventos de tiempo de frecuencia mínima.

El tiempo de subida y bajada del filtro debe ser rápido (menos de 10 ms) para recortar solo las instancias específicas de sibilancia.

Ver también

Referencias

enlaces externos