Convoluciones Nocturnas – Picos entre muestras y dBFS+

3
413

 

Introducción

Hay algunas tardes de domingo, en las cuales no para de llover, tardes realmente aburridas, que son idóneas para ponerte un buen CD, sentarte en el sillón y escuchar tranquilamente, mientras ves como el tiempo pasa a través de las gotas que caen en los cristales de las ventanas.

Hace poco escuchaba uno de Lenny Kravitz, uno de mis artistas favoritos, por su concepción de la música y su sonido.

Centrémonos en el sonido, ¿qué es lo que tiene el sonido de Lenny Kravitz que no tienen otros músicos? Pues para empezar, tiene algo realmente interesante, y es que sigue utilizando bastantes equipos analógicos en sus producciones. Y por otro lado, tiene un sonido muy abierto, un sonido sin una excesiva compresión que hace que sus discos tengan aire y respiren por sí mismos. Pero realmente Lenny Kravitz es un dinosaurio del sonido, es decir sigue empleando técnicas de grabación del siglo pasado en una época, en la cual el sonido, es realmente algo secundario. ¿Es cierto que las grabaciones más añejas son mejores que las actuales?¿ Es cierto que tiempos pasados siempre fueron mejores que los modernos? Sí y no, la revolución digital ha permitido  y facilitado a pasos agigantados, el mercado de la producción musical, sin embargo la revolución digital, es un arma de doble filo, en la cual se  pueden tener calidades sonoras bastante superiores a las grabaciones analógicas y que sin embargo si no se tiene pleno conocimiento del tratamiento de señales discretas se corre el riesgo de cometer aberraciones que causan peores resultados que en el entorno analógico.

Efectivamente, la revolución digital, cuya una de sus premisas principales es obtener una calidad mayor que la vieja grabación analógica puede producir diferentes tipos de artificios cuyos resultados son claramente peores que una grabación analógica. Generalmente estos artificios y aberraciones, se producen por un uso abusivo del entorno digital, en el cual mucha gente cree que una vez que se verifica el teorema del muestreo de Nyquist, todo vale.

Uno de los grandes problemas que se producen en el audio digital, fue reportado por Thomas Lund y Soren Nielsen , ingenieros de TC Electronics, en diferentes convenciones del AES. De los artículos escritos para el AES se deduce que debido al uso y abuso excesivo del entorno digital, se estaba comercializando diferentes materiales digitales, que si bien poseían una distorsión inherente, al final el oyente no se percataba de la misma, debido a que su oído ya se había educado a este tipo de distorsión.

Thomas Lund achaca esta distorsión principalmente a tres problemas:

  • El primer problema, es el abandono del entorno analógico, en todo el proceso de producción de un material sonoro, desde que es captado hasta que es tostado en un CD. Hace 25 años la producción del material sonoro se realizaba casi en su totalidad en el entorno analógico, dejándose relegado el entorno digital tan sólo en el paso de la digitalización del material para ser tostado en el CD. Los problemas que Thomas Lund muestra en su artículo, son problemas propios de los sistemas digitales, no produciéndose intrínsecamente en entornos analógicos.

 

  • La masterización de los materiales sonoros, buscaban fines artísticos y técnicos, como eran equilibrar el nivel de sonoridad de todos los temas de un CD. Desde hace 20 años hasta hoy, se ha puesto de moda la falsa idea de que cuando un material sonoro tiene más sonoridad es que es mejor. Esta obsesión por alcanzar el mayor nivel de sonoridad posible, produce por un lado el abuso de equipos de dinámica digitales, los cuales son conocidos por crear diferentes tipos de artificios, y por otro lado el aplastar la forma de onda, contra el techo de los 0 dBFS del entorno digital.

 

  • El uso de medidores de valor de la muestra instantánea, como parte de la herencia de la producción en entornos analógicos y masters en CD o en DAT, en donde lo único que se hacía era digitalizar el master.

 

Estos tres problemas han producido que hoy en día, cuando se supone que la revolución digital debería aportar más calidad que los entornos analógico, se están experimentando una serie de artificios y distorsiones que no se producían hace 25 años y son causados principalmente por un abuso y falta de conocimiento del entorno digital.

El hecho de que Lenny Kravitz grabase sus discos con diferentes equipos analógicos y que en la época de los 90 no existiese aun la obsesión por la sonoridad, hace que los discos de Lenny Kravitz, suenen mejor que discos producidos hoy en día. No es cuestión de que tiempos pasados fuesen mejores, es simplemente que en tiempos pasados las cosas se hacían de otra forma.

 

Definición de dBFS+ y picos entre muestras

Lund y Nielsen centran sus investigaciones en torno a los conceptos de los dBFS+ y los picos entre muestras.

Antes de definir estos dos conceptos debería quedar muy claro, que estos se refieren tan sólo a sucesos que se manifiestan en el dominio analógico (continuo). En el dominio digital (discreto) por definición es imposible que se produzcan, por la propia definición de los sistemas discretos.

Los dBFS+ se podrían definir como aquellos niveles de tensión de la señal reconstruida en el entorno analógico que están por encima del valor de tensión asociado a los 0 dBFS.

Por picos entre muestras, se conoce aquellos valores de tensión que aparecen entre muestras en el dominio analógico, tras la actuación del conversor DA, y que poseen un nivel superior en tensión a las muestras entre las cuales aparecen. Se podría entender cualquier pico que surge entre dos muestras al reconstruirse la señal, sin embargo el termino picos entre muestras, es utilizado básicamente para expresar aquellos valores de tensión que se producen entre muestras con valores de cuantificación muy altos y que van a producir la aparición de dBFS+

El drama surge cuando se descubre que tanto los picos entre muestras como los dBFS+ no forman parte directa de la naturaleza discreta de la señal muestreada pero sí forman parte de la información implícita de la señal que se reconstruirá posteriormente, por lo tanto no van a poder ser descubiertos de una forma trivial en el dominio discreto. Visualmente no existe la representación alguna de estos problemas en ningún editor de audio profesional, y sonoramente los conversores utilizados en los estudios profesionales  poseen una electrónica, diseños y fuentes de alimentación preparados para asumir en parte estos picos entre muestras. Sin embargo cuando las producciones actuales son reproducidas en equipos de gama doméstica, donde los conversores no son dedicados y forman parte de la electrónica de otros equipos, es cuando realmente se producen las lamentaciones.

 

¿Por qué surgen los dBFS +?

Los dBFS+ surgen básicamente a partir de los picos entre muestras que provienen de muestras que tratan de apurar el techo de la escala, es así de sencillo.

Cuando se muestrea una señal a una determinada frecuencia, marcada por un reloj, el sistema adquiere muestras de tensión equiespaciadas, de tal forma que si la frecuencia de muestreo es al menos el doble de la frecuencia máxima de la señal, según el teorema de Nyquist, se nos garantiza que si se vuelve al dominio analógico, la señal reconstruida va a ser una réplica de la señal muestreada. Es decir toda la información relativa a la señal, es mantenida durante el muestreo, siempre que se verifique Nyquist, aunque en el dominio analógico se disponga de infinitos valores de tensión y en el dominio digital tan sólo se disponga de unos pocos valores. Sin embargo con tan sólo esos pocos valores y mediante el filtro de reconstrucción del DAC se podrá obtener una réplica exacta de la señal original. Toda la información de la señal necesaria para reconstruirla posteriormente se encuentra inherentemente en la señal muestreada.

El siguiente paso es imaginar que entre dos muestras del dominio digital podrán existir infinitos valores de tensión del dominio analógico, los cuales no podrán presentar una variación en el tiempo mayor que la mitad de la frecuencia de muestreo. Sin embargo estos valores de tensión pueden poseer mayor amplitud que los valores de tensión de las muestras tomadas, por lo tanto a la hora de muestrear una señal es necesario hacerlo dejando un margen con respecto al techo de la escala para que de esta forma, cuando en el filtro de reconstrucción aparezcan niveles de tensión que estén por encima de los valores de las muestras máximas cuantificadas, exista un margen de tensiones que el conversor DA pueda manejar para reconstruir la señal sin distorsionarla.

Antiguamente la única digitalización que se hacía de las señales analógicas era el paso previo a la fabricación de los CDs, ya que incluso la masterización se hacía en magnetófonos de bobina abierta. Estos magnetófonos eran conectados a conversores AD para comenzar el proceso de fabricación de los CDs. En este punto el operador del conversor lo único que hacia era ajustar los volúmenes de entrada, para que ninguna de las tensiones de la señal saturase el conversor, asegurándose así mismo por definición que el CD fabricado no saturaría de ninguna forma los conversores de equipos domésticos.

Sin embargo desde hace algunos años la digitalización del material es a menudo posterior a la captura sonora de la fuente, y esta señal muestreada, es procesada digitalmente de una forma exagerada, en donde el técnico, encargado del procesado, tan sólo se preocupa de que las muestras no lleguen a tocar los 0 dBFS sin darse cuenta que aunque estas muestras no lleguen a tocar los 0 dBFS los picos entre muestras que se pueden formar en el filtro de reconstrucción, si pueden estar superando valores de tensión asociados a los 0 dBFS.

Se propone otro enfoque diferente al teorema de Nyquist. Anteriormente se ha comentado que debido al teorema de Nyquist, siempre que durante el muestreo de la señal analógica se verificase el teorema, se nos garantizaba, que la señal reconstruida a la salida del conversor DA iba a ser una réplica de la señal muestreada originalmente, ya que toda la información necesaria para reconstruir la señal original se encontraba intrínsecamente en las muestras obtenidas.

Supóngase ahora que se ha muestreado una señal, verificando Nyquist, y supongase que se ha procesado digitalmente esta señal variando la forma de onda (waveform) o forma de la señal original. Está claro que en este caso aunque se cumpla Nyquist, el filtro de reconstrucción no va a reconstruir una réplica de la señal original, sino que va a reconstruir una señal conforme a las muestras procesadas.

En este punto surge el problema, si en el muestreo de una señal analógica conocida se ha tenido suficiente cuidado para que no se saturase el conversor AD, ¿se podría pensar lo mismo de la señal procesada? Es decir, abstrayéndose, podríamos pensar que la señal procesada, proviene de una hipotética señal que ha sido muestreada respetando los niveles en el conversor AD, o quizás como consecuencia del procesado, la hipotética señal de origen, hubiese sido una señal que hubiese saturado el conversor AD.

Esta señal reconstruida de las muestras procesadas va a ser réplica de una hipotética señal analógica muestreada pero que en principio no se conoce, ya que el procesado ha variado la señal original de tal forma, que no se conoce a priori la señal analógica, que se correspondería con la señal procesada.

La vuelta de tuerca que se propone para el teorema de Nyquist es que si bien antes se hablaba de que a partir de una señal analógica, se debía ajustar correctamente los parámetros en la conversión, para que la señal reconstruida fuese una réplica sin ningún tipo de artificios ni distorsión, ahora se propone pensar al revés, a partir de las muestras procesadas, se propone imaginar como hubiese sido la señal continua que muestreada, hubiese proporcionado esas muestras procesadas, y de esta forma, imaginando la señal en el dominio continuo, saber si esta señal hubiese saturado el conversor AD, ya que de ser así, la saturación en el conversor DA, también se producirá, apareciendo dBFS+.

He aquí donde surge el problema, ya que es sencillo imaginar una señal muestreada a partir de una señal continua, pero es casi imposible imaginar como es una señal original a partir de unas pocas muestreadas, por eso el técnico de sonido debe tener los suficientes conocimientos sobre el procesado que está realizando, para salvaguardar que aun en el peor de los casos la señal procesada jamás se corresponda con una señal original que estuviese saturando el conversor AD. Como el técnico ni nadie es capaz de imaginar la hipotética señal original a partir de unas pocas muestras, debe ajustar los parámetros del procesado en base a lo que su experiencia y conocimientos le dicten para tratar de evitar cualquier problemática posterior en el conversor DA.

Resumiendo, procesar una señal muestreada, aun verificando Nyquist y verificando que durante el muestreo ninguna muestra saturó el conversor AD, no es garantía de que la señal reconstruida no vaya a mostrar dBFS+, ya que la variación de la forma de onda de la señal, debido al procesado digital, puede hacer que la nueva señal a reconstruir, provenga de una hipotética señal que durante el muestreo hubiese producido que se saturase el conversor AD, saturando por ende al conversor DA.

Lund y Nielsen proponen fundamentalmente 4 fuentes con una alta probabilidad de generar dBFS+. Debe quedar claro que estas fuentes generan estos sucesos en el dominio analógico, cuando se está apurando el techo de la escala, es decir cuando se trabaja cerca de los 0 dBFS.

  • La propia naturaleza de la señal muestreada: Cuando se muestrea una señal continua con una determinada frecuencia de muestreo (verificando Nyquist) puede suceder que ninguna de las muestras obtenidas coincida con los valores máximos de la señal. Si por cualquier circunstancia el técnico de sonido decide incrementar el valor de la amplitud de las muestras, de tal forma que normaliza el valor de estas a 0 dBFS, las muestras que no se han muestreado, y en concreto aquellas muestras que eran de un valor de tensión superior a las muestras tomadas, saturarán el filtro de reconstrucción del DAC.

  • Reducción del ancho de banda de la señal muestreada: La potencia en una señal se mantiene independientemente del procesado que se realice con ella. De esta forma si por ejemplo se aplica un filtrado de la señal muestreada, filtrado encargado de eliminar parte del espectro, la amplitud de la señal se va a incrementar para tratar de compensar la potencia que se pierde al eliminar esta parte del espectro. La amplitud no se incrementa sólo en las muestras tomadas, se incrementa en la señal en su totalidad, de tal forma que si se está trabajando con una señal cuyas muestras tomen valores cercanos a los 0 dBFS, cuando se produce la reducción del espectro la señal va a incrementar de forma natural su amplitud, que aunque en el dominio digital las muestras no superen los 0 dBFS, al reconstruir la señal se va a producir una saturación en el conversor DA.
  • Cambio de fase en la señal muestreada: Determinados procesados que se hacen de las señales producen cambios en la fase de la señal muestreada. Como consecuencia de esto, determinadas muestras que poseen un valor determinado de amplitud pueden variar este valor, incrementándose notablemente. Si las muestras originales han sido normalizadas respecto al valor de 0 dBFS y se procesa la señal de tal forma que se varíe la fase, es posible que algunas muestras incrementen su valor. Al igual que en el caso anterior, no sólo las muestras incrementan su valor, sino la señal en sí misma. De esta forma, aunque en el dominio discreto las muestras no superen los 0 dBFS, al reconstruirse la señal, se puede saturar el conversor DA.

 

  • Clipping digital de la señal muestreada: Uno de los mayores problemas que existe con la música actual es el abuso de la sonoridad que se busca en los diferentes materiales sonoros. Esto se produce básicamente en dos procesos, una compresión exagerada y una normalización a 0 dBFS, en donde aun utilizando limitadores, el desastre no está salvaguardado. El tratamiento actual de las señales sonoras produce formas de onda pseudocuadradas, en donde se suceden gran cantidad de muestras que adquieren valores de casi los 0 dBFS con otras muestras de una amplitud considerablemente menor. En muchos casos el tratar de apurar los 0 dBFS produce un clipping digital de la señal muestreada.

Una señal continua periódica con forma cuadrada posee una descomposición en series de Fourier de tal forma que su espectro se puede caracterizar como una serie de sinusoides de frecuencias múltiplos impares de la frecuencia fundamental de la onda cuadrada que se extiende desde la frecuencia fundamental hasta el infinito, en donde la envolvente de las componentes espectrales se puede caracterizar como una función sinc.

El problema es que debido a que en el muestreo se debe verificar Nyquist, el ancho de banda de la señal es limitado para poder verificar de esta forma el teorema. Una señal cuadrada que ha sido filtrada para limitar su ancho de banda, pierde inherentemente su forma cuadrada, y de esta forma, mantiene una forma, relativamente cuadrada pero sin llegar a ser cuadrada perfectamente. Entre todos los factores que suceden a la onda cuadrada, la que más interesa en el contexto que se trata, es que el techo de la onda, ya no es perfectamente recta, sino que se produce una serie de sobreoscilaciones y rizados que hacen que el valor de la amplitud no sea constante, alternándose valores máximos y mínimos.

Cuando se crean ondas cuadradas como resultado del clipping digital se debe saber que estas ondas que a simple vista parecen cuadradas realmente están filtradas en frecuencia para que se verifique Nyquist y no surjan productos de aliasing en la señal. Aunque todas las muestras se observen a la misma amplitud (0 dBFS) el techo de la onda va a mostrar un rizado cuando se reconstruya la señal, en donde van a aparecer tensiones superiores a los 0 dBFS de una forma oscilante.

 

¿Como combatir los dBFS+ y los picos entre muestras?

La primera idea para evitar que aparezcan picos entre muestras que produzcan dBFS+ es tan simple, como no apurar el techo de la escala, dejando un margen de seguridad. En el caso de que debido al procesado aplicado a la señal discreta, o como consecuencia de que no se haya muestreado los picos máximos en la señal original, si se ha dejado un margen de tensión suficiente los posibles picos entre muestras que surjan al reconstruir la señal no saturarán el conversor DA.

Según Lund y Nielsen, dejando un margen de unos 3 dBs sería suficiente para no producir dBFS+, con lo que normalizando la producción sonora a – 3 dBFS, podría ser suficiente para evitar el problema. Sin embargo esta solución que parece la más sencilla sería la más difícil de implementar, ya que por un lado no existe una normativa especifica acerca de poder trabajar con muestras a 0 dBFS y por otro lado la guerra de sonoridad (loudness war) obliga a los diferentes técnicos de sonido a maximizar la sonoridad hasta límites de exprimir diferentes equipos de dinámica, los cuales son empujados hasta los 0 dBFS, aplastando en muchos casos la onda contra este techo tratando de apurar al máximo la escala. La solución pasaría por hacer una normativa adecuada para evitar este problema y por otro lado educar al oyente a escuchar los materiales sonoros de una forma más natural, respetando la dinámica de las señales.

La segunda idea para evitar que aparezcan picos entre muestras que desencadenen los dBFS+ es anticipar su aparición. Es decir es tratar de conocer como va a ser la señal reconstruida por el conversor DA antes de que la señal pase por el conversor y de esta forma poder actuar sobre ellos. La única forma de hacer esto sin salir del dominio digital es realizar un sobremuestreo de la señal, de tal forma, que se obtengan nuevas muestras entre las ya existentes. Una vez que se disponen de estas muestras es cuando se puede evaluar los picos potenciales de crear dBFS+ en función del valor digital que adquieran las diferentes muestras obtenidas en el sobremuestreo. El sobremuestreo se acercará más a la forma de la señal reconstruida cuanto mayor sea el mismo.

 

Generalmente y dado que la primera idea es más difícil de llevar a cabo, no por las circunstancias técnicas sino por la estupidez humana, los técnicos de sonido utilizan limitadores con sobremuestreo con la idea de limitar el valor de las nuevas muestras obtenidas. El problema en este caso es que no todos los algoritmos incluidos en muchos plugins están a la altura necesitada para finalizar un material sonoro, teniendo que desembolsar una cantidad de dinero más allá de unos pocos cientos de euros para poder obtener un resultado lo más neutro posible ante esta forma de trabajar.

 

Resumen

Thomas Lund y Soren Nielsen llevan ya años avisando en diferentes convenciones del AES y en diferentes artículos de la problemática inherente de trabajar con muestras que están excesivamente próximas al techo de la escala. Lund y Nielsen introducen dos conceptos que son el de picos entre muestras y dBFS+ y presentan la problemática originada en tres sistemas diferentes: conversores DA, conversores de frecuencia de muestreo, y en codificadores de audio. En este pequeño artículo se ha decidido comentar principalmente los problemas existentes en los conversores DA, ya que son los equipos que se utilizan en cada momento por un técnico de sonido para realizar sus funciones.

De una forma muy simplista se puede decir que un conversor DA trabaja con una tensión de alimentación que en la mayoría de los casos coincide con la tensión asignada a los 0 dBFS (tensión de referencia) del techo de la escala, siendo por tanto el conversor incapaz de manejar tensiones superiores a este valor, y que en el caso de producirse serán recortadas hasta este valor máximo de alimentación, produciendo por tanto una distorsión a la salida del conversor. El problema surge entonces cuando se trabaja con un material sonoro que posee un alto nivel y que sus muestras llegan a los 0 dBFS o están muy próximas a ellos.

Tanto los picos entre muestras como los dBFS+ se producen tan sólo en el dominio analógico, como fruto de la reconstrucción que se realiza en el filtro de mismo nombre del conversor DA. Básicamente se puede decir que los picos entre muestras son aquellos valores de tensión que están por encima del valor de dos muestras consecutivas y que aparecen físicamente entre ambas muestras al reconstruir la señal analógica. Aunque en un principio esos valores de tensión no aparezcan en el dominio digital, forman parte de la información de la propia señal digitalizada, y una vez que se vuelve al dominio analógico aparece por sí sola.

Realmente por picos entre muestras se podría pensar en cualquier valor de tensión que esté en medio de dos muestras adyacentes, sin embargo, el termino picos entre muestras es utilizado, cobrando un sentido especial, en aquellas situaciones en las que las muestras adyacentes posean un nivel tan alto de cuantificación, que en la reconstrucción del conversor DA puedan superar la tensión de referencia del conversor. En este punto es donde aparece el concepto de los dBFS+ como aquellos niveles de tensión en el dominio analógico, que son mayores al nivel de tensión asignado a los 0 dBFS, tensión de referencia del conversor, y que van a producir que el conversor sea incapaz de desarrollar la tensión suficiente para estos valores de dBFS+, recortando y distorsionando por tanto la señal reconstruida.

Básicamente estos dBFS+ se producen por dos razones:

  • En el muestreo de la señal analógica no coinciden los picos máximos de la señal con alguna de las muestras
  • Diferentes procesados digitales de la señal que directa o indirectamente produzcan un incremento del nivel de las muestras

En ambos casos el tratar de normalizar el valor de las muestras a 0 dBFS es lo que va a producir realmente la aparición de estos dBFS+, ya que de haber mantenido un margen de seguridad suficiente ninguno de los dos hechos anteriores hubiese generado dBFS+ por sí mismo.

Lund y Nielsen proponen dos soluciones para evitar los dBFS+

  • No apurar el valor de las muestras al techo de la escala, dejando un margen suficiente ( unos 3 dBs) para que los picos entre muestras del dominio analógico no supere el valor de tensión de referencia del conversor
  • Utilizar el sobremuestreo para anticiparse a los picos entre muestras, y una vez que se ha generado las nuevas muestras, entre las muestras adyacentes, observar su evolución y actuar sobre ellas. En este aspecto Thomas Lund propone dos sistemas nuevos basados en el sobremuestreo. El primero de ellos se trataría de un medidor de valor de pico real, en el cual utilizando el sobremuestreo el  medidor pueda anticipar en el dominio digital el valor real en dBFS (incluidos los dBFS+)  para cada instante de tiempo que tomaría la señal reconstruida en el dominio analógico. El segundo sistema recomendado por Lund y Nielsen, que también se basa en el sobremuestreo,  es un sistema de limitación por sobremuestreo, en el cual se limita el valor de las muestras, tratando de evitar niveles en muestras que potencialmente puedan generar dBFS+.

 

Conclusiones

En los últimos 15 años, y debido a la guerra de la sonoridad se han estado produciendo materiales sonoros que reproducidos en conversores DA de gama doméstica presentan una alta componente de distorsión. Pese a que la distorsión es clara en diferentes producciones musicales, el oyente se ha acostumbrado a este tipo de distorsión, dando por hecho que es parte del sonido del siglo XXI. Thomas Lund y Soren Nielsen, han constatado empíricamente algo que muchos especialistas de la masterización llevaban ya barruntándose hace años, y es que el tratar de llevar el material sonoro al máximo nivel de sonoridad implicaba que había algo que no terminaba de sonar bien. Algunos de estos especialistas, decidieron por si mismos bajar el techo de sus muestras hasta un nivel seguro (-3 dBFS) para dejarse un margen de salvaguarda. Otros especialistas decidieron seguir trabajando con su techo en 0 dBFS, acuciados por las ordenes del cliente que en un acto de total estupidez quería sonar más fuerte que nadie.

Existe literatura acerca de esta problemática, existe pruebas en forma de materiales sonoros comercializados que constatan el problema, es hora de poner una solución a este problema, del cual cada vez más parte de la comunidad de técnicos de sonido están al día del problema que presenta normalizar las muestras a 0 dBFS.

 

 

 

 

3 Comentarios

Dejar respuesta

Please enter your comment!
Please enter your name here