Los 44100

2
279

Las masterclass, son unos sitios sorprendentes para aprender. Se crean unos vínculos entre los asistentes que propician que las conversaciones acerca del audio, fluyan por sí solas.

Hace unos días fue la masterclass de José María Rosillo, y nos lo pasamos de puta madre. Aparte de la masterclass, los allí presentes, estuvimos hablando de otros temas de audio y lo que más me sorprendió, es que el mundo del audio digital, sigue siendo aun un misterio. De aquella charla me apunté en mi cuaderno de notas mental, algunos temas de los que iré hablando poco a poco, pero hoy he pensado que quizás es un buen día para hablar de donde vienen los 44100 tan cotizados en el muestreo.

El adaptador PCM

Este maravilloso número, no es un número que venga del azar, es un número en concreto que se adoptó como referencia en los principios de la era del audio digital. En sus comienzos, mediados de los 70, surgió una problemática entorno al almacenamiento del audio digital. Como por aquella época estaba empezando a despegar todo el audio digital, no existía grabadores específicos, así que lo que tuvieron que hacer es modificar parte de la circuitería de los magnetoscopios profesionales y además añadir un equipo más que se denomino PCM Adaptor, para de esta forma poder almacenar tramas digitales.

Un magnetoscopio es en sí mismo un vídeo, pero ¿en que consiste un PCM adaptor?. Bueno pues era un equipo intermedio, que se usaba junto al magnetoscopio, formaban un tandem, que se usaban juntos como se verá a continuación. Primero quiero que le echéis un ojo a las ilustraciones siguientes, para que entendáis su funcionamiento

Bien, ahora que has visto los dibujos, podrás entender más fácilmente lo que te voy a explicar. Anteriormente he hablado de almacenar el audio en un magnetoscopio, pero eso no es tan fácil como llegar y enchufar el micro al grabador. El magnetoscopio es efectivamente el lugar donde se va a almacenar el audio digital, pero el magnetoscopio graba señales de vídeo analógico, que no se parecen en nada a una trama de bits, así que se tendrá que adecuar la trama de bits al magnetoscopio donde se va a grabar. Desde luego en el magnetoscopio se realizaban algunas modificaciones para que fuese capaz de grabar estas tramas de bits, pero las modificaciones que se hacían eran bastantes simples, no siendo suficientes para poder grabar en digital directamente señales analógicas.

En el caso de querer grabar una señal de audio analógico, en un formato digital directamente usando un magnetoscopio, era necesario, modificar gran parte de su circuitería. Surgieron entonces dos posibilidades o bien hacer un grabador de audio digital empleando para ello un magnetoscopio, en el cual se rediseñaba gran parte de su circuitería, o se podía crear un equipo intermedio, que lo que hiciese es adaptar esta trama al magnetoscopio, sin tener para ello que modificar en gran medida los magnetoscopios. Se decidió crear este equipo intermedio, y así los magnetoscopios fabricados en la época, se podían seguir usando para grabar vídeo analógico o tramas de audio digital, haciendo unas pocas modificaciones y usando este PCM adaptor. Posteriormente surgieron grabadores basados en vídeos que ya integraban los dos equipos en uno y que grababan audio analógico presentes en sus entradas, ¿os acordáis de los ADAT?Como podeés ver los dibujos, el PCM adaptor, se puede ver como una unidad de procesamiento externo tanto para grabación como reproducción, sus funciones principales son dos: convertir las señales de analógico a digital y de digital a analógico, y por otro lado adaptar la señal digital a grabar en un soporte cuya circuitería está pensada para grabar señales de vídeo analógico

Veamos un poco más de cerca los bloques que lo conformaban.

  • Tanto en la parte de grabación como en la de reproducción, lógicamente el primer y el último paso, han de ser unos conversores, AD en el caso de la grabación y DA en el caso de la reproducción
  • En la parte de grabación un bloque en el cual se añade a la trama de bits de audio digitalizado, los bits redundantes que permitirán posteriormente una corrección de errores. En la parte de reproducción el bloque de detección y otro de corrección de errores a partir de los bits de redundancia y los bits de control.
  • Un bloque de codificación de canal, que aunque no aparece en el esquema, adecuaba la forma de la trama de bits, al soporte donde se va a almacenar

 

¿Porque usar un vídeo para grabar audio?

Una vez que se tenía el magnetoscopio modificado y se había incluido el PCM adaptor, ya estábamos en condiciones de usar estos magnetoscopios para grabar audio digital. ¿Pero porque usar estos magnetoscopios? Pues por la simple razón de que estos magnetoscopios eran capaces de grabar señales de vídeo analógico. Las señales basadas en vídeo analógico en sistemas como el PAL o el NTSC eran diseñados para grabar señales con un ancho de banda de hasta 6 MHz, ancho de banda más que suficiente para grabar la trama de bits que salía del adaptador PCM, cuyo ancho de banda no solía ser mayor de 2 MHz (4 Mb/s), como más adelante se podrá ver. En resumen, las señales de vídeo analógico, son señales con mucha más información que las señales de audio digital, haciendo de estos magnetoscopios la primera aproximación a grabar audio digital.

Los 44100

La única premisa que se debía cumplir en todo este proceso, es que el sistema fuese capaz de grabar al doble de la frecuencia de Nyquist, que como todos sabemos, en audio, coincide con el rango humano de audicion, 20 KHz, por lo tanto la frecuencia de muestreo y por tanto de grabación, debía ser al menos de 40.000 muestras por segundo. Bueno, pues voy a hacer una serie de cálculos para que entendáis de donde vienen estos 44100.

La señal PAL que se emplea en un gran cantidad de países, se caracteriza por tener 625 líneas en horizontal, un formato de 4/3, y un total de 25 fotogramas por segundo. Pero estas lineas horizontales, no son útiles todas, sino que algunas se empleaban como líneas de borrado. Estas líneas de borrado por la forma en las que se usaban, no se podían utilizar para almacenar muestras de audio, así que había que desecharlas del computo total. El número de líneas de borrado son 37, y si restamos a las 625 líneas las 37 líneas de borrado, obtenemos un total de 588 líneas activas, o líneas con información de vídeo propiamente dicha. En vertical, al tener 588 líneas activas, y un formato de 4/3, tendremos un total de 782 líneas, pero esto nos importa menos.

Bien, con 588 líneas y 25 fotogramas por segundo, obtenemos un total de 14700 líneas por segundo, con lo cual, si guardamos una muestra de audio digital por línea, solo vamos a tener 14700 muestras por segundo, con lo cual no se verifica Nyquist. ¿Cual es la solución? pues meter más muestras por línea. Supongamos que metemos dos muestras por línea, entonces nuestro número de muestras por segundo sería las 14700 líneas por segundo, por dos muestras por línea, que son 29.400 muestras por segundo, que tampoco verifica Nyquist. Pues nada, probemos con tres muestras por línea, si metemos tres muestras por línea, y tenemos 14700 líneas por segundo, el resultado es que en un segundo tendremos 44100 muestras. Biinggooooo!!!! Efectivamente, las 44100 muestras por segundo sí verifican Nyquist, así que adoptaron ese número como el número mágico del muestreo, que equivale a meter tres muestras de audio digital, en cada una de las líneas del vídeo analógico.

En los sistemas que se basan en NTSC, la cosa es exactamente igual, solo que en vez de tener 625 líneas, tienen 525 líneas, y en vez de ser sistemas de 25 fotogramas por segundo tienen 30. Tras eliminar las pertinentes líneas de borrado, y hacer la misma operación de antes, cuando llegamos a introducir tres muestras por línea, el resultado es 44056 muestras por segundo, que fue el estándar usado en países con magnetoscopios NTSC.

Haciendo números

De momento solo he hablado de muestras en sí, pero lo usual cuando se graba audio digital, en diferentes soportes es grabar los bits serializados correspondientes a cada una de las muestras, junto con algunos otros bits, utilizados en la trama, con el fin de llevar información de la trama, sistemas de detección y corrección de errores, etc… hagamos un cálculo muy simple, supongamos muestras de 16 bits, que era lo habitual de aquella época. Si grabamos a una velocidad de 44100 muestras por segundo, con 16 bits por muestra y grabando dos canales a la vez, el flujo binario es de 1.411.200 bits/segundo. Esta tasa de bits solo se refiere a bits de audio propiamente dichos, lo cual supone un ancho de banda de aproximadamente de 700 KHz. En el caso de usar un magnetoscopio PAL, sin limitaciones, el ancho de banda máximo permitido es de 6 MHz en el caso de usar un magnetoscopio U-Matic como los BVU, que eran los usuales para grabar en aquella época esta trama de audio digital,  permitían sin ningún problema grabar el ancho de banda requerido por la señal de audio digital.

Con este dato de los 1,411 Mb/s, no trataba de asustaros, simplemente quería hacer énfasis en la cantidad de datos que se usan además de los de audio propiamente dichos. Para hacer los sistemas más inmunes frentes a errores, se usan diferentes tipos de datos junto a la señal propiamente digitalizada, como pueden ser bits de redundancia, de chequeo, bits propios de información o códigos de canal propios de cada soporte y cuyo fin, es conseguir que el flujo binario se adapte al soporte en el que se va a registrar de la forma más optima. Estos códigos de canal, generalmente incrementan el flujo binario, al igual que los bits redundantes para la corrección de errores.

En el manual de un equipo que os he puesto al final, se puede ver que el flujo binario es de 2.625 Mb/s, con una probabilidad de recuperar errores del 99.995%. Si restamos esos 2.625 Mb/s de los 1.411 Mb/s, el resultado es que 1.214 Mb almacenados cada segundo, son empleados para el sistema de corrección de errores. Casi la mitad de los bits pertenecen a la corrección de errores. Pero existen otros sistemas en los cuales el régimen binario puede subir fácilmente hasta 3.8 Mb/s (1.9 MHz), es decir se almacenan más bits redundantes, que los bits propiamente de la señal de audio

Los 48000

Un último apunte antes de terminar, ya que también se asomo los 48000 en la masterclass. Esta velocidad de muestreo no se desarrolló tratando de buscar una mejoría a los 44.100, de hecho la mejorií es inapreciable. Los 48.000 surgieron como la frecuencia de muestreo a la que los DAT grababan sus entradas digitales. Esta frecuencia de muestreo se adoptó así, como medida de seguridad para que no se pudiera copiar los CDs, que trabajan a 44100. Esto es gracioso, porque lo mismo que cuando los castores, construyen un dique, al final el río acaba desviandose por otro lado, el hecho de poner una limitación a la hora de conseguir que no se pirateasen CDs, con el uso de DATs, o entre los propios DATs con el bit anticopia, no consiguió por sí mismo frenar la piratería. Si los que parieron los 48.000 hubiesen sabido lo que internet iba a suponer para el pirateo de música 30 años después, ni se hubiesen molestado en parirlo

Por lo demás poco mas que añadir…. os dejo un documento, por si le queréis echar un vistazo

Sharp-Optonica – RX-1 – PCM Digital Audio Adaptor (user’s manual)

 

2 Comentarios

  1. Gran artículo, como siempre…!, la verdad es que muchas veces me había preguntado por la procedencia de los 44100…

    Estuve en la masterclass y sí que lo pasamos muy bien!, un fantástico e intenso fin de semana…

    • Lo realmente acojonante, es que hasta que se llegó al consenso de los 44100, cada fabricante usaba diferentes frecuencias de muestreo, con lo cual fue una jodida locura.

      La masterclass estuvo genial, como a todas las que voy, me lo paso muy bien y conozco gente muy interesante. A ver si se organizan más y podemos coincidir más gente, que siempre nos los pasamos genial. Como digo siempre, debería estar pagando por hacer esto de Audioforo

Dejar respuesta

Please enter your comment!
Please enter your name here