Tecnología 101

Principios de Audio Digital, Primera parte

¡Hola!

En ésta edición de Tecnología 101 empezaré a desenredar los conceptos básicos sobre el audio digital.

Comencemos por definir de manera empírica lo que es el Audio. ¿Qué es? ¿Por qué escuchamos un sonido? Como todos sabemos de una u otra forma, el audio es la representación eléctrica de una onda sonora.


Entonces ¿qué es el audio digital? Es la representación digital de una señal de audio, captada por un convertidor analógico-digital y transformada en unos y ceros. La fidelidad de la representación digital de una forma analógica, depende entonces de la cantidad de información captada y es medible, entre otras características, por la famosa resolución en bits (bit depth) y la frecuencia de muestreo (sample rate).

 -

La resolución en bits no define la "calidad" de audio por sí sola. Los BITS nos hablan sobre la cantidad de INFORMACION (¡la que sea!) que se capturará en un dispositivo por unidad de tiempo, definida por la frecuencia de sampleo.

Entonces, una mayor frecuencia de Muestreo, considerando que aquí estamos hablando del rango de frecuencias que capta el oído humano (y un sistema de grabación) SI nos habla directamente del contenido musical/armónico de una señal, por lo que mientras más alta sea, más frecuencias y sus armónicos y subarmónicos capturará nuestro conversor.

Hablando sobre Bits

Un Bit es la unidad más elemental de un sistema digital. Su valor puede ser únicamente 1 ó 0 y corresponde a un voltaje en un circuito electrónico. Los BITS son usados para representar valores en el sistema binario los cuales en el mundo digital del sampling, son usados para representar los valores de los sonidos muestreados.

En el mundo del audio digital, entonces la Resolución en Bits de un sistema es descrita como su exactitud potencial para representar una onda de audio grabada o procesada por unidad de tiempo. Cada bit representa incrementar en 6 dB el rango dinámico de nuestra señal, por lo que 16 bits representan 96 db. 24 Bits representa la posibilidad de grabar con un rango dinámico de 144 db.

Siendo un cálculo basado en una potencia de 2, es decir 2^n, cada BIT aumentado en una resolución DUPLICA la resolución anterior, por lo que 17 bits son el doble de la resolución a 16, 18 representa 4 veces y 20 bits son 16 veces más que una resolución a 16. ¿Adivinen cuántas veces más son 32 bits contra 16 bits ? = ¡¡ 65,536 veces !!

1 bit = 2^1 = 2 valores (0 y 1)
2 bits = 2^2 = 4 valores (00, 01, 10, 11)
3 bits = 2^3 = 8 valores (000, 001, 010, 011, 100, 101, 110, 111)
4 bits = 16 valores ....
5 bits = 32 valores ....
6 bits = 64 valores.....
...
...
...
16 bits = 2^16 = 65,536 valores

Y entonces, ¡cuál es la diferencia entre 16 y 24 bits? ¿solo 8 bits? no... hagan el cálculo...

24 bits = 2^24 = 16,777,216

… o sea, se captan 256 veces más datos a 24 que a 16 bits.

Así que la cantidad de información muestreada por sample es más que significativamente mayor a 24 y a 32 bits, que a 16 y por ende nuestras grabaciones tendrán más fidelidad.

Hoy día, el estándar de grabación es a 24 bits y prácticamente todas las interfaces de M-Audio soportan ésta resolución.

Hablando sobre la Frecuencia de Muestro

Como base teórica, tomemos que el oído humano tiene un rango de escucha a frecuencias de entre 20 y 20 mil Hertz.

La frecuencia de muestreo (medida en Hertz) determina el límite máximo de ancho de banda de audio a ser digitalizado (es decir, el espacio en que acomodarás los datos) y el número de bits en cada sample determina el rango dinámico teorético MAXIMO a pesar de la frecuencia de muestreo (es decir, la calidad o resolución de cómo se graban los datos).

Cuando los conversores analógico/digital codifican una señal de audio, lo hacen a una determinada velocidad. Imaginen una película de cine, que toma fotografías a cierta velocidad. Al reproducir las fotografías (samples), se verá el movimiento (sonido).

La velocidad es la frecuencia de muestreo (sample rate), que será determinada por cantidad de muestras ("fotos") por segundo. Recordemos, que Hertz es una unidad que representa ciclos por segundo.

Esta velocidad determina cuál es la frecuencia más aguda que se puede muestrear... ¿cómo?

… Entra el Teorema de NyQuist

Para reproducir una señal tiene que haber un valor positivo y otro negativo (o sea 2 samples, al menos). La Teoría de NyQuist dice que la frecuencia MAS AGUDA que será capaz de codificar o reproducir un conversor es LA MITAD DE SU FRECUENCIA DE MUESTREO (porque necesita 2 samples...)

Es decir:

A 44.1 Khz., la frecuencia más aguda que podré grabar es 22.05 Khz. (límite del oído humano).
A 96 Khz., la frecuencia más aguda será 48 Khz.
A 22.05 Khz. la frecuencia será 11 Khz. (se notará mucho la pérdida de agudos).

Entonces:

Frecuencia de NyQuist (más aguda) = 1/2 frecuencia de muestreo (sample rate)

Ah, si, un Sample es un número que indica la amplitud de una onda de audio medida sobre el tiempo, por lo que la frecuencia de muestreo es el número de samples por segundo usados para guardar un sonido.

 -

Conclusiones Parciales

En el mundo del audio digital, como en todo lo relacionado con computadoras, la única ley dice: “Mayor es Mejor”. Mayor RAM, Mayor Procesamiento, Mayor Velocidad de Rotación, Más Bits, Mayor Frecuencia de Muestreo, etc. Sin embargo, después de haber repasado los conceptos básicos sobre bits y frecuencia de muestreo, nos quedará la primera gran incógnita, que ya hemos revisado con anterioridad, y es:

¿Por qué si escuchamos hasta 20 KHz nos esforzamos en crear convertidores con resoluciones hasta 96KHz y 192 KHz?

Porque esto reduce el error de alias (aliasing), que ocurre cuando la señal muestreada contiene energía en frecuencias mayores a las del Teorema de NyQuist (generando distorsión). Para evitarlo, los convertidores A/D poseen filtros que evitan este error. (filtros anti-aliasing) ya que al grabar a frecuencias supersónicas, el aliasing no es audible.

Por otro lado, hay que recordar que no escuchamos frecuencias específicas, sino un producto de su interacción, por lo que escuchar una señal con todos sus armónicos posibles (generalmente en instrumentos de cuerda encontrados dentro del rango supersónico) hará que su representación sea más fiel.

En el próximo número de M-Pulso hablaremos sobre el índice señal a ruido, los errores de cuantización y sobre el Dithering. Estén pendientes. 

¡Hasta la próxima!

Gus Lozada
Gerente de Soporte Técnico y Especialista de Producto
M-Audio Latinoamérica


Regreso a la página principal de M-Pulso


 

© 2007 M-Audio, Todos los derechos reservados.
M-Audio se encuentra en 5795 Martin Road en Irwindale, California 91706.