| Tecnología 101
Principios de Audio Digital, Primera parte
¡Hola!
En ésta edición de Tecnología 101 empezaré a desenredar
los conceptos básicos sobre el audio digital.
Comencemos por definir de manera empírica lo que es el Audio. ¿Qué es? ¿Por
qué escuchamos
un sonido? Como todos sabemos de una u otra forma, el audio es la representación
eléctrica de una onda sonora.
Entonces ¿qué es el audio digital? Es la representación
digital de una señal de audio, captada por un convertidor analógico-digital
y transformada en unos y ceros. La fidelidad de la representación digital
de una forma analógica, depende entonces de la cantidad de información
captada y es medible, entre otras características, por la famosa resolución
en bits (bit depth) y la frecuencia de muestreo (sample rate).

La resolución en bits no define la "calidad" de
audio por sí sola. Los BITS nos hablan sobre la cantidad
de INFORMACION (¡la que sea!) que se capturará en
un dispositivo por unidad de tiempo, definida por la frecuencia
de sampleo.
Entonces, una mayor frecuencia de Muestreo, considerando que
aquí estamos hablando del rango de frecuencias que capta
el oído humano (y un sistema de grabación) SI
nos habla directamente del contenido musical/armónico
de una señal, por lo que mientras más alta sea,
más frecuencias y sus armónicos y subarmónicos
capturará nuestro conversor.
Hablando sobre Bits
Un Bit es la unidad más elemental de un sistema digital.
Su valor puede ser únicamente 1 ó 0 y corresponde
a un voltaje en un circuito electrónico. Los BITS son
usados para representar valores en el sistema binario los cuales
en el mundo digital del sampling, son usados para representar
los valores de los sonidos muestreados.
En el mundo del audio digital, entonces la Resolución
en Bits de un sistema es descrita como su exactitud potencial
para representar una onda de audio grabada o procesada por
unidad de tiempo. Cada bit representa incrementar en 6 dB el
rango dinámico de nuestra señal, por lo que 16
bits representan 96 db. 24 Bits representa la posibilidad de
grabar con un rango dinámico de 144 db.
Siendo un cálculo basado en una potencia de 2, es decir
2^n, cada BIT aumentado en una resolución DUPLICA la
resolución anterior, por lo que 17 bits son el doble
de la resolución a 16, 18 representa 4 veces y 20 bits
son 16 veces más que una resolución a 16. ¿Adivinen
cuántas veces más son 32 bits contra 16 bits
? = ¡¡ 65,536
veces !!
1 bit = 2^1 = 2 valores (0 y 1)
2 bits = 2^2 = 4 valores (00,
01, 10, 11)
3 bits = 2^3 = 8 valores (000, 001, 010, 011, 100,
101, 110, 111)
4 bits = 16 valores ....
5 bits = 32 valores ....
6 bits = 64 valores.....
...
...
...
16 bits = 2^16 = 65,536 valores
Y entonces, ¡cuál es la diferencia entre 16 y
24 bits? ¿solo 8 bits? no... hagan el cálculo...
24 bits = 2^24 = 16,777,216
… o sea, se captan 256 veces más datos a 24
que a 16 bits.
Así que la cantidad de información muestreada
por sample es más que significativamente mayor a 24
y a 32 bits, que a 16 y por ende nuestras grabaciones tendrán
más fidelidad.
Hoy día, el estándar de grabación es
a 24 bits y prácticamente todas las interfaces de M-Audio
soportan ésta resolución.
Hablando sobre la Frecuencia de Muestro
Como base teórica, tomemos que el oído humano
tiene un rango de escucha a frecuencias de entre 20 y 20 mil
Hertz.
La frecuencia de muestreo (medida en Hertz) determina el límite
máximo de ancho de banda de audio a ser digitalizado
(es decir, el espacio en que acomodarás los datos) y
el número de bits en cada sample determina el rango
dinámico teorético MAXIMO a pesar de la frecuencia
de muestreo (es decir, la calidad o resolución de cómo
se graban los datos).
Cuando los conversores analógico/digital codifican
una señal de audio, lo hacen a una determinada velocidad.
Imaginen una película de cine, que toma fotografías
a cierta velocidad. Al reproducir las fotografías (samples),
se verá el movimiento (sonido).
La velocidad es la frecuencia de muestreo (sample rate), que
será determinada por cantidad de muestras ("fotos")
por segundo. Recordemos, que Hertz es una unidad que representa
ciclos por segundo.
Esta velocidad determina cuál es la frecuencia más
aguda que se puede muestrear... ¿cómo?
… Entra el Teorema de NyQuist
Para reproducir una señal tiene que haber un valor
positivo y otro negativo (o sea 2 samples, al menos). La Teoría
de NyQuist dice que la frecuencia MAS AGUDA que será capaz
de codificar o reproducir un conversor es LA MITAD DE SU FRECUENCIA
DE MUESTREO (porque necesita 2 samples...)
Es decir:
A 44.1 Khz., la frecuencia más aguda que podré grabar
es 22.05 Khz. (límite del oído humano).
A 96 Khz.,
la frecuencia más aguda será 48 Khz.
A 22.05 Khz.
la frecuencia será 11 Khz. (se notará mucho
la pérdida de agudos).
Entonces:
Frecuencia de NyQuist (más aguda) = 1/2 frecuencia
de muestreo (sample rate)
Ah, si, un Sample es un número que indica la amplitud
de una onda de audio medida sobre el tiempo, por lo que la
frecuencia de muestreo es el número de samples por segundo
usados para guardar un sonido.

Conclusiones Parciales
En el mundo del audio digital, como en todo lo relacionado
con computadoras, la única ley dice: “Mayor es
Mejor”. Mayor RAM, Mayor Procesamiento, Mayor Velocidad
de Rotación, Más Bits, Mayor Frecuencia de Muestreo,
etc. Sin embargo, después de haber repasado los conceptos
básicos sobre bits y frecuencia de muestreo, nos quedará la
primera gran incógnita, que ya hemos revisado con anterioridad,
y es:
¿Por qué si escuchamos hasta 20
KHz nos esforzamos en crear convertidores con resoluciones
hasta 96KHz y 192 KHz?
Porque esto reduce el error de alias (aliasing), que ocurre
cuando la señal muestreada contiene energía en
frecuencias mayores a las del Teorema de NyQuist (generando
distorsión). Para evitarlo, los convertidores A/D poseen
filtros que evitan este error. (filtros anti-aliasing) ya que
al grabar a frecuencias supersónicas, el aliasing no
es audible.
Por otro lado, hay que recordar que no escuchamos frecuencias
específicas, sino un producto de su interacción,
por lo que escuchar una señal con todos sus armónicos
posibles (generalmente en instrumentos de cuerda encontrados
dentro del rango supersónico) hará que su representación
sea más fiel.
En el próximo número de M-Pulso hablaremos sobre
el índice señal a ruido, los errores de cuantización
y sobre el Dithering. Estén pendientes.
¡Hasta la próxima!
Gus Lozada
Gerente de Soporte Técnico
y Especialista de Producto
M-Audio Latinoamérica
|