nov 19 2011

¿Por qué un CD tiene esa capacidad, y no otra?

A raíz de una interesante conversación sobre muestreo de señales que mantuve con Agustín terminé de encajar las piezas de un asunto que lleva mucho tiempo interesándome: el porqué de la capacidad de los CD-ROM. Ya que para comprender la explicación es preciso conocer algunos conceptos, los iré intercalando conforme vaya haciendo los cálculos.

Por un lado, la frecuencia máxima que puede captar el oído humano es de, aproximadamente, 20kHz. Por dejar un poco más de margen, a la hora de grabar un sonido la frecuencia se extiende hasta los 22kHz. Es decir, que en un mp3 existen sonidos que no somos capaces de oír, pero nuestro perro sí.

22 kHz = 22000 Hz

Según el teorema de muestreo de Nyquist-Shannon, fundamental en las telecomunicaciones, a la hora de muestrear una señal (esto es, tomar valores de la señal) es necesario que la frecuencia de muestreo sea el doble que la de la onda a reconstruir. Es decir, que si queremos muestrear una onda de 100Hz, la frecuencia de muestreo ha de ser de al menos 200Hz.

22000 Hz * 2 = 44000 Hz

El siguiente paso al del muestreo es el de la cuantificación y codificación, o conversión de los valores continuos en valores discretos. Básicamente, este proceso consiste en atribuir a cada valor medido un valor finito. Por poner una analogía, se trataría de algo similar a lo que ocurre con los colores: si bien en el arcoiris existen infinidad de colores, cuando queremos expresar esos conceptos empleamos el lenguaje, que asigna a cada color, con cierta precisión, una palabra. Pues bien, con el muestro del Audio para CD ocurre lo mismo: se codifica en 16 bits o, lo que es lo mismo, existirían 216 colores diferentes de los que se podría hablar por medio del lenguaje.

44000 Hz * 16 bits = 704000 bits/s

Sin embargo, estamos considerando una única medición, cuando sabemos que los CD tienen audio en estéreo. Por lo tanto, en realidad se están realizando dos mediciones, una por cada canal (“altavoces” izquierdo y derecho).

704000 bits / s * 2 = 1408000 bits/s

Un byte son 8 bits, por lo que tras efectuar la siguiente operación obtendremos los bytes que ocupa un archivo de audio por cada segundo. Podríamos continuar sin esta división, pero por razones de comodidad es conveniente.

1408000 bits/s  /  8 = 176000 bytes/s

Ya que la cifra sigue siendo bastante elevada, procedemos a dividir la cantidad obtenida por 1000 para pasarlo a kilobytes / segundo. Algunos diréis que hay que dividir entre 1024, pero en ese caso estaríamos hallando los kibibytes. Son valores muy similares, pero la diferencia es significativa.

176000 bytes/s / 1000 = 176 kB/s

La siguiente operación sirve para hallar cuántos kilobytes son necesarios por cada minuto de grabación.

176 kB/s * 60 = 10560 kB/min

Aquí viene un punto interesante: un CD de audio tiene una capacidad máxima de grabación de 74 minutos, un número para nada estándar. ¿A qué se debe esto? Pues bien, originariamente el CD se enfocó a un público culto con cierto nivel adquisitivo que tendría preferencia por las obras de música clásica. Una de las piezas más trascendentales y, a la vez, de mayor duración de toda la historia de la música es la Novena Sinfonía de Beethoven. La interpretación más larga de esta obra tuvo una duración de 74 minutos, por lo que la elección de esta cifra tuvo un sentido simbólico a la par que práctico: una hora y cuarto supuso un aumento importante respecto del cassette estándar, y fue un reclamo para el comprador potencial que, como se ha dicho, tendría afición a los clásicos.

10560 kB/min * 74 min = 781440 kB

Finalmente, sólo resta obtener los megabytes por medio de otra división, para así obtener el valor que se corresponde con el que aparece en esta tabla.

781440 kB / 1000 = 781.4 MB

Y de este modo hemos obtenido la capacidad máxima de un CD-ROM, o lo que ocuparía un archivo .wav de 74 minutos en nuestro disco duro.