¿Por qué un CD tiene esa capacidad, y no otra?
A raÃz de una interesante conversación sobre muestreo de señales que mantuve con AgustÃn terminé de encajar las piezas de un asunto que lleva mucho tiempo interesándome: el porqué de la capacidad de los CD-ROM. Ya que para comprender la explicación es preciso conocer algunos conceptos, los iré intercalando conforme vaya haciendo los cálculos.
Por un lado, la frecuencia máxima que puede captar el oÃdo humano es de, aproximadamente, 20kHz. Por dejar un poco más de margen, a la hora de grabar un sonido la frecuencia se extiende hasta los 22kHz. Es decir, que en un mp3 existen sonidos que no somos capaces de oÃr, pero nuestro perro sÃ.
22 kHz = 22000 Hz
Según el teorema de muestreo de Nyquist-Shannon, fundamental en las telecomunicaciones, a la hora de muestrear una señal (esto es, tomar valores de la señal) es necesario que la frecuencia de muestreo sea el doble que la de la onda a reconstruir. Es decir, que si queremos muestrear una onda de 100Hz, la frecuencia de muestreo ha de ser de al menos 200Hz.
22000 Hz * 2 = 44000 Hz
El siguiente paso al del muestreo es el de la cuantificación y codificación, o conversión de los valores continuos en valores discretos. Básicamente, este proceso consiste en atribuir a cada valor medido un valor finito. Por poner una analogÃa, se tratarÃa de algo similar a lo que ocurre con los colores: si bien en el arcoiris existen infinidad de colores, cuando queremos expresar esos conceptos empleamos el lenguaje, que asigna a cada color, con cierta precisión, una palabra. Pues bien, con el muestro del Audio para CD ocurre lo mismo: se codifica en 16 bits o, lo que es lo mismo, existirÃan 216 colores diferentes de los que se podrÃa hablar por medio del lenguaje.
44000 Hz * 16 bits = 704000 bits/s
Sin embargo, estamos considerando una única medición, cuando sabemos que los CD tienen audio en estéreo. Por lo tanto, en realidad se están realizando dos mediciones, una por cada canal (“altavoces” izquierdo y derecho).
704000 bits / s * 2 = 1408000 bits/s
Un byte son 8 bits, por lo que tras efectuar la siguiente operación obtendremos los bytes que ocupa un archivo de audio por cada segundo. PodrÃamos continuar sin esta división, pero por razones de comodidad es conveniente.
1408000 bits/s  /  8 = 176000 bytes/s
Ya que la cifra sigue siendo bastante elevada, procedemos a dividir la cantidad obtenida por 1000 para pasarlo a kilobytes / segundo. Algunos diréis que hay que dividir entre 1024, pero en ese caso estarÃamos hallando los kibibytes. Son valores muy similares, pero la diferencia es significativa.
176000 bytes/s / 1000 = 176 kB/s
La siguiente operación sirve para hallar cuántos kilobytes son necesarios por cada minuto de grabación.
176 kB/s * 60 = 10560 kB/min
Aquà viene un punto interesante: un CD de audio tiene una capacidad máxima de grabación de 74 minutos, un número para nada estándar. ¿A qué se debe esto? Pues bien, originariamente el CD se enfocó a un público culto con cierto nivel adquisitivo que tendrÃa preferencia por las obras de música clásica. Una de las piezas más trascendentales y, a la vez, de mayor duración de toda la historia de la música es la Novena SinfonÃa de Beethoven. La interpretación más larga de esta obra tuvo una duración de 74 minutos, por lo que la elección de esta cifra tuvo un sentido simbólico a la par que práctico: una hora y cuarto supuso un aumento importante respecto del cassette estándar, y fue un reclamo para el comprador potencial que, como se ha dicho, tendrÃa afición a los clásicos.
10560 kB/min * 74 min = 781440 kB
Finalmente, sólo resta obtener los megabytes por medio de otra división, para asà obtener el valor que se corresponde con el que aparece en esta tabla.
781440 kB / 1000 = 781.4 MB
Y de este modo hemos obtenido la capacidad máxima de un CD-ROM, o lo que ocuparÃa un archivo .wav de 74 minutos en nuestro disco duro.
noviembre 19th, 2011 at 8:50
(Aplausos)
(Más aplausos)
Sin duda alguna, esta entrada está entre las mejores que he leÃdo en tu blog
Por cierto, gracias por recordarme el teorema de Nyquist-Shannon. Lo di en 4º de carrera en ‘Arquitectura de redes’, la única asignatura que he suspendido más de una vez (la aprobé a la cuarta con un 9).
Ya sabes dónde será enlazada esta entrada
noviembre 22nd, 2011 at 0:36
Gracias Rafa! La verdad es que llevaba tiempo pensando escribir este post, pero únicamente con la curiosidad de Beethoven. Sin embargo, en cuanto me enteré de dónde salÃan los MB, pensé “Esta es la mÃa!”.
Vaya, se te resistió, eh?
Un saludo!
noviembre 22nd, 2011 at 15:47
Se me resistió porque tuve unos profesores muy competentes. Todo el cuatrimestre explicando teorÃa, y sólo hacen 3-4 problemas el último dÃa de clase. Después, el 70-80% del examen es de problemas, y el resto de cuestiones teóricas que en realidad son mini problemas.
Al final, aprobé porque estudié de forma autodidacta, si no todavÃa estarÃa liado con la asignatura…
diciembre 4th, 2011 at 10:35
Juanito, aquà tienes lo prometido:
http://elmundoderafalillo.blogspot.com/2011/12/no-es-mio-pero-es-interesante-xxxviii.html
Espero que te gusten las demás recomendaciones
octubre 29th, 2013 at 15:44
Agradezco el esfuerzo pedagógico de tu entrada, pero lo siento,,el cálculo de la capacidad de un CD no es tan sencillo. Tu artÃculo esta bien para clarificar conceptos, pero lleno de imprecisiones. Supongo que no te has querido complicar (con las estratégias para corrección de errores que lleva un CDA); sin embargo, no te hubiera costado nada hacer tu cálculo con los 44,1 KHz que es la frecuencia de muestreo real del formato CDA.
Un saludo
noviembre 26th, 2013 at 2:39
Hola sidisamu:
Escribà hace más de dos años esta entrada, me temo que por aquel entonces no sabrÃa cómo calcular los errores. En cuanto a los 44.1kHz sÃ, podrÃa haberlos incluido, pero por lo que fuera puse 44 (imagino que para que la introducción fuera más sencilla). De todos modos el cálculo es meramente orientativo.
Gracias por señalarlo!!