Seleccionar página


En este cuarto episodio por fin se me une el gran Tomás Manzanares. Con Tomás hablaremos de porqué hemos creado un grupo de Telegram para interactuar con la audiencia de Creapodcast. (Para acceder al grupo os teneis que apuntar a la mailing list de Creapodcast en el formulario de abajo). Y además haremos un repaso de los distintos formatos de archivos de audio.

Los archivos de audio vienen en todos los tipos y tamaños. Existen varios estándares que se usan en la industria y, como productor de podcasts, es importante conocer cuales son y comprender sus características y en que se diferencian.

Todos los formatos de audio se dividen en tres categorías principales. Cada una de estas categorías sirve a un propósito.

Además de estos formatos es posible que te encuentres con otras extensiones de archivos como WAV, CAF u otros tantos. Estos son

Formatos de audio :

– Sin comprimir: PCM, WAV, AIFF.
– Compresión con pérdida de calidad: MP3,  M4A, AAC, OGG, WMA
– Compresión sin pérdida de calidad: FLAC, ALAC, WMA Lossless.

Formatos de audio sin comprimir

El audio no comprimido es una representación directa de la onda de audio. Estos archivos mucho espacio en disco ( unos 34 MB por minuto para un estéreo de 24 bits a 96 KHz ) y consumen muchos recursos de sistema cuando los usas para edición o mezcla.

PCM

PCM significa Pulse-Code Modulation, una representación digital de señales de audio analógicas en bruto.  Los archivos PCM se caracterizan por la  “frecuencia de muestreo” (Sampling rate) y una “profundidad de bits” (cuántos bits se utilizan para representar cada muestra). No hay compresión involucrada, el formato PCM es lo que sale del proceso de digitalización de audio analógico.

PCM es el formato de audio más común utilizado en CD y DVD. Existe un subtipo de PCM denominado modulación de código de impulsos lineal, donde las muestras se toman a intervalos lineales. LPCM es la forma más común de PCM, por lo que los dos términos son casi intercambiables en este punto.

WAV

WAV significa formato de archivo de forma de onda (Waveform). Es un estándar que fue desarrollado por Microsoft e IBM en 1991. Mucha gente supone que todos los archivos WAV son archivos de audio sin comprimir, pero eso no es exactamente así. WAV es en realidad solo un contenedor de Windows para formatos de audio. Esto significa que un archivo WAV puede contener audio comprimido, pero rara vez se usa para eso.

La mayoría de los archivos WAV contienen audio sin comprimir en formato PCM. El archivo WAV es solo un contenedor para la codificación PCM, por lo que es más adecuado para su uso en sistemas Windows. Sin embargo, los sistemas Mac generalmente pueden abrir archivos WAV sin ningún problema.

AIFF

AIFF significa Audio Interchange File Format. Similar a cómo Microsoft e IBM desarrollaron WAV para Windows, AIFF es un formato que fue desarrollado por Apple para sistemas Mac en 1988.

También similar a los archivos WAV, los archivos AIFF pueden contener múltiples tipos de audio. Por ejemplo, hay una versión comprimida llamada AIFF-C y otra versión llamada Apple Loops que es utilizada por GarageBand y Logic Pro, y todas usan la misma extensión AIFF.

La mayoría de los archivos AIFF contienen audio sin comprimir en formato PCM. El archivo AIFF es solo un contenedor para la codificación PCM, por lo que es más adecuado para su uso en sistemas Mac. Sin embargo, hoy en día los sistemas de Windows generalmente pueden abrir archivos AIFF sin ningún problema.

Formatos de audio comprimido con pérdida de información.

La compresión de archivos es la base de la web moderna, podría argumentarse, porque nos permite compartir archivos (imágenes, video, audio) que de otra manera tardarían demasiado en transferirse.

La compresión con pérdida de información es una forma de compresión que pierde datos durante el proceso de compresión. En el contexto del audio, eso significa sacrificar la calidad y la fidelidad para minimizar el tamaño del archivo. De la misma forma que los archivos JPEG sacrifican un poco de calidad y fidelidad respecto a la imagen original para reducir tamaño, los archivos de audio comprimido con perdida como los MP3 aplican esta misma técnica.

La buena noticia es que, en la mayoría de los casos, no podrás escuchar la diferencia. Sin embargo, si el audio se comprime demasiado comenzará a escuchar “artefactos” y otras rarezas que se vuelven más y más notables.

MP3

MP3 significa MPGEG layer 3, se trata de la tercera capa del estándar de video MPEG. Inicialmente no se diseño como formato de audio sino como la capa de audio para acompañar al formato de video MPG.  El formato MP3 fue lanzado en 1993 y rápidamente explotó en popularidad, convirtiéndose finalmente en el formato de audio más popular en el mundo para archivos de música, especialmente en 1999 con el lanzamiento del software Naptser que permitía compartir archivos MP3 entre pares.

¿Cómo comprime MP3?

Como ya explicamos toda onda se puede representar como una suma infinita de ondas armónicas, cada una con su propia frecuencia. Esta representación se conoce como la transformada de Fourier. Nuestro oido funciona de forma parecida, podríamos decir que escuchamos cada frecuencia por separado.

El formato MP3 usa esta representación matemática de la onda de sonido.  Para reducir el tamaño elimina las frecuencias fuera del rango de audición típico de los humanos (de 20 Hz a 20 Khz), reduciendo la calidad de los sonidos más sutiles, y luego comprime todos los demás datos de audio de manera muy eficiente.

Casi todos los dispositivos digitales en el mundo con reproducción de audio pueden leer y reproducir archivos MP3, ya sea que se trate de PC, Mac, Androids, iPhone, Smart TV o cualquier otra cosa.

Los archivos MP3 pueden estar más o menos comprimidos, cuando generamos un fichero MP3 debemos estipular el ratio de compresión estipulando el número de bits por segundo en Kilo Bits per Seccond (Kbps). O sea, el número de bits que usa el archivo para codificar un segundo de sonido. Un MP3 de alta calidad de sonido suele usar 320 kbps, mientras que uno muy comprimido usará menos de100 kbps. Por ejemplo yo produzco mis podcasts a una compresión que da una calidad de sonido para un programa hablado y me sigue aportando bastante compresión: 160 Kbps estéreo, lo que significa que para un minuto de sonido estéreo uso 160.000 bits o 20 KBytes. Así pues un podcast de 1 minuto usa  20 KiloBytes de disco.

AAC

AAC significa Codificación Avanzada de Audio. Fue desarrollado en 1997 como el sucesor del MP3, y si bien se popularizó bastante, nunca superó al MP3 en uso. El algoritmo de compresión utilizado por AAC es mucho más avanzado que el MP3, por lo que cuando se compara una grabación en particular en formatos MP3 y AAC con la misma velocidad de bits, la AAC generalmente tendrá una mejor calidad de sonido.

AAC es ampliamente utilizado en la actualidad. De hecho, es el método de compresión de audio estándar utilizado por YouTube, Android, iOS e iTunes.

Encontramos la codificación AAC en archivos de extensión AAC o M4A.

OGG (Vorbis)

OGG no representa nada. En realidad, ni siquiera es un formato de compresión. OGG es un contenedor multimedia que puede contener todo tipo de formatos de compresión, pero que se usa más comúnmente para almacenar archivos Vorbis, de ahí que estos archivos de audio se denominen archivos Ogg Vorbis.

Vorbis se lanzó por primera vez en 2000 y creció en popularidad por dos motivos: es un estándar re software libre y  tiene un rendimiento significativamente mejor que la mayoría de los otros formatos de compresión con pérdida (es decir, produce un tamaño de archivo más pequeño para una calidad de audio equivalente).

MP3 y AAC tienen promotores tan fuertes en la industria que OGG ha tenido dificultades para entrar en el centro de atención, no muchos dispositivos lo admiten de forma nativa.

WMA

WMA significa Windows Media Audio. Fue lanzado por primera vez en 1999 y ha tenido varias evoluciones desde entonces, todo manteniendo el mismo nombre y extensión de WMA. Como era de esperar, es un formato patentado creado por Microsoft.

Al igual que AAC y OGG, WMA estaba destinado a mejorar en el método de compresión MP3, y como tal, el enfoque de compresión de WMA es bastante similar al de AAC y OGG. En otras palabras, en términos de calidad objetiva, WMA es mejor que MP3 y equivalente a AAC y OGG.

Formatos de audio con compresión  sin pérdida

La compresión sin pérdidas es un método que reduce el tamaño del archivo sin ninguna pérdida de calidad entre el archivo fuente original y el archivo resultante. La desventaja es que la compresión sin pérdida no es tan eficiente como la compresión con pérdida, lo que significa que los archivos equivalentes pueden ser de 2 a 5 veces más grandes.

FLAC

FLAC significa Free Lossless Audio Codec. Se ha convertido rápidamente en uno de los formatos sin pérdida más populares disponibles desde su presentación en 2001. Lo bueno es que FLAC puede comprimir un archivo fuente original hasta en un 60% sin perder información. Lo que es aún mejor es que FLAC es un formato de código abierto y libre de regalías (royalties) en lugar de uno de propiedad exclusiva, por lo que no impone ninguna restricción de propiedad intelectual.

FLAC es compatible con la mayoría de los principales programas y dispositivos y es la principal alternativa a MP3 para audio de CD. Con él, básicamente obtienes la calidad completa del audio usando la mitad del tamaño de archivo.

ALAC

ALAC significa Apple Lossless Audio Codec. Fue desarrollado y lanzado en 2004 como un formato propietario, pero finalmente se convirtió en código abierto y libre de regalías en 2011. Algunas veces se hace referencia al ALAC como Apple Lossless.

Si bien ALAC es bueno, es ligeramente menos eficiente que FLAC cuando se trata de compresión. Sin embargo, los usuarios de Apple no tienen realmente una opción entre los dos porque iTunes e iOS brindan soporte nativo para ALAC y ningún soporte para FLAC.

WMA Lossless

WMA significa Windows Media Audio. Lo cubrimos arriba en la sección de compresión con pérdida, pero lo mencionamos aquí porque hay una alternativa sin pérdida llamada WMA Lossless que usa la misma extensión.

Comparado con FLAC y ALAC, WMA Lossless es el peor en términos de eficiencia de compresión, pero solo levemente. Es un formato patentado por lo que no es bueno para los fanáticos del software libre, pero es compatible de forma nativa con sistemas Windows y Mac.

 

A %d blogueros les gusta esto: