Formatos de audio: Todo lo que deberías saber


En esta entrada explicaremos brevemente el origen, uso y características de los formatos (códecs) de audio más utilizados en la actualidad.

Formato WAV (Audio original, sin comprimir)

En primer lugar vamos a hablar del formato WAV, que aunque es un formato de audio, es diferente al resto de formatos de los que hablaremos puesto que este es realmente un contenedor, que puede tener en su interior información comprimida o no. No obstante, se suele entender por WAV, el formato con los datos sin comprimir.

Los archivos WAV son los equivalente al formato RAW de la fotografía, lo que se denomina un formato «crudo». En este caso, se trata de un formato de Microsoft que recoge el audio de una forma muy aproximada y exacta al sonido real.

El formato WAV se caracteriza en que ocupa gran cantidad de espacio en disco(dependiendo de su duración, 5min = 50MB aproximadamente), lo que lo hace poco práctico para almacenar en disco, y mucho menos en dispositivos o reproductores portátiles donde el espacio es limitado.

Su ventaja es que la calidad de audio es muy fiel al original capturado, y que al ser un formato sin compresión, pueden realizarse operaciones de edición de forma muy rápida. La mayoría de programas de edición de sonido trabajan en este «formato crudo» (o alguno similar) de forma temporal, pasándolo a un formato comprimido sólo al guardarlo a disco.

Lossy vs Lossless

Ahora, y antes de continuar, hay que diferenciar entre dos tipos principales de formatos (que también ocurre en los formatos de imágenes, por ejemplo). Estos dos tipos son los denominados Lossy (formato con pérdidas) y Lossless (formato sin pérdidas).

  • Lossy (formato de audio con pérdidas): Es aquel formato que, a partir de un audio original, elimina toda la información irrelevante (sonido imperceptible por el oído humano, por ejemplo) y lo convierte en una aproximación bastante fiel a la original. Por eso se denomina un «formato con pérdidas». Su mayor ventaja: El tamaño del fichero es considerablemente más pequeño (depende de la calidad establecida al realizar la compresión). Su mayor inconveniente: Algunas personas son capaces de notar lareducción de calidad.
  • Lossless (formato de audio sin pérdidas): Por otra parte, los formatos lossless son un tipo de formato comprimido mediante el cual es posible recomponer y obtener exactamente el audio original sin ningún tipo de pérdida de información (cosa que no es posible con el anterior). Su mayor ventaja: La calidad de audio, es mucho más fiel. Su mayor inconveniente: El tamaño del fichero, que aunque es menor que el audio original, sigue siendo bastante superior a los formatos lossy.

Formatos lossy (con pérdidas)

Formato MP3 (Fraunhofer Institute, 1993)

El formato de audio más popular y que todos conocemos es el MP3. Al contrario de lo que muchos creen, MP3 no es MPEG-3, sino MPEG-1 Layer 3. Antes de llegar esta versión, se pasó por otros dos formatos: MPEG-1 Layer 1 (MP1) y MPEG-1 Layer 2 (MP2), ambos surgieron también en 1993 y evolucionaron muy rápidamente. MP3 fue el que obtuvo gran popularidad debido a su gran calidad de sonido, versatilidad, bajo tamaño debido a su compressión lossy (5min = 5MB, dependiendo de la calidad), y su rapidez de compresión/descompresión.

Hoy en día es soportado por prácticamente cualquier software relacionado con el audio, reproductor de música portátil o sistema relacionado con audio.

Los MP3 (así como otros formatos de audio) tienen varias características adicionales. Por ejemplo, dos de ellas:

  • El bitrate (tasa de bits): Es la calidad del MP3, un número que puede ir de 32kbps (calidad mínima, tamaño menor) a 320kbps (calidad máxima, tamaño mayor). Actualmente, se utilizan valores alrededor de 192kbps (o superiores) para garantizar una calidad aceptable.
  • El método de compresión CBRque define que todo el audio se comprime de forma constante, al mismo bitrate, o VBR, que define que el audio se comprime de forma variable, reduciendo el bitrate en los instantes en los que no es necesario tener bitrate alto.

Para los usuarios de Windows, en SourceForge tienen MP3ext una actualización para Windows 7 (incluido 64 bits) de este clásico programa que reemplaza los iconos de los MP3 por un icono con su bitrate.

Además, los archivos MP3 también permiten guardar metadatos ID3, que no es más que la posibilidad de guardar en el archivo de audio información relacionada: nombre de la canción, artista, género, descripción, carátula del disco, año, etc… Un buen programa para gestionar esto es MP3tag.

Aparecieron otros formatos derivados como Mp3Pro o MP3 Surround, pero nunca llegaron a extenderse tanto como el MP3 original.

Formato AC3 (Dolby Laboratories, 1993)

Una de las principales limitaciones de los MP3 eran los canales de audio, donde podías tener 1 canal (mono) ó 2 canales (estéreo).

Sin embargo, por aquel entonces el surround o sonido envolvente comenzaba a ponerse de moda, y el formato MP3 original no lo soportaba. Ahí entró en escena el formato AC-3, también llamado Dolby Digital que soportaba desde un solo canal (audio mono), dos canales (audio stereo), cuatro canales (audio cuadrafónico) y hasta canales 5.1 (audio surround).

Empezó a utilizarse (y hacerse popular) por su uso en los canales de audio de videos y películas que necesitaban 5.1 para el sonido envolvente. Posteriormente, otros formatos derivados comenzaron a soportar más canales, como Dolby Digital Plus (hasta 7.1) o Dolby TrueHD (hasta 8).

Formato WMA (Microsoft, 1999)

En el año 1999, Microsoft se subía al carro con el formato WMA (Windows Media Audio) que básicamente era la alternativa al MP3 de Microsoft, muy similar aunque mejorándolo en algunos aspectos. Poco más tarde, surgieron varios perfiles diferentes dentro de WMA:

  • WMA Pro: Soporte para múltiples canales (como AC-3) y mejorando sustancialmente su calidad de audio.
  • WMA Lossless: Un formato de compresión basado en compresión sin pérdidas, al contrario del resto de WMA, que es un formato de compresión con pérdidas (lossy).
  • WMA Voice: Por último, un formato más orientado a la grabación de audio para voz (speech), para utilizar en conversaciones de voz como las que usan Skype, WhatsApp u otros.

Una de las características más controvertidas del formato WMA es que introdujo soporte opcional para DRM (derechos de autor), lo que permite proteger audio con licencias y derechos de autor.

Formato AAC (Bell/Fraunhofer/Dolby/Sony/Nokia, 1997)

Otro formato que se utiliza muy frecuentemente, pero ha pasado relativamente desapercibido es el formato AAC, originalmente diseñado para ser el sucesor de MP3. Por este nombre, probablemente muchos no lo conocerán, pero es el formato de audio que utiliza Apple (muy probablemente porque al igual que WMA, soporta DRM) en iTunes o sus dispositivos, el famoso .M4A o el que se empezó a utilizar más adelante en los archivos de video de dispositivos móviles: .3GP.

Tiene varios tipos de perfiles, entre los que se encuentra AAC-LC (baja complejidad), HE-AAC(alta calidad) y HE-AACv2 (alta calidad mejorada).

Formato OGG (Xiph.org, 2000)

Con la llegada del año 2000, llegó un formato que acabó proclamado como el formato libre del MP3: OGG Vorbis. Aunque este formato empezó con extensión de archivo .OGG, con el tiempo también empezaron a usarlo para video (Theora), por lo que también es posible ver las extensiones .OGA (OGG Audio) y .OGV o .OGM (OGG Video/Movie), usándose OGG sólo para audio.

A parte de utilizarse como archivo de audio independiente, también se suele incorporar en archivos de video de formato Matroska o WebM para sus canales de audio.

Actualmente se utiliza en multitud de juegos, software o sistemas, por ser un formato mejor que el MP3 y equivalente a otros como AAC, pero sin los problemas de patentes o licencias.

Formato RA (RealNetworks, 1995)

Aunque hoy en día está prácticamente en desuso, merece mencionarlo por su trayectoria en el pasado. RealNetworks sacó su formato cerca de 1995, junto a su (personalmente, traumático) reproductor Real Player. Fue uno de los primeros formatos que permitían hacerstreaming (retransmisiones en vivo) tanto de audio como de video, aunque por aquella época las calidades de los mismos eran bastante pobres.

Hubo una época de transición tras 1997 en el que RealNetworks comenzó a integrar audio y video dentro de una misma extensión: .RM, pero poco después dió marcha atrás y volvió a adoptar las extensiones por separado.

Formato MPC (Andree Buschmann/Frank Klemm, 1997)

Originalmente llamado MPEG+, MusePack (MPC ó MP+) es un formato lossy que partió del códec de MP2, pero que fue incluyendo mejoras variadas y combinando características similares de otros formatos, como AAC, MP3 o APE.

Aunque el formato es bastante interesante y muchos programas lo soportan, no ha conseguido hacerse hueco en el mundo del audio. Utiliza licencia LGPL y BSD.

Formato Opus (Xiph.org, 2012)

Opus es un nuevo formato de audio lossy, con la particularidad de que dicho formato puede utilizarse tanto para compresión de audio tradicional como compresión de audio orientada a voz, que tiene unas características ligeramente diferentes: no se requiere tanta calidad de audio (pero si un tamaño reducido) y debe ser muy rápido, ya que se busca utilizar en operaciones de tiempo real, como VoIP para llamadas de voz.

Estamos por lo tanto, ante un formato que puede utilizarse para múltiples tareas, adaptándose a cada una de ellas a la perfección. Opus reemplazó al antiguo codec Speex, otro códec de audio orientado a voz, también de la fundación Xiph.org.

Formato AMR (3GPP, 1999)

Y ya que nos hemos metido en el tema de voz, merece también nombrar el formato AMR, que comenzó a utilizarse de forma masiva en los teléfonos móviles, sobre todo antes de dar el salto a los smartphones, cuando el espacio en dispositivos móviles era bastante limitado y se quería dotar de grabación de audio a estos dispositivos.

Las mencionadas grabaciones de voz eran guardadas en formato AMR (audio), mientras que los videos eran guardados en formato 3GP (video), el cuál guardaba el audio del video en formato AMR.

Con el tiempo, 3GP fue evolucionando, y pasó de utilizar AMR para audio a empezar a utilizarAAC, que los dotaba de mejor calidad y resultados.

Formatos lossless (sin pérdidas)

Formato FLAC (Xiph.org, 2001)

Dentro de los formatos de audio sin pérdida de compresión, uno bastante popular es el formato abierto FLAC. Como mencionamos anteriormente, este tipo de formatos losslesscomprimen la información de modo que es posible revertir esa compresión y volver a su estado original, funcionando de una forma similar a los formatos de compresión como ZIP(optimizada para audio), pero sin la necesidad de tener que descomprimirlo para escucharlo.

Formato APE (Matthew Ashland, 2000)

Antes de lanzarse FLAC, existía otro formato llamado APE, que funcionaba de la misma forma, realizando una compresión sin pérdidas del contenido de audio. Está mucho menos extendido y no ofrece un soporte completo para todas las plataformas, pero es otra alternativa a tener en cuenta, ya que da muy buenos resultados en compresiones sin pérdidas.

Formato WV (David Bryant, 2004)

Quizás con un nombre más acertado que los anteriores, WavPack (WAV empaquetado) es también un formato de compresión sin pérdidas, que permite reducir el tamaño de unarchivo WAV entre un 30% y un 70%, sin perder calidad.

A diferencia de otros formatos, WavPack ofrece un modo híbrido en el que genera dos archivos: un .WV (lossy) similar a un MP3, y otro formato .WVC (lossless), que unido al primero, pueden restaurar el archivo original, por lo que tenemos un formato lossy que a la vez es lossless.

Otros formatos

Dos formatos que se salen un poco de las categorías anteriores, ya que son previos a la revolución de los formatos de compresión de audio digital.

Formato MIDI (MMA, 1983)

El primero de ellos es el formato MIDI, que seguía un planteamiento totalmente diferente a los vistos hasta ahora. En aquellos años era impensable guardar el audio digital de canciones, ya que no existían métodos de compresión tan eficientes y la escasez de espacio en disco era un punto importante a considerar.

Así pues, los ficheros MIDI son algo así como una partitura: un formato que guarda las notas de cada instrumento de la canción (pudiendo reproducir hasta 16 canales a la misma vez). En cada canal se colocan las notas de un instrumento concreto (de los 128 instrumentos MIDI existentes). El sonido de estos instrumentos no se guarda en el propio archivo, sino que están realmente almacenados en el sistema operativo (o en el software de la tarjeta de sonido). De esta forma se consigue que los formatos MIDI estén entre los 4KB y los 200KB aproximadamente.

Aunque algo olvidados hoy en día (debido a los avances del audio digital), los archivos MIDI aún son utilizados en la actualidad en el sector del ocio, como por ejemplo en SCUMMVM, un emulador de aventuras gráficas clásicas donde puedes cargar bancos de sonido personalizados para mejorar la música de dichos juegos: Ejemplo de audio mejorado con Beneath a Steel Sky. En el artículo de SCUMMVM tienes más ejemplos.

Formato MOD (Karsten Obarski, 1987)

Por último, el formato MOD venía a dar una vuelta de tuerca a la idea del famoso formato MIDI, eliminando la limitación de tener que utilizar uno de esos 128 instrumentos. Con elformato MOD se guardaba el sonido del instrumento (sample) en pequeños archivos WAVdentro del propio archivo MOD. De esta forma se podían personalizar los instrumentos a utilizar y dotaba al formato de inmensas posibilidades.

Con estos formatos, componer música por ordenador se convirtió en una fiebre en la década de los 90, en las que se utilizaban los llamados trackers (programas para componer módulos de música) que a medida que fueron evolucionando, también lo hacían los formatos: MODXM (FastTracker II), S3M (Scream Tracker III) e IT (Impulse Tracker), fueron los más populares.

Descargar conversor entre formatos

Ahora, si lo que buscas es un programa para convertir entre diferentes formatos de audio o video, te puedo proponer varios, dependiendo de tu perfil de usuario:

  • Para los usuarios más avanzados, recomiendo utilizar ffmpeg, un potentísimo programa que permite convertir prácticamente cualquier tipo de formatos desde una línea de comandos:
Proyecto FFMPEG, el conversor más potente entre formatos
  • A los usuarios que no les gustan las terminales de línea de comandos, pueden utilizar Audio video to exe, un sencillísimo programa que permite convertir entre formatos de una forma muy simple, e incluso una curiosa función para generar archivos ejecutables que reproduzcan audio.
  • Finalmente, si realizas a menudo la tarea de convertir entre formatos de audio o video, y abrir un programa e ir seleccionando opciones es algo que te da mucha pereza, puedes utilizar Video (and audio) converter scripts, una colección de simples scripts preparados para arrastrar el archivo de audio o video sobre el conversor deseado y realizar la conversión así de fácil:
Video (and audio) converter scripts
Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s