Artist System : Codificación

PÉRDIDA DE CALIDAD AUDITIVA Y PESO DE ARCHIVO

Los métodos de codificación de audio que existen en la actualidad se basan en algoritmos de compresión y en codificación multicanal.

Queremos ayudarte a ofrecer la mejor calidad auditiva en tus productos. Los algoritmos de compresión de audio se fundamentan en aspectos perceptibles al oído humano.

¿MP3, WAV, AIFF, AAC, FLAC...?

La curva de sensibilidad del oído y el fenómeno de enmascaramiento, son los fenómenos que han originado el estudio y los métodos de compresión:.

El oído humano detecta sonidos entre 20Hz y 20KHz. Pero su sensibilidad depende de la frecuencia del sonido, de esta forma, dos frecuencias con la misma potencia son interpretadas por nuestro oído de forma diferente, teniendo la sensación de que una es más fuerte que otra, o incluso, oír una y no la otra. La curva que indica cual es la potencia mínima (umbral) que nuestro oído detecta es la curva de sensibilidad:

Curva de sensibilidad (típica) del oído.

Podemos observar que nuestro oído es muy sensible a frecuencias entre 2 y 4KHz (aproximadamente). Además observamos que si la potencia de una cierta frecuencia no supera el umbral de la sensibilidad del oído, simplemente no la oiremos, por lo tanto no hace falta que la codifiquemos. Este es un primer paso en la compresión: eliminar las señales que no oiremos.

La mayor compresión de Audio

A principio del siglo, la gente se sorprendía al ver cómo de cilindros de cera se reproducían música. Hoy en día, se dispone de un completo algoritmo de redundancia estadística y perceptual que hace lo mismo.

AAC (del inglés Advanced Audio Coding)

Formato informático de señal digital audio basado en un algoritmo de compresión con pérdida, un proceso por el que se eliminan algunos de los datos de audio para poder obtener el mayor grado de compresión posible, resultando en un archivo de salida que suena lo más parecido posible al original.

AIFF (del inglés Audio Interchange File Format)

El estándar AIFF es uno de los formatos líderes, junto a SDII y WAV, usados a nivel profesional para aplicaciones de audio ya que, a diferencia del conocido formato con pérdidas MP3, éste formato está comprimido sin ninguna pérdida, lo que ayuda a un rápido procesado de la señal pero con la desventaja del gran espacio en disco que supone: alrededor de 10MB para un minuto de audio estéreo con una frecuencia de muestreo de 44.1kHz y 16 bits. Además el estándar da soporte a bucles para notas musicales para uso de aplicaciones musicales o samplers.

WAV (del inglés Waveform Audio File Format)

Formato de audio digital normalmente sin compresión de datos desarrollado y propiedad de Microsoft y de IBM que se utiliza para almacenar sonidos en el PC, admite archivos mono y estéreo a diversas resoluciones y velocidades de muestreo, su extensión es .wav.

FLAC (del inglés Free Lossless Audio Codec)

Códec de audio que permite que el audio digital sea comprimido sin pérdidas de tal manera que el tamaño del archivo de audio se reduce sin que se pierda ningún tipo de información. El audio digital comprimido por el algoritmo de FLAC típicamente se puede reducir de 50 a 60% de su tamaño original, 3 y se descomprime en una copia idéntica de los datos de audio originales. La desventaja es que el archivo ocupa mucho más espacio del que se obtendría al aplicar un algoritmo de compresión con pérdida.

FLAC es un formato abierto con licencia libre de regalías y una implementación de referencia la cual es software libre. FLAC cuenta con soporte para etiquetado de metadatos, inclusión de la portada del álbum, y la búsqueda rápida.

MPEG 1 Layer III Audio

Las siglas MPEG significan Moving Picture Experts Group, lo que traducido viene a ser más o menos: Grupo de Expertos de Películas en Movimiento. Detrás de esta asociación no se esconde otra cosa que un organismo que intenta estandarizar la compresión de video y audio según una norma única y universal. En el caso del MPEG layer III, se desprecia el video y se emplea sólo el audio.

MP3 aprovecha determinadas redundancias estadísticas y perceptibles al oído humano, de todos es conocido el popular formato de archivos graficos JPEG, que ofrece una compresión sin igual de fotografías a cambio de una cierta pérdida de calidad. En esencia, MP3 (que es forma abreviada de MPEG Layer III) hace lo mismo con los archivos de audio.

Funcionamiento Interno

Las bases matemáticas internas del MP3 son extremadamente complejas. Se puede expresar de forma simplificada diciendo que la compresión se produce debido a que el algoritmo MP3 aprovecha determinadas redundancias estadísticas y perceptibles al oído humano para reducir la cantidad de información que hay que comprimir.

Los archivos MP3 se componen de una seria de tokens, que son pequeños grupos de datos que representan un conjunto de información mayor y previamente establecido. Lo más importante que destaca el formato MP3 es que el método de compresión produce pérdidas. Es decir, cuando se reproduce el archivo comprimido, el resultado no es idéntico a la grabación original. Cuando mayor es el factor de compresión aplicado, tanto más se nota la reducción de la calidad.

A cambio, es posible colocar en un diskette de 1.4 Mb. Unos 15 minutos de música con una calidad equivalente a la que se escucha por un auricular de teléfono.

Un segundo de música de calidad CD es estéreo ocupa 176,400 bytes en un CD de audio, o un archivo WAV. Una canción de cuatro minutos acaba por necesitar 42,336,000 bytes en el disco. Esta misma canción comprimida con MP3 ocupa unos 3,500,000 bytes, 12 veces menos. De modo que, en teoría, es posible colocar 12 CDs de música en uno solo, si se graba en formato MP3. Esto se logra mediante lo que se llama Perceptual Audio Coding (Codificación perceptual de Audio). Este método se basa en el mecanismo y limitaciones del oído humano al oír música.

info@artistsystem.com


Suscríbete a nuestro listado.
Recibe notícias, promociones y ofertas exclusivas a tu email.

Regístrate