|

| |
Ignacio García Santos
Fuente:
www.datosenlaweb.com
MP3 no sólo es un tipo de archivo común en plena época de apogeo. Tras él
hay años de investigación, su historia,
relación con los demás formatos, la digitalización del sonido y todos los
pasos necesarios y posibles para disfrutar de estos archivos.
Su origen y actualidad
Las siglas MP3 responden a la abreviatura de MPEG 1 Layer 3, que es un
alogaritmo de codificación perceptual. Este entre otros fue desarrollado por el
Moving Picture Expert Group (MPEG) (http://www.cselt.it/mpeg/)
junto con el Instituto Tecnológico de Fraunhofer (http://www.ipa.fhg.de/english/).
MPEG 1 no fue siempre el denominador de este sistema, antes de él se llamaba
Musicam. El cual fue la base para crear el MPEG 1 Layer 1 y 2. Pero debido a que
Musicam ya se encontraba registrado en varias partes del mundo, por distintas
empresas, se decidió que llevase el nombre de sus creadores. El formato MPEG es
una alternativa para el formato avi, como MP3 lo es para WAV.
Moving Picture Expert Group es un comité de investigación del ISO/IEC. El MPEG
está a cargo del desarrollo internacional de estándares de compresión,
descompresión, procesamiento y la representación codificada de películas,
audio y la combinación de ambas. Es una institución sin fines de lucro creada
en 1988, que reúne tres veces por año a trescientos (300) expertos de veinte
(20) países.
No solo a desarrollado el MPEG 1 Layer 1, 2 y 3 (1992) sino que también existen
el MPEG 2 (1994), MPEG 2.5, MPEG 4 versiones 1 (oct. 1998) y 2 (dic. 1999). Hoy
en día se encuentra en desarrollo el MPEG 4 versiones 3, 4 y 5, MPEG 7 y por
ultimo el MPEG 21.
A diferencia del MPEG 1 el MPEG 2 tiene en cuenta el sonido envolvente (surround)
y la extensión multilingüe. El MPEG 2.5 fue creado por el Instituto Fraunhofer
y a pesar de que no es una especificación ISO divide una segunda vez la
frecuencia de muestreo entre dos. Funciona bien para ciertas aplicaciones de
ancho de banda critico.
ISO (www.iso.ch) es la Organización Internacional de Estándares, que fue
establecido en 1947. La importancia de este organismo no gubernamental es
considerable ya que sus normas facilitan el intercambio internacional. Creando
así un denominador común entre las industrias de diversas regiones del mundo.
El organismo responsable de ello en la Argentina es el Instituto Argentino de
Normalización (IRAM) (www.iram.com.ar). Al cual se deberá acudir en caso de
buscar las normas ISO con respecto a estos formatos de audio, estas normas no
son gratuitas, de modo que representan el 80% de los ingresos del ISO; el 20 %
restante corresponde a publicaciones.
El MP3 fue adoptado como norma ISO en 1992 (IS - 11172 - 3) y (IS 13818 - 3). De
este modo se establecieron estándares de mercado e industria definidos para el
MP3.
Reteniendo el sonido
El MP3 es un sistema de compresión con perdida, por lo cual el sonido original
y el comprimido no son iguales. Pero las perdidas no deberían ser perceptibles
para el oído humano, de manera que no se tendría que notar la diferencia.
El sonido es una onda continua que se propaga a través del aire u otros medios,
formada por diferencias de presión, que pueden detectarse mediante la medición
de la presión en un punto determinado. Como se trata de una onda continua es
necesario un proceso de digitalización para representarla como una serie de números.
Hoy en día la mayoría de las operaciones realizadas sobre señales de sonido
son digitales y en menor medida se utilizan señales analógicas. Las señales
digitales poseen muchas ventajas sobre las analógicas, aunque por desgracia
esta requiere un ancho de banda mucho mayor que el de la señal analógica.
El proceso de digitalización se compone de dos etapas: muestreo y cuantizacion.
En el muestreo se divide el eje del tiempo en segmentos discretos; la frecuencia
de muestreo será la inversa del tiempo que haya entre una medida y la
siguiente. En estos momentos se realiza la cuantización, que, en su forma más
sencilla, consiste simplemente en medir el valor de la señal en amplitud y
registrarlo. El teorema de Nyquist garantiza que la frecuencia necesaria para
muestrear una señal que tiene sus componentes más altas a una frecuencia dada
f es como mínimo 2f. Por tanto, siendo el rango superior de la audición humana
en torno a los 20 Khz, la frecuencia que garantiza un muestreo ajustado a
cualquier sonido audible será de unos 40 Khz (el CD tiene 44.1Khz). Según el
fin que se tenga los valores pueden llegar a ser muy inferiores a estos. De
manera que la voz humana acostumbra fluctuar entre 6 y 20 Khz y en algunos casos
es menor. En cuánto a la cauntizacion se puede realizar una división a
intervalos iguales o según una determinada función de densidad. De manera que
haya mas resolución en determinados tramos. Este proceso es denominado PCM
(Pulse Code Modulación).
Cuantos menos bits se utilicen en el muestreo y la cuantizacion, mayor será el
ruido. Para evitar que el ruido sea excesivo hay que usar una mayor cantidad de
bits. Gran parte de esta información es innecesaria y ocupa un ancho de banda
del cual se podría dispensar, a costa de aumentar la complejidad del sistema
decodificador e incurrir en cierta perdida de calidad. Esto se logra mejor con
la cuantizacion a intervalos determinados por una función de densidad.
El rango de frecuencias que percibe el oído humano esta aproximadamente entre
los 20Hz y los 20kHz siendo este más sensible entre los 2Hz y 4Hz. De manera
que el sonido mientras más cerca este de a los extremos de la escala, mayor será
la dificultad audible del mismo.
La clave del éxito
Cuando se percibe una señal de un volumen alto (agudo o de mayor energía) en
una frecuencia y otra de volumen mas bajo (grave o de menor energía) en una
frecuencia cercana esta ultima no será audible. Este efecto se llama
enmascaramiento simultaneo o en frecuencia (también existe el enmascaramiento
asimultáneo o en el tiempo). Y a cierta distancia de la frecuencia
enmascaradora, el efecto se reduce tanto que resulta despreciable. El rango de
frecuencias en las que se produce el fenómeno se denomina banda critica (critical
band). La amplitud de la banda critica varia según la frecuencia en la que nos
situemos y viene dada por determinados datos que demuestran que es mayor con la
frecuencia. De esta manera se trata de desechar todo aquello que el oído humano
no podría captar.
Para aprovechar estas características se utiliza un sistema denominado
Codificación de Sub bandas o CBS (sub-band coding). Donde el MP3 es el ejemplo
más popular. En este proceso la señal original es descompuesta en sub bandas
mediante una base de filtros. Las sub bandas son comparadas con el original
mediante el modelo psicoacustico que determina que bandas son importantes,
cuales no y por ultimo cuales pueden ser eliminadas.
Los modelos psicoacústicos se componen a partir de las percepciones de un grupo
de personas entrenadas para rendir al máximo en este campo. Por medio de una
serie de experimentos se puede determinar la sensibilidad del oído humano a una
serie de fenómenos, de forma que aparezcan resultados útiles para el
tratamiento del sonido, como ya hemos visto. Para ello se llevan a cabo
experimentos para medir la sensibilidad del oído humano, el enmascaramiento en
frecuencia, el enmascaramiento temporal, y el enmascaramiento pre - temporal.
Del víbrate que utilicemos para producir la codificación depende la eliminación
de menor o mayor cantidad de datos siguiendo el modelo psicoacustico hasta
lograr la compresión necesaria. Luego se cuantifican y codifican las sub bandas
restantes y el resultado es finalmente comprimido mediante un alogaritmo estándar
Huffman o LZW.
Se puede comprimir con distinto ancho de banda (kHz), modo (mono o estéreo) y
bibrate (kbps) (cantidad de bits que se consumen por segundo de audio)
obteniendo distintas calidades según para que se vaya a utilizar ese sonido.
Dependiendo de la calidad buscada estará la elección de la compresión que se
lleve a cabo.
La decodificación es más sencilla, ya que no precisa la aplicación de ningún
modelo psicoacustico. Simplemente se analizan los datos y se recomponen las
bandas y sus muestras correspondientes.
El existo que lleva consigo el formato MP3 esta sustentado por tres pilares. Su
capacidad de compresión: es un sistema de compresión de audio con el cual
podemos almacenar audio en 1/12 del espacio original. Calidad de compresión: un
método de compresión no es otra cosa que un alogaritmo (serie de ecuaciones
matemáticas) capaz de simplificar la información. Pero lamentablemente con
perdida de calidad. Y por ultimo la facilidad de distribución: gracias a
Internet se puede enviar o recibir sin mayor problema, incluso con conexiones
lentas, tales como las de módems de 14kb.
Para dominar el MP3
Un extractor de audio o CD-ripper es un programa que se encarga de extraer
digitalmente la música que hay en un CD-Audio y guardarla en el disco duro en
un archivo con formato WAV. La particularidad de este proceso es que los datos
guardados son exactamente los mismos que había en el CD-Audio. Existen varios
pero los más recomendados son: el winDAC (Digital Audio Copy) (www.windac.de),
el Easy CD-DA Extractor (www.poikosoft.com/cdda/) y el AudioGrabber (www.audiograbber.com-us.net).
Una vez hemos extraído las pistas de audio del CD y las tenemos guardadas como
archivos en formato WAV debemos comprimirlas a MP3. Los encoders sirven para
convertir archivos WAV a mp3. Para ello existen los siguientes programas: el MP3
compresor (www.musiccompressor.com), Electronic Cosmo´s MPEG Suite
(http://ec2000.xperiment.net), Audio Catalyst (www.xingtech.com/mp3/audiocatalyst/)
& (http://goinside.com/99/1/ac.html) y el Mplifier.
Otra forma de obtener canciones en formato MP3 es buscando por internet. Para
ello existen programas o sitios que facilitan la búsqueda de MP3 o el
intercambio entre usuarios mediante bases de datos. Estos son: (www.abes.org) (www.getright.com),
(http://freenet.sourceforge.net), (http://gnutella.wego.com), (www.mp3fiend.com),
(www.tucows.com), (www.napster.com), (www.forteinc.com/root/who.htm), (http://gnute.com/index.html).
Existen varios tipos de sistemas reproductores para escuchar audio, sea música
o no, en formato MP3. Para los que poseen un PC existe el Windows Media Player (www.windows.com),
Kjofol (www.kjofol.org), Wplay (www.mp3rulz.com), Unreal Player, Winamp (www.winamp.com),
Sonique (http://sonique.lycos.com/) o Jukebox creado por Real Networks. Para los
usuarios de Macintosh existe el MacCast (www.macamp.net/download.shtml) o el
SoundJam (www.soundjam.com). Mientras que para aquellos pocos que usan Linux
existe el XMMS y el Xaudio MP3Player. En la Argentina se ofrece la instalación
de reproductores de mp3 para autos en (www.mp3-car.com.ar).
Por último los decoders son programas que convierte archivos mp3 en archivos
WAV. Algunos son Winamp o el WPlay, aunque algunos compresores pueden usarse
también como descompresores. Un ejemplo sería el Electronic Cosmo's MPEG Suite
(los sitios ya fueron dados antes). Para encontrar estos programas u otros no
mencionados se pueden visitar sitios dedicados a software. Aunque aquí menciono
dos que poseen una lista generosa de software para ello ver;
 |
http://wfr.teaser.fr/~mmonserrat/MP3/Encoders_L.htm
|
 |
http://www.fh-wilhelmshaven.de/~schoonbe/mp3soft.html
|
|