Propiedad Industrial/Intelectual & Mercado

  Titular: Dra. Teodora ZAMUDIO
   Comisión 0400 Equipo docente

 Derecho ~ Universidad de Buenos Aires

 

 

Mp3: Consideraciones iniciales y técnicas

Presentación
Fuentes & Referencias

G.A.T.z. Ediciones Digitales

Equipo de edición

 

 

Normativa

Jurisprudencia

Bibliografía

Modelos y Útiles

 

Ignacio García Santos

Fuente:  www.datosenlaweb.com

MP3 no sólo es un tipo de archivo común en plena época de apogeo. Tras él hay años de investigación, su historia, relación con los demás formatos, la digitalización del sonido y todos los pasos necesarios y posibles para disfrutar de estos archivos.


Su origen y actualidad
Las siglas MP3 responden a la abreviatura de MPEG 1 Layer 3, que es un alogaritmo de codificación perceptual. Este entre otros fue desarrollado por el Moving Picture Expert Group (MPEG) (http://www.cselt.it/mpeg/) junto con el Instituto Tecnológico de Fraunhofer (http://www.ipa.fhg.de/english/).

MPEG 1 no fue siempre el denominador de este sistema, antes de él se llamaba Musicam. El cual fue la base para crear el MPEG 1 Layer 1 y 2. Pero debido a que Musicam ya se encontraba registrado en varias partes del mundo, por distintas empresas, se decidió que llevase el nombre de sus creadores. El formato MPEG es una alternativa para el formato avi, como MP3 lo es para WAV.

Moving Picture Expert Group es un comité de investigación del ISO/IEC. El MPEG está a cargo del desarrollo internacional de estándares de compresión, descompresión, procesamiento y la representación codificada de películas, audio y la combinación de ambas. Es una institución sin fines de lucro creada en 1988, que reúne tres veces por año a trescientos (300) expertos de veinte (20) países.

No solo a desarrollado el MPEG 1 Layer 1, 2 y 3 (1992) sino que también existen el MPEG 2 (1994), MPEG 2.5, MPEG 4 versiones 1 (oct. 1998) y 2 (dic. 1999). Hoy en día se encuentra en desarrollo el MPEG 4 versiones 3, 4 y 5, MPEG 7 y por ultimo el MPEG 21.

A diferencia del MPEG 1 el MPEG 2 tiene en cuenta el sonido envolvente (surround) y la extensión multilingüe. El MPEG 2.5 fue creado por el Instituto Fraunhofer y a pesar de que no es una especificación ISO divide una segunda vez la frecuencia de muestreo entre dos. Funciona bien para ciertas aplicaciones de ancho de banda critico.

ISO (www.iso.ch) es la Organización Internacional de Estándares, que fue establecido en 1947. La importancia de este organismo no gubernamental es considerable ya que sus normas facilitan el intercambio internacional. Creando así un denominador común entre las industrias de diversas regiones del mundo. El organismo responsable de ello en la Argentina es el Instituto Argentino de Normalización (IRAM) (www.iram.com.ar). Al cual se deberá acudir en caso de buscar las normas ISO con respecto a estos formatos de audio, estas normas no son gratuitas, de modo que representan el 80% de los ingresos del ISO; el 20 % restante corresponde a publicaciones.

El MP3 fue adoptado como norma ISO en 1992 (IS - 11172 - 3) y (IS 13818 - 3). De este modo se establecieron estándares de mercado e industria definidos para el MP3.

Reteniendo el sonido
El MP3 es un sistema de compresión con perdida, por lo cual el sonido original y el comprimido no son iguales. Pero las perdidas no deberían ser perceptibles para el oído humano, de manera que no se tendría que notar la diferencia.

El sonido es una onda continua que se propaga a través del aire u otros medios, formada por diferencias de presión, que pueden detectarse mediante la medición de la presión en un punto determinado. Como se trata de una onda continua es necesario un proceso de digitalización para representarla como una serie de números. Hoy en día la mayoría de las operaciones realizadas sobre señales de sonido son digitales y en menor medida se utilizan señales analógicas. Las señales digitales poseen muchas ventajas sobre las analógicas, aunque por desgracia esta requiere un ancho de banda mucho mayor que el de la señal analógica.

El proceso de digitalización se compone de dos etapas: muestreo y cuantizacion. En el muestreo se divide el eje del tiempo en segmentos discretos; la frecuencia de muestreo será la inversa del tiempo que haya entre una medida y la siguiente. En estos momentos se realiza la cuantización, que, en su forma más sencilla, consiste simplemente en medir el valor de la señal en amplitud y registrarlo. El teorema de Nyquist garantiza que la frecuencia necesaria para muestrear una señal que tiene sus componentes más altas a una frecuencia dada f es como mínimo 2f. Por tanto, siendo el rango superior de la audición humana en torno a los 20 Khz, la frecuencia que garantiza un muestreo ajustado a cualquier sonido audible será de unos 40 Khz (el CD tiene 44.1Khz). Según el fin que se tenga los valores pueden llegar a ser muy inferiores a estos. De manera que la voz humana acostumbra fluctuar entre 6 y 20 Khz y en algunos casos es menor. En cuánto a la cauntizacion se puede realizar una división a intervalos iguales o según una determinada función de densidad. De manera que haya mas resolución en determinados tramos. Este proceso es denominado PCM (Pulse Code Modulación).

Cuantos menos bits se utilicen en el muestreo y la cuantizacion, mayor será el ruido. Para evitar que el ruido sea excesivo hay que usar una mayor cantidad de bits. Gran parte de esta información es innecesaria y ocupa un ancho de banda del cual se podría dispensar, a costa de aumentar la complejidad del sistema decodificador e incurrir en cierta perdida de calidad. Esto se logra mejor con la cuantizacion a intervalos determinados por una función de densidad.

El rango de frecuencias que percibe el oído humano esta aproximadamente entre los 20Hz y los 20kHz siendo este más sensible entre los 2Hz y 4Hz. De manera que el sonido mientras más cerca este de a los extremos de la escala, mayor será la dificultad audible del mismo.

La clave del éxito
Cuando se percibe una señal de un volumen alto (agudo o de mayor energía) en una frecuencia y otra de volumen mas bajo (grave o de menor energía) en una frecuencia cercana esta ultima no será audible. Este efecto se llama enmascaramiento simultaneo o en frecuencia (también existe el enmascaramiento asimultáneo o en el tiempo). Y a cierta distancia de la frecuencia enmascaradora, el efecto se reduce tanto que resulta despreciable. El rango de frecuencias en las que se produce el fenómeno se denomina banda critica (critical band). La amplitud de la banda critica varia según la frecuencia en la que nos situemos y viene dada por determinados datos que demuestran que es mayor con la frecuencia. De esta manera se trata de desechar todo aquello que el oído humano no podría captar.

Para aprovechar estas características se utiliza un sistema denominado Codificación de Sub bandas o CBS (sub-band coding). Donde el MP3 es el ejemplo más popular. En este proceso la señal original es descompuesta en sub bandas mediante una base de filtros. Las sub bandas son comparadas con el original mediante el modelo psicoacustico que determina que bandas son importantes, cuales no y por ultimo cuales pueden ser eliminadas.

Los modelos psicoacústicos se componen a partir de las percepciones de un grupo de personas entrenadas para rendir al máximo en este campo. Por medio de una serie de experimentos se puede determinar la sensibilidad del oído humano a una serie de fenómenos, de forma que aparezcan resultados útiles para el tratamiento del sonido, como ya hemos visto. Para ello se llevan a cabo experimentos para medir la sensibilidad del oído humano, el enmascaramiento en frecuencia, el enmascaramiento temporal, y el enmascaramiento pre - temporal.

Del víbrate que utilicemos para producir la codificación depende la eliminación de menor o mayor cantidad de datos siguiendo el modelo psicoacustico hasta lograr la compresión necesaria. Luego se cuantifican y codifican las sub bandas restantes y el resultado es finalmente comprimido mediante un alogaritmo estándar Huffman o LZW.

Se puede comprimir con distinto ancho de banda (kHz), modo (mono o estéreo) y bibrate (kbps) (cantidad de bits que se consumen por segundo de audio) obteniendo distintas calidades según para que se vaya a utilizar ese sonido. Dependiendo de la calidad buscada estará la elección de la compresión que se lleve a cabo.

La decodificación es más sencilla, ya que no precisa la aplicación de ningún modelo psicoacustico. Simplemente se analizan los datos y se recomponen las bandas y sus muestras correspondientes.

El existo que lleva consigo el formato MP3 esta sustentado por tres pilares. Su capacidad de compresión: es un sistema de compresión de audio con el cual podemos almacenar audio en 1/12 del espacio original. Calidad de compresión: un método de compresión no es otra cosa que un alogaritmo (serie de ecuaciones matemáticas) capaz de simplificar la información. Pero lamentablemente con perdida de calidad. Y por ultimo la facilidad de distribución: gracias a Internet se puede enviar o recibir sin mayor problema, incluso con conexiones lentas, tales como las de módems de 14kb.

Para dominar el MP3
Un extractor de audio o CD-ripper es un programa que se encarga de extraer digitalmente la música que hay en un CD-Audio y guardarla en el disco duro en un archivo con formato WAV. La particularidad de este proceso es que los datos guardados son exactamente los mismos que había en el CD-Audio. Existen varios pero los más recomendados son: el winDAC (Digital Audio Copy) (www.windac.de), el Easy CD-DA Extractor (www.poikosoft.com/cdda/) y el AudioGrabber (www.audiograbber.com-us.net).

Una vez hemos extraído las pistas de audio del CD y las tenemos guardadas como archivos en formato WAV debemos comprimirlas a MP3. Los encoders sirven para convertir archivos WAV a mp3. Para ello existen los siguientes programas: el MP3 compresor (www.musiccompressor.com), Electronic Cosmo´s MPEG Suite (http://ec2000.xperiment.net), Audio Catalyst (www.xingtech.com/mp3/audiocatalyst/) & (http://goinside.com/99/1/ac.html) y el Mplifier.

Otra forma de obtener canciones en formato MP3 es buscando por internet. Para ello existen programas o sitios que facilitan la búsqueda de MP3 o el intercambio entre usuarios mediante bases de datos. Estos son: (www.abes.org) (www.getright.com), (http://freenet.sourceforge.net), (http://gnutella.wego.com), (www.mp3fiend.com), (www.tucows.com), (www.napster.com), (www.forteinc.com/root/who.htm), (http://gnute.com/index.html).

Existen varios tipos de sistemas reproductores para escuchar audio, sea música o no, en formato MP3. Para los que poseen un PC existe el Windows Media Player (www.windows.com), Kjofol (www.kjofol.org), Wplay (www.mp3rulz.com), Unreal Player, Winamp (www.winamp.com), Sonique (http://sonique.lycos.com/) o Jukebox creado por Real Networks. Para los usuarios de Macintosh existe el MacCast (www.macamp.net/download.shtml) o el SoundJam (www.soundjam.com). Mientras que para aquellos pocos que usan Linux existe el XMMS y el Xaudio MP3Player. En la Argentina se ofrece la instalación de reproductores de mp3 para autos en (www.mp3-car.com.ar).

Por último los decoders son programas que convierte archivos mp3 en archivos WAV. Algunos son Winamp o el WPlay, aunque algunos compresores pueden usarse también como descompresores. Un ejemplo sería el Electronic Cosmo's MPEG Suite (los sitios ya fueron dados antes). Para encontrar estos programas u otros no mencionados se pueden visitar sitios dedicados a software. Aunque aquí menciono dos que poseen una lista generosa de software para ello ver;

bullet

 http://wfr.teaser.fr/~mmonserrat/MP3/Encoders_L.htm 

bullet

http://www.fh-wilhelmshaven.de/~schoonbe/mp3soft.html

  

Esta Base de datos ha sido editada para proveer a los alumnos de un medio gratuito de acceso a la bibliografía de estudio e información. El material ha sido tomado de fuentes de libre acceso, las que son citadas en cada caso.

Herramientas
para instalar clickée sobre los logos y abra el archivo o guárdelo para instalarlo más tarde


Abode® Readers para leer  archivos .pdf


Winzip® para descomprimir archivos .zip

Editado por

G.A.T.z. Ediciones Digitales

Equipo de edición