• Portada
11/2013

Proposta de millora en la compressió d’imatges

Els estàndards de compressió d’imatges i vídeo utilitzen uns esquemes de codificació en els quals els píxels de la imatge es visiten de forma ordenada. D’aquest ordre d’escaneig depenen els rendiments de compressió. Un treball en què ha participat un investigador de la UAB introdueix un nou marc teòrico-pràctic per avaluar i dissenyar nous ordres d’escaneig. Els resultats experimentals demostren que l’eficàcia del mètode proposat és significativament superior a l’estat de l’art.

En l’actualitat, els estàndards de compressió d’imatges i vídeo utilitzen uns esquemes de codificació en els quals els píxels de la imatge es visiten de forma ordenada. Aquesta ordenació, coneguda com a ordre d’escaneig, és important ja que permet obtenir rendiments de compressió més o menys elevats segons si els coeficients que més aporten a la qualitat de la imatge es visiten més o menys tard.

Des de que a principis dels anys noranta es va introduir la transformada wavelet per la compressió d’imatges, el seu ús s’ha generalitzat degut als alts rendiments de compressió que permet aconseguir. Aquesta transformada s’utilitza en la primera etapa del procés de codificació transformant la imatge original a una representació multi-freqüencial. En aquesta representació, els píxels de la imatge s’anomenen coeficients wavelet. La transmissió de cadascun d’aquests coeficients proporciona un increment en la qualitat de la imatge. En la figura, per exemple, cada bloc representa un coeficient wavelet d’una part d’una imatge, amb l’alçada del bloc essent l’increment de qualitat que s’aconsegueix en transmetre’l. Per aconseguir un sistema de compressió que augmenti de forma òptima la qualitat de la imatge a mesura que es va transmetent és necessari que els coeficients wavelet es visitin amb un ordre d’escaneig determinat. A la figura, l’ordre òptim seria aquell que comença pel bloc negre i que va recorrent els altres blocs progressivament segons la intensitat del color. Evidentment, l’ordre d’escaneig òptim varia d’imatge a imatge, de forma que no es pot utilitzar sempre el mateix si es volen aconseguir resultats de compressió òptims. Aquest aspecte és clau en els sistemes de codificació actuals ja que permet augmentar de forma significativa el rendiment de compressió.

Fins el moment, els ordres d’escaneig  es dissenyaven a partir de tests heurístics sobre algun tipus d’imatge o a partir de la intuïció i validació experimental. La primera contribució d’aquest treball és el desenvolupament d’un marc de treball teòrico-pràctic a partir del qual es pot dissenyar i avaluar el rendiment dels ordres d’escaneig de qualsevol sistema de codificació basat en la transformada wavelet. Aquest marc de treball utilitza els últims avenços en el camp de l’optimització de taxa-distorsió, fet que permet generar anàlisis numèriques molt precises. En primer lloc, aquest marc s’utilitza per analitzar retrospectivament els ordres d’escaneig utilitzats fins el moment. Això permet justificar de forma teòrica alguns dels mecanismes àmpliament estesos en el camp però que no tenien cap base teòrica al darrere. Segonament, el marc permet definir el màxim rendiment que els sistemes de compressió del futur podran aconseguir, a partir del qual es pot discernir el nivell d’eficàcia dels sistemes actuals. Tercerament, a partir del marc de treball proposat es poden identificar quins són els millors ordres d’escaneig, proporcionant perspectiva per dissenyar esquemes de compressió més eficients.

Per demostrar la utilitat del marc de treball teòrico-pràctic, es descriu un ordre d’escaneig òptim per la codificació d’imatges naturals, aquelles captades per càmeres fotogràfiques o de naturalesa similar. L’eficàcia del sistema de compressió resultant supera els estàndards de compressió d’imatges actuals i els esquemes proposats a la literatura en els últims anys.

Francesc Auli-Llinas

Referències

Auli-Llinas, F. and Marcellin, M.W. "Scanning order strategies for bitplane image coding" IEEE Trans. Image Process., 21(4):1920-1933. Apr. 2012.

 
View low-bandwidth version