JPEG

JPEG (Joint Photographic Experts Group)^[1] galeradun konpresio-algoritmo bat da; irudi digitalak konprimatzeko ohiko metodoa. JPEG teknologiak irudiak konprimatzeko balio du, 24 biteko kolore-sakonerarekin edo gris-eskalan.

Historia eta garapena

JPEG estandarra 1992an sortu zuen Joint Photographic Experts Groupek, eta ordutik aurrera estandarra munduko irudi konpresiorako gehien erabiltzen dena da. Bere jatorritik aurrera, JPEG formatuak irudi digitalen hedapena bultzatu du, bereziki Interneten eta sare sozialetan.

Fitxategi luzapena eta estandarrak

JPEG fitxategiek normalean .jpg edo .jpeg luzapena izaten dute. Erabiltzaile batzuek .jpg erabiltzen dute, sistema eragile batzuek luzapenak 3 karakterera mugatzen dituztelako. Hala ere, luzapen hau ez da beti zuzena, JPEG/Exif formatuak erabiltzen dira gehienbat kamera digitaletan, eta JPEG/JFIF formatuak dira Internet bidezko argazkiak gordetzeko eta transmititzeko formatu arruntena.

Konpresioa eta kalitatea

JPEG konpresio-maila erregulagarria da. Honek aukera ematen du konpresio-mailaren eta irudi kalitatearen arteko trukea definitzen. Ohiko JPEG konpresioak 10:1eko konpresio-ratioa lortzen du kalitate-galera txikiarekin. Kalitate handiagoa mantendu nahi bada, konpresio txikiagoa aukera daiteke; bestela, konpresio altuagoarekin kalitate-galera handitu egiten da eta fitxategiaren tamaina txikiagoa izango da.

Konpresioak eragindako zarata

Konpresioa egin ondoren pixel edo horrelako blokeak geratzen dira, kasu honetan handitutako irudi baten zati txiki batean.

Konpresioaren ondorengo emaitza alda daiteke kuantizazio matrizeko zatitzaileen arabera. Zenbatzaile horien balioa zenbat eta handiagoa izan, orduan eta koefiziente gehiago zero bihurtzen dira eta irudia gehiago konprimatzen da. Baina, konpresio hadiagoek zarata sortzen dute irudian, kalitatea jaitsiz. Irudi bat konpresio handi batekin (% 1-15) fitxategiaren tamaina oso txikia izan dezake, baina akats asko izanda. Bestalde, irudi bat konpresio txiki batekin (% 98-100) kalitate ona izango du baina tamaina ere handiagoa izango da. Orduan, hobe izango litzateke galera ez daukan formatu batean jartzea, PNG bezala.

Galera hauek dira konpresio on bat lortzeko emaitza eta Interneteko erabiltzaile gehienak ohituta daude galera hauekin. Errore hauek saihesteko, konpresio-maila murriztu beharko da edo galerarik gabeko konpresioren bat erabili, fitxategi handiagoak sortuz (tamainan).

Kodetzea

JPEG estandarren aukera gehienak gutxi erabiltzen dira. Hau, irudiak konprimatzeko normalean erabiltzen den metodoren deskribapen txiki bat da, 24 bit daukan irudi bat aplikatzean (zortzi gorri, urdin eta berde bakoitzerako edo, beste era batean, 8 bit kanal bakoitzerako). Aukera hau, galeradun konpresioren metodo bat da.

Kolore-espazio eraldatzea

Hasten da irudi bat RGB kolore-eredutik YUV edo YCbCr eredu bihurtzen. Kolore-espazio hau, PAL eta NTSC sistemek telebistarako erabiltzen duten sistemen bezalakoak dira, baina MAC telebista sistemarekin antzekotasun handiagoa dauka.

YUV kolore-espazioak hiru osagai ditu:

Y osagaia edo luminantzia (distiraren informazioa), hau da, gris-eskalako irudia.
U edo Cb eta V edo Cr osagaiak, hurrenez hurren, urdinaren (urdinaren eta gorriaren arteko irudia erlatibizatzen du) eta gorriaren (berdearen eta gorriaren arteko irudia erlatibizatzen du) arteko diferentzia da, krominantzia bezala ezagutzen zaie bi seinaleei (koloreari buruzko informazioa).

RGB-tik YUV-ra oinarrizko aldaketa egiten duten ekuazioak honako hauek dira:

$Y=0,257*R+0,504*G+0,098*B+16$

$Cb=U=-0,148*R-0,291*G+0,439*B+128$

$Cr=V=0,439*R-0,368*G-0,071*B+128$

Aurreko ekuazioak bakantzen baditugu, alderantzizko aldaketaren ekuazioak lor daitezke:

$B=1,164*(Y-16)+2,018*(U-128)$

$G=1,164*(Y-16)-0,813*(V-128)-0,391*(U-128)$

$R=1,164*(Y-16)+1,596*(V-128)$

OHARRA: Ekuazio hauek ikerketan dabiltzate, beraz, liburuetan edo sareetan ageri daitezke koefiziente ezberdinekin.

Lehenengo hirukote aztertzen badugu, hiru osagaiek 16 balio minimoa lortzen dutela ikusiko dugu. Luminantzia kanalak (Y kanala) 235 balio maximoa dauka, krominantzia kanalak, berriz, 240. Balore guztiak byte batean sartzen dira, hurbil dagoen zenbaki osora biribilduz. Fase honen bitartean ez dago informazio galerik, baina biribilketak errore txiki bat eragiten dio giza begiari.

Azpilaginketa

Irudia gordetzean aplika daitekeen aukera bat kolorearen informazioa distirarenaren aldean murriztea da (lehen aipatu dugun giza begiko ikusmen-fenomenoaren ondorioz). Metodo batzuk daude: pauso hau ez bada egiten, irudiak bere YUV kolore-espazioan jarraitzen du (azpilanginketa hau 4:4:4 bezala ulertzen da), irudiak ez du izango galerarik. Informazio kromatikoa erdira murriz daiteke 4:2:2 (horizontal norabidean 2ko faktorea txikitzen), beraz, koloreak bereizmenaren erdia du (horizontalean) eta distirak lehen bezala jarraituko du. Asko erabiltzen den metodo bat kolorea laurdenera murriztea da, 4:2:0, non kolorea 2ko faktore batean murrizten den, bi norabideetan, horizontalean eta bertikalean. Hasierako irudia gris-eskala (zuri eta beltza) bazegoen, kolore informazio guztia ezaba daiteke, 4:0:0 geratzen.

JPEG irudiak gordetzeko aukera ematen duten programa batzuk (GIMPek erabiltzen duen bezala), YUVeko 4:4:4 (kolore galdu gabe) 1x1, 1x1, 1x1 adierazten dute metodo hauek; YUVeko 4:2:2, 2×1,1×2,1×1, eta YUV 4:2:0 azken metodorako, 2×2,1×1,1×1.

Pauso honetarako algoritmiko teknikak erabiltzen direnak (zehazki berreraikitzeko) interpolazio bilineala, auzo hurbilena, konboluzio kubikoa, Bezier, b-spline eta Catmun Roll.rh dira.

Kosinuaren transformatu diskretua

JPEG algoritmoak irudia 8×8ko laukitan transformatzen du eta gero, bakoitza konbinazio lineal bat bezala edo irudia osatzen duten 64 laukitxoen batura gisan gordetzen du; horrek xehetasunak modu selektiboan ezabatzea ahalbidetzen du. Adibidez, lauki batek 0tik oso hurbil dagoen balio bat badu, ez du kalitatean eragiten, eta beraz, ezaba daiteke.

Irudian agertzen den osagai bakoitza 8x8 pixeleko bloke txikitan banatzen dira, non ia independienteki prozesatzen diren, honek kalkulatze-denbora nabarmen murrizten du. Horren ondorioz, ohiko sareta-formazioa sortzen da, konpresio handiarekin gordetako irudietan ikusgarri bihurtzen dena. Irudiak kolore azpilaginketa bat jasan badu, koloreak azken irudian 8×16 eta 16×16 pixeleko blokeetan geratuko dira, formatuaren arabera, 4:2:2 edo 4:2:0.

Ondoren, bloke txiki bakoitza maiztasunaren eremuan bihurtzen da, kosinuaren transformatu diskretua erabiliz.

Hona hemen 8×8 bloke txiki baten adibide bat:

{\begin{bmatrix}52&55&61&66&70&61&64&73\\63&59&55&90&109&85&69&72\\62&59&68&113&144&104&66&73\\63&58&71&122&154&106&70&69\\67&61&68&104&126&88&68&70\\79&65&60&70&77&68&58&75\\85&71&64&59&55&61&65&83\\87&79&69&68&65&76&78&94\end{bmatrix}}

Hurrengo pausoan elementu bakoitzari 128 kentzen zaio:

{\begin{bmatrix}-76&-73&-67&-62&-58&-67&-64&-55\\-65&-69&-73&-38&-19&-43&-59&-56\\-66&-69&-60&-15&16&-24&-62&-55\\-65&-70&-57&-6&26&-22&-58&-59\\-61&-67&-60&-24&-2&-40&-60&-58\\-49&-63&-68&-58&-51&-60&-70&-53\\-43&-57&-64&-69&-73&-67&-63&-45\\-41&-49&-59&-60&-63&-52&-50&-34\end{bmatrix}}

Matrizea kosinu transformatu diskretuaren bidez transformatzen da, eta elementu bakoitza hurbilago dagoen zenbaki osora biribiltzen da.

{\begin{bmatrix}-415&-30&-61&27&56&-20&-2&0\\4&-22&-61&10&13&-7&-9&5\\-47&7&77&-25&-29&10&5&-6\\-49&12&34&-15&-10&6&2&2\\12&-7&-13&-4&-2&2&-3&3\\-8&3&2&-6&-2&1&4&2\\-1&0&0&-2&-1&-3&4&-1\\0&0&-1&-4&-1&0&1&2\end{bmatrix}}

Kodetze entropikoa

Kodetze entropikoa da informazio galera gabeko konpresio modu berezia. Horretarako, matrizeko elementuak sigi-saga forman hartzen dira, antzeko maiztasuna duten taldeak elkarrekin jarri, kodetze-zeroak txertatu, eta geratzen denerako Huffman kodetzea erabili. Aritmetika-kodetzea ere erabil daiteke, Huffmanekoa baino hobeagoa dena, baina gutxitan erabilitakoa.

Kuantifikazio digitala

Giza begiak oso ondo detektatzen ditu distiraren aldaketa txikiak eremu nahiko handietan, baina eremu txikietan gertatutako distiraren aldaketa azkarrak ez. Baldintza honen ondorioz, maiztasun altuak ezaba daitezke kalitate bisualean galera nabarmenik izan gabe. Hau egiten da maiztasunaren eremuan dagoen osagai bakoitza osagai horrentzako konstante batekin zatituz eta emaitza zenbaki oso hurbilenera biribilduz. Algoritmo honek irudia prozesatzen duenean informazio eta kalitate gehiena galtzen den prozesua da hau.

Kuantifikazio-matrize tipiko bat da Losheller-en matrizea, eta aukeraz erabiltzen da JPEG estandarrean:

{\begin{bmatrix}16&11&10&16&24&40&51&61\\12&12&14&19&26&58&60&55\\14&13&16&24&40&57&69&56\\14&17&22&29&51&87&80&62\\18&22&37&56&68&109&103&77\\24&35&55&64&81&104&113&92\\49&64&78&87&103&121&120&101\\72&92&95&98&112&100&103&99\end{bmatrix}}

Transformatu den irudiko matrizearen koefiziente bakoitza kuantifikazio-matrizearen koefiziente bakoitzarekin zatituz, kuantifikatutako matrizea lortzen da:

{\begin{bmatrix}-26&-3&-6&2&2&-1&0&0\\0&-2&-4&1&1&0&0&0\\-3&1&5&-1&-1&0&0&0\\-4&1&2&-1&0&0&0&0\\1&0&0&0&0&0&0&0\\0&0&0&0&0&0&0&0\\0&0&0&0&0&0&0&0\\0&0&0&0&0&0&0&0\end{bmatrix}}

Adibidez, lehen elementua kuantifikatuz, hau da, DC-koefizientea, honela izango litzateke:

\mathrm {round} \left({\frac {-415}{16}}\right)=\mathrm {round} \left(-25.9375\right)=-26

Deskodetzea

Deskodetze prozesua da orain arte egingakoaren antzekoa, alderantzizkoa izanik. Gainera, kasu honetan, informazioa galduz gero, amaierako balioak ez dira hasierako balio berak izango.

Matrizetik informazioa hartu, deskodifikatu, eta balio bakoitza bere tokian jartzen da. Gero balio bakoitza lehen erabilitako kuantifikazio matrizeko balio bakoitzarekin biderkatzen da, elementu gehienak zero direnez, bakarrik goi ezkerreko izkinan dauden balioak berreskuratzen dira.

Gero kosinuaren transformazio diskretua desegiten da:

{\begin{bmatrix}-416&-33&-60&32&48&-40&0&0\\0&-24&-56&19&26&0&0&0\\-42&13&80&-24&-40&0&0&0\\-56&17&44&-29&0&0&0&0\\18&0&0&0&0&0&0&0\\0&0&0&0&0&0&0&0\\0&0&0&0&0&0&0&0\\0&0&0&0&0&0&0&0\end{bmatrix}}

{\begin{bmatrix}-68&-65&-73&-70&-58&-67&-70&-48\\-70&-72&-72&-45&-20&-40&-65&-57\\-68&-76&-66&-15&22&-12&-58&-61\\-62&-72&-60&-6&28&-12&-59&-56\\-59&-66&-63&-28&-8&-42&-69&-52\\-60&-60&-67&-60&-50&-68&-75&-50\\-54&-46&-61&-74&-65&-64&-63&-45\\-45&-32&-51&-72&-58&-45&-45&-39\end{bmatrix}}

Azkenik elementu bakoitzari 128 gehitzen zaio:

{\begin{bmatrix}60&63&55&58&70&61&58&80\\58&56&56&83&108&88&63&71\\60&52&62&113&150&116&70&67\\66&56&68&122&156&116&69&72\\69&62&65&100&120&86&59&76\\68&68&61&68&78&60&53&78\\74&82&67&54&63&64&65&83\\83&96&77&56&70&83&83&89\end{bmatrix}}

Jatorrizko eta konprimatutako blokeen arteko desberdintasunak konparatzeko, bi matrizeen arteko diferentzia kalkulatzen da. Haien balio absolutuen bataz bestekoak galdu den kalitatearen ideia orokor bat ematen du: