Comprimir una cosa és reduir-ne la mida. Des dels matalassos que, en comprar-los, arriben enrotllats en un espai reduït, fins a les bombones d’aire comprimit, passant per objectes més abstractes, com la informació, que és del que tractarem aquí. En els dos primers casos, la reducció de mida és física. En el tercer, la reducció de mida està associada al nombre o quantitat d’elements. Uns exemples típics d’informació són imatges, cançons, vídeos, text, animacions i fins i tot programes d’ordinador (apps)
Per què s’ha de comprimir?
Una imatge ocupa un determinat espai de memòria. Si es pot aconseguir que n’ocupi menys, podrem tenir més imatges en el mateix espai de memòria o reduir la quantitat de memòria (i així abaratir el cost del dispositiu que hi està associat). És el mateix cas exacte per a cançons, vídeos, text, animacions i programes d’ordinador.
La idea és que, si podem tenir més informació en el mateix espai, per què no ho hem de fer? Només ens cal aplicar un compressor a la nostra informació per a obtenir el benefici.
Com funciona?
La idea que hi ha al darrere de tot sistema de compressió és eliminar informació repetida. I això és una cosa que apliquem contínuament en la nostra vida real, com, per exemple, quan parlem i expliquem coses.
Imagineu-vos que hem de descriure les imatges següents, que contenen peces d’una coneguda joguina:
Aquesta imatge la podem descriure amb la frase “Peça grisa”.
Aquesta altra imatge la podem escriure amb la frase “Una peça grisa, una altra peça grisa, una altra peça grisa, una altra peça grisa i una altra peça grisa”. Segur que heu pensat en una altra frase molt més curta, i és que, sense saber-ho, apliquem compressió contínuament. La frase que us deu haver vingut al cap és “Cinc peces grises”, molt més curta que la primera. Signifiquen el mateix, però n’hi ha una, la segona (“Cinc peces grises”), que és molt més curta.
Si comparem “Cinc peces grises” amb “Peça grisa”, veurem que és una mica més llarga, i és lògic, ja que la segona imatge (la de les tres peces) té més informació que la primera.
Vegem-ne un altre exemple, tot seguit:
Aquesta imatge la podem descriure amb la frase “Una peça grisa, una altra peça grisa, una altra peça grisa, una altra peça grisa, una altra peça grisa i una peça negra”. Si comprimim aquesta frase, de manera natural podrem dir “Cinc peces grises i una peça negra al final”. Hem passat de 19 paraules a 9 paraules dient el mateix, és a dir sense perdre informació. I si la volguéssim escurçar encara més, però? Podrem dir, per exemple, “Sis peces fosques”, dient en 3 paraules si fa no fa el mateix. En aquest cas hem perdut una mica de detall, perquè sabem que les peces són fosques, però no sabem de quin color són ni quina distribució tenen. És possible, però, que en tinguem prou amb això si el que volem és solament explicar les peces que hi ha.
Per passar de 19 paraules a 9, hem fet una compressió que es diu compressió sense pèrdues (lossless compression). Per passar de 19 paraules a 3, hem aplicat una compressió que es diu compressió amb pèrdues (lossy compression). En la primera el missatge no perd cap detall, però en la segona sí. No obstant això, en la segona la reducció del nombre de paraules ha estat més gran que en la primera. Quan s’ha perdut el detall, no es pot recuperar. Si diem a algú “Dóna’m sis peces fosques”, ens en donarà sis, però pot ser que siguin totes sis negres, o sis de grises o tres de negres i tres de grises…
Amb pèrdues o sense?
La compressió amb pèrdues no és útil en el cas de comprimir text (en general, documents, sia de text, d’una base de dades o d’un model 3D) o aplicacions, ja que un sol error pot provocar canvis radicals de significat en el text o fer que l’aplicació no funcioni. Per a text i aplicacions només es fa servir compressió sense pèrdues. En general, aquest tipus de compressions solen reduir la mida entre la meitat i un terç de l’original.
La compressió amb pèrdues sí que es fa servir en imatge, àudio i vídeo (incloent-hi animacions renderitzades), gràcies al fet que els sentits de la vista i de l’oïda són imperfectes. Un error en un píxel o en un instant de temps és indetectable si se segueixen els procediments adequats. O dit d’una altra manera, hi ha píxels i sons que no veiem ni sentim, de manera que no fa falta tenir-los guardats. Compte, però, perquè si, per exemple, fem una imatge més gran, hi ha efectes imperceptibles (pel fet de ser petits) que es poden tornar perceptibles. Això passa sovint en el cas de fotografies digitals que es porten a ampliar. Si fem una fotografia amb la càmera i en les opcions de la càmera guardem les fotografies en un format comprimit amb pèrdues, podrem fer més fotos, però tindran defectes que poden aparèixer quan les ampliem. La compressió amb pèrdues redueix moltíssim la mida i en vídeo l’arriba a reduir més de mil vegades.
En general, s’ha de tenir clar que comprimir amb pèrdues implica perdre detalls, encara que aconsegueix molta més reducció de mida que la compressió sense pèrdues.
Exemples
Els formats d’arxiu .zip, .rar, .7z, .flac i .png estan associats a formats d’arxiu comprimits sense pèrdues. El format .flac està associat a àudio, el .png a imatge i els altres tres són generals.
Els formats d’arxiu .jpg, .webp, .mp3, .m4a, .ogg, .mpg, .mp4 i .mov estan associats a formats d’arxiu comprimits amb pèrdues: .jpg i .webp són per a imatge, .mp3 i .m4a per a àudio, i .ogg, .mpg, .mp4 i .mov per a vídeo.
Surt a compte comprimir?
Sí, sobretot en vídeo, imatge i àudio (en aquest ordre). I, en general, sempre que es pugui i que tinguem temps. “Tenir temps” està associat al temps que s’inverteix a utilitzar les utilitats de comprimir i descomprimir arxius. Hi ha vegades que voldrem tenir la informació sense comprimir per estalviar-nos aquest temps. Aquesta informació sol ser informació de text o programes, la no susceptible de comprimir-se sense pèrdues. “Sempre que es pugui” inclou tenir els programes adequats i fer la compressió amb pèrdues sabent que no destrueix detalls que ens faran falta més endavant.
Vegem-ne unes xifres:
– Un document o un programa se solen comprimir sense pèrdues en .zip, .rar o .7z (entre d’altres) i solen acabar ocupant entre la meitat o la tercera part. És a dir, un .docx de 4 MB, comprimit en .zip, pot ocupar uns 1,3 MB, per exemple.
– Una cançó de 3 minuts, sense comprimir i en qualitat CD, ocupa uns 32 MB (en format .wav, per exemple). Comprimida en .flac (compressió d’àudio sense pèrdues) ocupa uns 16 MB. Comprimida en un arxiu .mp3 (compressió amb pèrdues), amb una qualitat semblant a la del CD (això és, MP3 a 320 kBps), ocupa 6 MB.
– Una imatge d’una càmera de 12 Mp ocupa 108 MB sense comprimir (en format .bmp, per exemple). Aquesta mateixa imatge, comprimida en .png (compressió d’imatge sense pèrdues) pot arribar a baixar a uns 10 Mp. Aquesta mateixa imatge, comprimida en .jpg (compressió d’imatge amb pèrdues) i amb una qualitat perceptivament semblant en veure-la en web, pot arribar a ocupar només 2 Mp.
– Una pel·lícula en HD de dues hores ocupa 14 TB, és a dir, 14.000.000 de MB. És un volum tan gran que no té associat cap format d’arxiu domèstic, i si es guarda (a escala professional), es fa en cintes o grans servidors. La compressió que s’aconseguiria amb un format sense pèrdues reduiria la mida a la desena part, de manera que tampoc no s’usa perquè 1,4 TB per pel·lícula continua essent desorbitat. L’única compressió útil és la compressió sense pèrdues; per exemple, en format .mp4, que amb una qualitat semblant a l’original pot arribar a ocupar “només” 33 GB (33.000 MB).
I per acabar …
No serveix de res aplicar més d’una compressió a un arxiu. Aplicar una compressió sense pèrdues a un arxiu comprimit no aconseguirà cap reducció de mida. Aplicar una compressió amb pèrdues a un arxiu comprimit amb pèrdues és fins i tot perjudicial, ja que no solament no aconsegueix comprimir més, sinó que, a més, s’afegeixen més pèrdues de detall, de manera que es degrada la informació original.
Trieu el tipus de compressió i apliqueu-lo una sola vegada a la informació original, per evitar pèrdua de temps i qualitat.
Per saber-ne més
Els enllaços següents de Wikipedia tenen informació completa, extensa i correcta sobre compressió (pot arribar a ser aclaparant per a algú que s’acabi d’iniciar en el tema). No us recomanem aquests mateixos enllaços en castellà, perquè són inexactes, hi falta informació i no estan actualitzats.