Levysoft
  • Home
  • Portfolio
  • WordPress Plugin
  • Contattami

Dal 2004 il blog di Antonio Troise

RSS FeedTwitterFacebook
Gen 28 2008

Cosa è il Calgary Corpus e come si eseguono i test di compressione

Posted by Antonio Troise
Tweet

Nonostante, per gli usi quotidiani, tutti noi siamo soliti usare uno o due tool di compressione come, per esempio Zip o Rar, in realtà esistono numerosi altri tool (7zip, UHARC, KGB…) in grado di eccellere nella compressione di particolari formati di file piuttosto che altri. Questo significa che, ad ogni nuova release di questi programmi, nasce una vera e propria sfida a chi comprime di più e più velocemente. In queste gare “virtuali”, è possibile stabilire in diversi metodi il tasso di compressione, ma, normalmente, siccome il tasso di compressione può variare a seconda del formato di file usato (che sia un file ascii o binario, che sia una bitmap o un jpeg) di solito si usano dei file di test creati appositamente per tenere in considerazione più aspetti.

Il più famoso è sicuramente il Calgary Corpus, una collezione di testo e dati binari creato da Ian Witten e Tim Bell (due ricercatori dell’Università di Calgary in Nuova Zelanda) nel 1980 e comunemente usato dal 1990 sino al 1997, anno in cui è stato sostituito dal Canterbury Corpus, una collezione di dati creata dall’Università di Canterbury in Nuova Zelanda, creata appunto per migliorare e sostituire il precedente in modo da realizzare migliori benchmark sugli algoritmi di compressione dati di tipo lossless.
Attualmente, però, il Calgary Corpus è ancora molto usato per i test di comparazione tra programmi di archiviazione e compressione.

Se volete sperimentare voi stessi il tasso di compressione dei programmi che usate, da qui è possibile scaricare, via anonymous ftp, il Calgary Corpus, dove è possibile trovare diverse tipologie di file (sempre in lingua inglese) a seconda se si voglia eseguire test su codice sorgente, pacchetti compilati, libri, articoli di giornali, bibliografie, immagini etc: bib, book1, book2, geo, news, obj1, obj2,
paper1, paper2, paper3, paper4, paper5, paper6, pic, progc, progl, progp
.

Calary Corpus

Ultimamente è stato realizzata una nuova homepage per il Calgary Corpus dove è possibile scaricare anche tutto il pacchetto completo del Calgary Corpus, ma, per completezza, è possibile scaricare anche altre collezioni di testo, come il The Canterbury Corpus, The Artificial Corpus, The Large Corpus, The Miscellaneous Corpus.

Non mi resta che augurarvi buon divertimento!

Tag:compressione, kgb, winrar, zip
CONTINUE READING >
0 comments
Ago 29 2007

KGB Archiver: recensione sul miglior tool di compressione esistente anche se estremamente lento

Posted by Antonio Troise
Tweet

KGB Archiver è un tool di compressione gratuito che vanta un’altissimo tasso di compressione, addirittura meglio di 7zip e UHARC. Il programma è dotato di un nuovo formato di compressione, il KGB, che promette migliori compressioni rispetto a programmi più famosi di compressione e può anche criptare files utilizzando AES a 256bit rendendo molto sicura la riservatezza dell’archivio stesso (tanto da renderlo uno dei sistemi di crittografia più potenti al momento conosciuti).

Purtroppo, KGB Archiver, oltre alla lentezza nel comprimere, non supporta alcun formato oltre a quello proprietario KGB e ha dei requisiti hardware minimi piuttosto elevati rispetto a software analoghi (si raccomandano un processore da 1,5GHz e almeno 256MB di RAM).

Anche se KGB Archiver è un programma ancora poco conosciuto, è comunque in grado di mettere a disposizione degli utenti ben 10 diversi livelli di compressione utilizzando l’algoritmo PAQ.

KGB Archiver, inoltre, consente di creare archivi compressi autoestraenti, supporta il drag and drop e si integra con l’interfaccia di Windows aggiungendo alcune pratiche voci al menù contestuale.

Il prodotto non è destinato, almeno per il momento, a sostituire utilità più complesse e complete come WinZip ma è una soluzione particolarmente indicata per chi desidera ridurre al minimo le dimensioni dei propri archivi compressi.
KGB Archiver in modalità “Extreme” (il penultimo livello di compressione) ha evidenziato le migliori prestazioni in tutti i campi rispetto ai vari formati Zip, Rar e 7Zip. Per poter usare il livello di compressione massimo è necessario disporre di un notevole quantitativo di memoria RAM, comunque superiore ad 1 GB.

La minore pesantezza degli archivi creati con KGBArchiver si paga però nei tempi di elaborazione: la creazione di un file compresso (così come l’operazione di estrazione) potrebbe richiedere diversi minuti prima di essere completata.

Confronto con gli altri tool di compressione

Anche se il formato di compressione KGB è eccezionale, è facile intuire, però, che non esiste un programma che comprima meglio di un altro, per la semplice ragione che i migliori programmi sono ottimi in certi settori (cioè con certi tipi di file), e meno in altri. La scelta di un programma di archiviazione, dipende, in pratica, molto dall’utilizzo che se ne intende fare e su quale tipologia di file è stato applicato: potete utilizzare un programma generico, che è veloce e si comporta bene con tutti, oppure un programma più specifico, che eccelle in certe categorie.

Come si può notare da questa comparazione, Uharc è risultato ottimo soprattutto nella compressione di ISO e di file eseguibili (exe), a prezzo comunque di tempi abbastanza elevati (meno nei documenti), WinAce ha fatto un buon lavoro con WAV e BMP, 7z ha brillato negli stessi settori di Uharc (compressione inferiore, ma anche tempi molto più contenuti), mentre Stuffit X è risultato l’unico valido per i file di immagine JPG. Il vecchio WinZip si è difeso tutto sommato bene, se non altro per i tempi molto contenuti.

KGB Archiver, invece, ha ottenuto ottimi risultati quasi ovunque, ma a costo di tempi altissimi (oltre 10 volte il tempo rispetto a WinRar già con l’opzione Normal, oltre 90 volte con l’opzione Maximum). E’ stato tuttavia molto interessante vederlo superare gli altri nella maggior parte dei test e prenderlo come punto di riferimento.

Una delle cose che, osservando i dati del confronto, più riescono a incuriosire, è quanto un programma specifico possa migliorare rispetto ad uno generico: è il caso dei programmi specifici per la compressione audio, che hanno letteralmente travolto (sia come compressione che come tempi) quelli generici, o anche il caso delle immagini jpeg, in cui Stuffit X ha ottenuto risultati inarrivabili (24% di compressione contro percentuali vicine allo zero).

Considerando il rapporto tra compressione e velocità, è possibile in definitiva indicare WinRar come il programma più affidabile, dato che è sempre risultato nelle prime posizioni come compressione, e con tempi costantemente tra i migliori. Non è una vittoria netta, tuttavia è stato il più costante con tutti i tipi di file, anche se programmi interamente open source o freeware (7z, Uharc, KGB Archiver) non hanno minimamente sfigurato, ma che anzi, tranne nel caso delle immagini jpeg, hanno validamente tenuto testa a tutti gli altri.

Tag:compressione, kgb, paq, winrar, zip
CONTINUE READING >
3 comments
Mar 11 2007

Steganografia con Winrar

Posted by Antonio Troise
Tweet

La steganografia è quel tipo di tecnica che permette l’invio di messaggi nascosti all’interno di file di “copertura” (filigrana elettronica), come immagini o altri file multimediali: in questo tipo di file l’alterazione di pochi bit non altera in modo evidente il contenuto.

A tal proposito vi suggerisco di dare un’occhiata a questo interessante video tutorial che permette, senza l’installazione di alcun software aggiuntivo, di nascondere un file di testo all’interno di un file immagine (jpg) con l’uso sapiente del comando DOS copy:

copy /b secret.jpg + meeting.txt.rar lizard.jpg

per steganografare e di Winrar per rivelare il contenuto segreto.
Certo, questa tecnica, non cripta il contenuto del testo nascosto, per cui, la tecnica è utile se si intende nascondere l’informazione su una sola foto presente in un intero album fotografico, puntando anche sul fatto che magari nessuno è a conoscenza del “segreto nascosto”.

La steganografia, in sé, infatti, si basa sul concetto della sicurezza tramite segretezza: cerca di proteggere i dati semplicemente nascondendoli e non proteggendoli “davvero”. Proprio per questo molti programmi di steganografia prevedono di nascondere non i file in sé, ma in forma cifrata: in questo modo si ha la sicurezza “certa” data dalla crittografia in aggiunta a quella “incerta” data dalla steganografia.
I sostenitori della steganografia affermano che questa è utile soprattutto quando si vuole avere la possibilità di negare l’esistenza stessa di un’informazione in loro possesso (plausible deniability).

Per cui, se dovete nascondere informazioni davvero sensibili, non vi consiglio comunque questa tecnica perché esistono programma anche gratuiti che criptano a dovere le vostre informazioni.

[via Garret’s Blog e Wikipedia]

Tag:plausible_deniability, steganografia, Tutorial, Video, winrar
CONTINUE READING >
6 comments

Categorie

Commenti Recenti

  • Antonio Troise on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Fioredicollina on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Antonio Troise on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Emanuele on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Luca on iDatabase: la valida alternativa di Bento per macOS e iOS per i database personali

Meta

  • Accedi
  • Entries RSS
  • Comments RSS
  • WordPress.org

Friends Link

  • GamerTagMatch
  • SeguiPrezzi.it – Risparmia con Amazon.it
  • Trendy Nail

Seguimi su:

  • facebook
  • twitter
  • rss
Creative Commons License
Levysoft by Antonio Troise is licensed under a Creative Commons Attribuzione-Non commerciale 2.5 Italia License.
© Copyright 2004 - 2014 - Levysoft by Antonio Troise