Levysoft
  • Home
  • Portfolio
  • WordPress Plugin
  • Contattami

Dal 2004 il blog di Antonio Troise

RSS FeedTwitterFacebook
Dic 4 2016

BookScanner Pro di ABBYY: come riconoscere il testo delle pagine di libri con il Cloud

Posted by Antonio Troise
Tweet

Oggigiorno, gli ingombranti scanner desktop sono uno strumento sempre più in disuso per un utilizzo non professionale, perchè sostituiti dai più intuitivi smartphone che, grazie alla loro crescente capacità di elaborazione e sfruttando intelligentemente la fotocamera, hanno reso il mobile data capture, ovvero l’acquisizione dati e di elaborazione documenti in qualsiasi luogo, una realtà. E anche vero, però, che tra i tanti prodotti disponibili nell’App Store non ne esiste nessuno che abbia un avanzato riconoscimento ottico dei caratteri e tutti si limitano ad effettuare una mera fotografia della pagina con un filtro in bianco e nero, generando un banale PDF. Se questa funzione ai più può sembrare sufficiente (si pensi alla scansione di un documento in un PDF non modificabile) a molti questa potrebbe essere una limitazione nel caso si vogliano scansionare alcune pagine di documenti scritti senza doverli per forza trascrivere a mano. Ed è per questo genere di persone che ABBYY, azienda leader nello sviluppo di tecnologie di riconoscimento ottico dei caratteri, ha pensato di creare la app ABBYY BookScanner Pro per iOS.

Caratteristiche

ABBYY BookScanner Pro per iOS è una app realizzata con lo scopo principale di digitalizzare libri e documenti direttamente con la fotocamera del proprio smartphone. Grazie alla tecnologia proprietaria di riconoscimento del testo (OCR), è possibile effettuare modifiche al testo scansionato e quindi condividere anche solo parte di una pagina.

Questa app, che si basa su due tecnologie proprietarie (BookScan e ABBYY Mobile OCR Engine) permette il riconoscimento ottico dei caratteri di un testo stampato in ben 193 lingue diverse (incluso il cirillico e alfabeti CJK), preservando la formattazione originale.

Uno dei grandi pregi di ABBYY BookScanner Pro è quello di riuscire a rilevare automaticamente i bordi delle pagine del libro e di poter correggere le imperfezioni come le distorsioni ottiche e i difetti dovuti alla scarsa illuminazione.

Le pagine fotografate vengono salvate in formato JPEG, o PDF multipagina, mentre il documento scansionato può essere salvato come un documento multi pagina in 12 formati. In questo modo, si possono creare facilmente i propri eBooks modificabili e ricercabili.

Le scansioni dei libri digitalizzati (facilmente taggabili per facilitare la ricerca anche direttamente da Spotlight) possono essere salvate all’interno dell’applicazione, salvate sul proprio servizio cloud preferito (iCloud Drive, Dropbox, Google Drive, Evernote, etc) oppure trasferiti a un Mac o un PC tramite la funzione di condivisione file di iTunes, e inviati via email o iMessage.

Funzionamento

Basata sulle tecnologie e piattaforme ABBYY, BookScanner Pro usa la stessa tecnologia della soluzione di acquisizione dati mobile che trasforma smartphone e tablet in efficienti dispositivi di input o in scanner portatili per l’acquisizione dei dati.

BookScanner Pro

In pratica abbiamo 4 fasi di elaborazione:

  1. L’utente utilizza la fotocamera del proprio telefono cellulare o tablet per fotografare un documento e inviarne l’immagine ad un server di acquisizione dati per l’elaborazione
  2. Un server di acquisizione dati basato su cloud estrae le informazioni dall’immagine e invia i dati nuovamente al dispositivo mobile di partenza per la verifica
  3. L’utente controlla i risultati ed, eventualmente, li corregge
  4. Sul dispositivo mobile viene confermata l’elaborazione corretta

Su questo principio, in effetti, la app ha funzionato perfettamente. Infatti, nelle mie prove con un libro, ho potuto appurare che questa tecnologia, anche se forse leggermente lenta per la scansione di un intero libro, a causa di una evidente lentezza nel trasferimento remoto dei dati ad un server per l’elaborazione dei dati, è risultata essere sorprendentemente precisa nel riconoscimento dei caratteri.

La prova

Dopo aver inquadrato con la app, aiutato anche dalle linee guida, le due pagine di un libro da scansionare

BookScanner Pro 2

e aver scattato la foto dal proprio cellulare, l’immagine è stata subito inviata ad un server remoto

BookScanner Pro 3

e, mentre si attendeva il riconoscimento OCR delle pagine, si poteva verificare l’immagine che era stata scattata:

BookScanner Pro 5

Dopo qualche decina di secondi di elaborazione remota

BookScanner Pro 7

il documento finalmente viene uploadato dal server cloud e finalmente si ottiene un testo perfettamente evitabile ed esportabile in qualsiasi formato come DOCX, PDF, TXT.

BookScanner Pro 9

Dove trovarla

BookScanner Pro per iOS

BookScanner Pro è disponibile per l’acquisto direttamente su Appstore a questo link, al prezzo di 10.99€.

Tag:ebook, ocr, PDF, scanner
CONTINUE READING >
0 comments
Mag 19 2009

Tips Mac: Ridurre le dimensioni di un file PDF con il filtro Quartz di Anteprima di Mac OS X Leopard

Posted by Antonio Troise
Tweet

La carta riciclata, specie negli ambienti di lavoro, è oramai di uso comune nella stampa di documenti. E i vantaggi, oltre che ambientali, sono molti, tra cui una più facile lettura rispetto alla carta bianca che, a volte, in determinate condizioni di luce, può risultare anche più faticosa durante la lettura. Ma uno svantaggio che ho notato della carta riciclata è quello di aumentare le dimensioni dei file pdf nel momento in cui si vuole scannerizzare (nonostante questo termine suoni male, l’Accademia della Crusca ha detto che è oramai lecito e fa parte della lingua italiana) un documento stampato su questa tipologia di carta (è il caso, per esempio, di documenti firmati da mandare via email). Infatti, se si acquisisce con uno scanner un documento su carta bianca come immagine (ovviamente non posso usare la funzione OCR, sia perché la firma potrebbe non essere acquisita come immagine, sia perché un documento firmato dovrebbe essere non modificabile), la maggior parte dei software di gestione, creano un documento in bianco e nero. Se invece si acquisisce un documento su carta riciclata, essendo questa, notoriamente, di colore giallo tenue (almeno la risma che uso io), il software di gestione, se non si imposta preventivamente la possibilità di acquisirlo in bianco e nero, tende a scansionare il documento a colori, preservandone il colore di sfondo.

PDF - Originale

E la differenza si sente: 152 KB per una pagina di PDF in bianco e nero contro 6,2 MB per una pagina di PDF a colori. E’ evidente che non tutte le caselle di posta gestiscono allegati così grandi!
Quello che è capitato a me è stato proprio questo: quando a casa ho acquisito il documento, nella fretta, non ho pensato di scansionarlo in bianco e nero, per cui quando al lavoro, mi sono trovato ad inviarlo per mail mi sono accorto delle dimensioni eccessive per una singola pagina PDF. Se avessi avuto uno scanner avrei potuto benissimo rieffettuare la scansione ma dove mi trovavo non ho potuto farlo. Così ho aperto il PDF con Anteprima di Mac OS X Leopard, e dal menu Archivio, cliccare su Registra col nome…

PDF - Filtro Quartz - 1

nella finestra che si aprirà, è possibile impostare un parametro particolare che fa al caso nostro: il Filtro Quartz. Il valore che vi consiglio è di settare la voce “Black & White”

PDF - Filtro Quartz - 2

che nel nostro caso, trasformerà l’immagine a colori della vostra pagina PDF in una in bianco e nero, con conseguente riduzione delle dimensioni del file (passato ora a 152 KB).

PDF - Bianco e Nero

Non vi consiglio, invece, l’opzione del filtro Quartz “Reduce File Size”, in quanto, nonostante le dimensioni passeranno da 6,2 MB a ben 32 KB, il documento risulterà totalmente illeggibile,poiché il font verrà squadrettato.

PDF - Reduce
Tag:Mac os x, PDF, scanner, Software, Tips, Tips Mac
CONTINUE READING >
0 comments
SeguiPrezzi - Risparmia con Amazon.it

Categorie

Commenti Recenti

  • Antonio Troise on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Fioredicollina on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Antonio Troise on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Emanuele on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Luca on iDatabase: la valida alternativa di Bento per macOS e iOS per i database personali

Meta

  • Accedi
  • Entries RSS
  • Comments RSS
  • WordPress.org

Friends Link

  • GamerTagMatch
  • SeguiPrezzi.it – Risparmia con Amazon.it
  • Trendy Nail

Seguimi su:

  • facebook
  • twitter
  • rss
Creative Commons License
Levysoft by Antonio Troise is licensed under a Creative Commons Attribuzione-Non commerciale 2.5 Italia License.
© Copyright 2004 - 2014 - Levysoft by Antonio Troise