Ubuntu Gnome 13.04

Ubuntu Gnome 13.04

        Finalmente dopo tante versioni di Ubuntu con Unity integrato,...

Ubuntu installazione Filezilla

Ubuntu installazione Filezilla

  Per tutti coloro che creano siti web hanno bisogno di un client FTP in grado di...

Ubuntu Tweak

L'installazione di questo programma per cambiare e modificare il DE di ubuntu ma non solo. E...

W.I.N.E. installazione

Un programma che su Linux non può mancare è sicuramente W.i.n.e.(Wine Is Not an Emulator)

Spotify per Ubuntu

Spotify per Ubuntu

Spotify è il nuovo servizio per ascoltare la musica in streming totalmente gratis scaricando...

Ubuntu 12.04 - TV RAI - Firefox

Ubuntu 12.04 - TV RAI - Firefox

Utilizzando Ubuntu 12.04 è possibile visualizzare i canali Rai? Per la visualizzazione...

W.I.N.E. - World of Worcraft - Pandaria

W.I.N.E. - World of Worcraft - Pandaria

 Installiamo il più bel prodotto Blizzard sul nostro Ubuntu attraverso WINE.

W.I.N.E. - Diablo 3

W.I.N.E. - Diablo 3

Un altro bellissimo gioco della Blizzar è sicuramente Diablo 3 si può installare con Wine in...

Ubuntu 12.04 Tetheing IPhone 4s

Ubuntu 12.04 Tetheing IPhone 4s

    Questo tutorial serve per utilizzare il nostro IPhone come modem, ormai le...

  • Ubuntu Gnome 13.04

    Ubuntu Gnome 13.04

    Martedì, 13 Agosto 2013 16:47

    Published in Ubuntu

  • Ubuntu installazione Filezilla

    Ubuntu installazione Filezilla

    Venerdì, 22 Febbraio 2013 10:31

    Published in Ubuntu

  • Ubuntu Tweak

    Domenica, 13 Gennaio 2013 14:56

    Published in Ubuntu

  • W.I.N.E. installazione

    Domenica, 27 Gennaio 2013 08:01

    Published in Ubuntu

  • Spotify per Ubuntu

    Spotify per Ubuntu

    Domenica, 05 Maggio 2013 08:23

    Published in Ubuntu

  • Ubuntu - Mobile - per i Telefonini

    Mercoledì, 30 Gennaio 2013 17:11

    Published in Ubuntu

  • Ubuntu 12.04 - TV RAI - Firefox

    Ubuntu 12.04 - TV RAI - Firefox

    Domenica, 24 Novembre 2013 10:32

    Published in Ubuntu

  • W.I.N.E. - World of Worcraft - Pandaria

    W.I.N.E. - World of Worcraft - Pandaria

    Domenica, 27 Gennaio 2013 11:28

    Published in Ubuntu

  • W.I.N.E. - Diablo 3

    W.I.N.E. - Diablo 3

    Lunedì, 28 Gennaio 2013 17:54

    Published in Ubuntu

  • Ubuntu 12.04 Tetheing IPhone 4s

    Ubuntu 12.04 Tetheing IPhone 4s

    Sabato, 02 Febbraio 2013 17:31

    Published in Ubuntu

Ubuntu 12.04 - OCR documenti con Tesseract

ubuntu-logo

 

 

 

È possibile prelevare da un immagine il testo contenuto in essa con Ubuntu? 

Quali programmi ci occorono per eseguire la conversione?

 

 

 

 

 

Per poter estrapolare dall' immagine il testo che vi è presente bisogna utilizzare la tecnologia OCR (Optical Caracter Recognition), che consente di riconoscere i caratteri dell' immagine e di poterli utilizzare come testo editabile e quindi modificabile.

 

In questo modo e possibile estrapolare da documenti cartacei digitalizzati dallo scanner quello che ci serve senza avere il peso dell' immagine.

Analizziamo i programmi che ci servono per questa operazione il programma «Tesseract-ocr» prelevabile dai repository di ubuntu ch'è il vero motore di tutto; «Xsane» programma per l'aquisizione dello scanner, «gImageReader».

Prima fase scarichiamo dai repository di Ubuntu Tesseract, imagemagick e xsane: si può utilizzare la parte grafica utilizzando il gestore di pacchetti oppure attraverso il terminale

tesse1tesse2

tesse2

attraverso il terminale è più semplice, aprite il terminale utilizzando la combinazione di tasti «Ctrl + Alt + T» scrivete «sudo su» e digitate la password (non si vede mentre scrivete per ragioni di sicurezza) poi selezionate la riga sottostante o riscrivetela.

apt-get install tesseract-ocr tesseract-ocr-ita xsane imagemagick

Parte Due preleviamo l'interfaccia grafica gImageReader dall'indirizzo di sourceforge.net scarichiamo il file Deb e lo installiamo all'interno del sistema o attraverso Gdebi oppure attraverso il terminale in questo modo 

wget -O gimagereader_0.8.1-1_all.deb http://sourceforge.net/projects/gimagereader/files/0.8.1/gimagereader_0.8.1-1_all.deb/download
dpkg -i gimagereader_0.8.1-1_all.deb
apt-get -f install; rm gimagereader_0.8.1-1_all.deb

Per i nuovi aggiornamenti di tesseract si può utilizzare il repository si Sandro Mani

add-apt-repository ppa:sandromani/gimagereader
apt-get update
apt-get install gimagereader tesseract-ocr tesseract-ocr-ita

 

troverete l'applicazione nel menu «Grafica»  

Abbiamo praticamente finito i programmi che ci servono sono presenti allinterno del computer e vediamo come utilizzarli.

Apriamo il programma Xsane per una scansione della pagina e settate il formato immagine in «TIFF», la risoluzione a 600 almeno, e il formato binario come nella foto sotto e poi premete «Acquisisci»

xsane3

 Carichiamo l'immagine all'interno di «gimagereader» settiamo il riconoscimento italiano o della lingua che v'interessa, selezioniamo il testo che vogliamo convertire e premiamo il tasto «riconoscere selezione» 

tesse4

 Si vedra sulla destra il testo selezionato che si puo salvare oppure copiare in qualche documento 

 

 

Aggiungi commento


Codice di sicurezza
Aggiorna


Abbiamo 16 visitatori e nessun utente online