Home / EasyLinux / 2009 / 02 / Trainingsziel Text

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

War doch klar...
(241 Punkte bei 17 Stimmen)
Re: War doch klar...
(178 Punkte bei 7 Stimmen)
Re: Skype für 64-Bit-Prozessor u. Suse 12.1
(161 Punkte bei 4 Stimmen)
Kubuntu verliert Finanzierung
(130 Punkte bei 4 Stimmen)
Offen fürs Geschäft
(80 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Trainingsziel Text

Texterkennung

Mannschaftssport: GOCR und Kooka

Soll GOCR mit Kooka ein Team bilden, braucht das OCR-Tool eine kleine Hilfestellung in Form eines selbstgeschriebenen Skripts. So sorgen Sie für eine gute Zusammenarbeit:

  1. Öffnen Sie einen Texteditor Ihrer Wahl (z. B. kate oder gedit) und erstellen Sie eine neue Datei namens gocr.sh. In diese tragen Sie die folgenden beiden Zeilen ein:

    #!/bin/bash
    /usr/bin/gocr -m 2 -p /home/<IhrBenutzername>/db/ $@

    Speichern Sie die Datei und schließen Sie den Editor.

  2. Machen Sie das neue Skript ausführbar. Im Dateimanager (Dolphin oder Nautilus) klicken Sie dazu mit der rechten Maustaste auf die Datei gocr.sh und öffnen den Dialog Eigenschaften. Wechseln Sie zum Reiter Zugriffsrechte bzw. Berechtigungen und setzen Sie ein Häkchen bei Datei als Programm ausführen bzw. Ausführbar.
  3. Öffnen Sie im KDE-Scanprogramm über den Menüpunkt Einstellungen / Kooka einrichten den Konfigurationsdialog. Klicken Sie links auf das Symbol OCR.
  4. In der rechten Fensterhälfte aktivieren Sie die Checkbox GOCR-Modul. Im Feld GOCR OCR ist als Voreinstellung für die ausführbare GOCR-Datei /usr/bin/gocr eingetragen. Da es hier keine Möglichkeit gibt, weitere Aufrufoptionen hinter den Befehl zu schreiben und Sie daher GOCR auf diese Weise nicht auffordern können, die persönliche Datenbank zu wählen, tragen Sie nun den Pfad zu Ihrem gerade geschriebenen Skript ein und bestätigen mit OK (Abbildung 7).

    Abbildung 7: In Kooka tragen Sie den Pfad zum selbst erstellten Skript ein, das GOCR mit speziellen Optionen aufruft.

  5. Danach starten Sie Kooka neu. Wählen Sie ein Bild aus der Kooka-Galerie aus oder scannen Sie ein Dokument neu ein. Danach klicken Sie entweder auf das Icon neben dem Druckersymbol, um die gesamte Bilddatei umzuwandeln, oder auf das Symbol daneben, um Teile des Textes zu wählen.
  6. Im folgenden Dialogfenster können Sie einige Feinabstimmungen für die Graustufen, Staubgröße und den Zeichenabstand vornehmen. Der Reiter Bild zeigt zur Bestätigung noch einmal die ausgesuchte Grafik, und auf dem letzten Reiter bietet Kooka verschiedene Rechtschreibprogramme zur Nachkontrolle an. (Leider funktionierte dieses Feature auf unseren Testsystemen nicht.) Mit einem Klick auf Zeichenerkennung (OCR) starten stoßen Sie die Texterkennung an.

Fazit

Richtig unproblematisch ist die Zusammenarbeit mit GOCR nicht – weder auf der Shell noch in den grafischen Scanprogrammen. Dennoch ist das freie OCR-Tool auf dem richtigen Weg, und mit ein bisschen Ausdauertraining erzielt es nach kurzer Zeit schon recht passable Ergebnisse.

Glossar

Serifen

Serifen, auch "Füßchen" genannt, sind die kleinen End-, An- oder Abstriche der Buchstaben. Diese Betonung der Mittel- und Grundlinien verbessert die Lesbarkeit.

Infos

[1] Liste unterstützter Scanner: http://www.sane-project.org/sane-supported-devices.html

[2] Artikel zur Scannereinrichtung unter Linux: Martin Loschwitz, "Linux scannt", EasyLinux 10/2004, S. 17 ff., http://www.easylinux.de/2004/10/017-scanner/

[3] Kooka-Homepage: http://kooka.kde.org/

[4] Scannereinrichtung unter Ubuntu: http://wiki.ubuntuusers.de/Scanner

[5] Artikel zu Scanprogrammen: Martin Loschwitz, "Gut erkannt, Dr Watson!", EasyLinux 10/2004, S. 20 ff., http://www.easylinux.de/2004/10/020-stools/

[6] Bildbearbeitung auf der Shell: Heike Jurzik, "Zauberhafte Bildbearbeitung", EasyLinux 06/2006, S. 89 ff., http://www.easylinux.de/2006/06/089-guru-convert/

Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare

Hits
Wertung: 0 Punkte (1 Stimme)

Schlecht Gut

Infos zur Publikation

Infos zur Publikation

title_2012_01

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

EasyLinux erscheint vierteljährlich und kostet EUR 9,80. Weitere Informationen zum Heft finden Sie auf der EasyLinux-Homepage.

Das EasyLinux-Jahresabo kostet EUR 33,30. Details zum EasyLinux-Jahresabo finden Sie im LNM-Shop.

Tipp der Woche

Duden Korrektor unter 64-Bit
Duden Korrektor unter 64-Bit
Tim Schürmann, 06.02.2012 10:36, 0 Kommentare

Der Duden Korrektor bietet eine äußerst nützliche Rechtschreib- und Grammatikkorrektur für LibreOffice und bringt in der aktuellen Version 8 e...

Aktuelle Fragen

Ubuntu 11.10 Compiz 3D Cube flackern
Moritz Obenauer, 12.02.2012 12:25, 0 Antworten
Hallo! Ich habe Ubuntu 11.10 mit Unity und den Compiz 3D Cube ein gerichtet. Er funktioniert...
Suse 12.1 Bootvorgang bleibt seit Update stehen
Wimpy *, 12.02.2012 09:22, 3 Antworten
Seit Update auf Kernel 3.1.9-1.4-desktop i686 bleibt der Bootvorgang stehen. Es erscheint der gr...
N24 Stick (Huawei E173) und Ubuntu 11.04
Patrick Obenauer, 11.02.2012 11:54, 1 Antworten
Hallo zusammen! Ich benutze einen alten Laptop, der mit Ubuntu 11.04 flott und problemlos läuft....
Wie kann man beim Einsatz von Compiz die Fenster-Dekoration einstellen?
GoaSkin , 10.02.2012 20:12, 0 Antworten
Hallo, ich nutze Linux Mint mit dem Gnome-Derivat Mate. Da die Distribution Compiz nicht autom...
rndc reload zone - failed bad zone
Ludwig jun. B., 06.02.2012 16:08, 2 Antworten
Schönen guten Tag, ich habe folgendes Problem. Immer wenn ich folgendes Kommando ausführen bek...