Home / LinuxUser / 2012 / 02 / In PDF- und PS-Dateien suchen

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

„Klickbunt auf dem Server? Warum nicht, wenn's hilft!"
(179 Punkte bei 5 Stimmen)
Mit Openbox 3.5
(143 Punkte bei 5 Stimmen)
Bezahlstandard
(121 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.

Suchen und Finden

In PDF- und PS-Dateien suchen

Device independent file format (DVI)

Etwas leichter hat es, wer für seine Dokumente das geräteunabhängige Dateiformat DVI [4] verwendet. Es entsteht beispielsweise als Zwischenergebnis, wenn man LaTeX-Dokumente nach Postscript übersetzt.

Sowohl Okular als auch der Veteran Xdvi ermöglichen eine Suche unabhängig von der Groß- und Kleinschreibung und heben die jeweiligen Fundstellen im Dokument farbig hervor. Xdvi gestattet bei der Recherche im Text auch die Verwendung regulärer Ausdrücke (Abbildung 4). Evince kann zwar ebenfalls DVI-Dateien lesen, fällt aber bei den verwendeten Fonts auf die Nase. Kurioserweise blieb im Test auch die Möglichkeit zur Suche deaktiviert.

Abbildung 4: So funktioniert die Suche im Betrachter Xdvi.

Zum im vorigen Abschnitt vorgestellten Aufruf auf der Kommandozeile für Postscript-Dateien gibt es mit dvitype ein Analogon für DVI:

dvitype Datei.dvi | grep --color Suchstring

Dvitype geht auf Donald E. Knuth zurück und bildet einen festen Bestandteil der Werkzeugsammlung des Textsatzsystems LaTeX. Das Tool analysiert die DVI-Datei und extrahiert neben den einzelnen Zeichen auch deren Position auf der Seite in der DVI-Datei. Mit Grep lassen sich dann jene Zeilen aus dem Ergebnis herausfiltern, die den Suchstring enthalten. In Bezug auf Umlaute und Encodings verhält sich Dvitype ähnlich unkomfortabel wie Pstotext und kommt ebenfalls nicht mit UTF-8 zurecht (Abbildung 5).

Abbildung 5: Ein "umlautbefreites" Suchergebnis nach der Ausgabe von Dvitype.

Portable Document Format

Anzeigeprogramme für das populäre PDF-Format gibt es inzwischen zuhauf. Die bekanntesten Werkzeuge dafür sind der Altmeister Xpdf sowie Evince aus dem Gnome-Projekt und Okular als KDE-Pendant. Als absolut ebenbürtig erweisen sich jedoch die deutlich schlankeren Alternativen Epdfview [5], Mupdf, Zathura und Apvlv. Die drei Letztgenannten orientieren sich in ihrer tastaturzentrierten Bedienung am Konzept des Texteditors Vi(m) [6].

Eine Liste freier PDF-Betrachter hält die Free Software Foundation Europe (FSFE) vor [7]. Sie setzt sich damit für eine anbieterunabhängige Auswahl ein und möchte der Öffentlichkeit Programme ins Bewusstsein rufen, die die vier Freiheiten respektieren – das Nutzen, Untersuchen, Weitergeben und Verbessern. Ein weiteres Ziel: Die starke Verknüpfung zwischen dem PDF-Format und Adobes Acrobat-Produktfamilie zu lösen sowie deutlich zu machen, dass es brauchbare und kostenfreie Alternativen gibt.

Alle Betrachter mit einer Menüleiste (Xpdf, Epdfview, Okular und Evince) verfügen über einen entsprechenden Menüpunkt zur Suche. Nach dessen Auswahl öffnet sich ein entsprechendes Eingabefenster. Bei allen Programmen mit Ausnahme von Xpdf erreichen Sie dieses Suchfenster zusätzlich über [Umschalt]+[7] ("/"). Dies spiegelt eine Tastenbelegung wieder, wie sie im Texteditor Vi(m) üblich ist. Die alternative Tastenkombination [Strg]+[F] unterstützen hingegen Evince, Okular, Epdfview und Xpdf.

Fast alle Programme blenden zur Suche am unteren Rand des Fensters eine kleine Leiste ein, teilweise mit einem Eingabefeld und mehreren Schaltflächen für die Suchrichtung und zusätzliche Optionen. Wieder kippt Xpdf aus der Reihe, bei dem ein separates Fenster erscheint.

Bei allen Programmen beginnt die Suche im Dokument bereits, noch während Sie das Suchwort eingeben. Der "Cursor" springt, ausgehend von der aktuellen Position, zum nächsten Suchtreffer im Dokument. Die Suche vorwärts und rückwärts bieten alle Betrachter an, nur jeweils verbunden mit einer anderen Tastenbelegung (siehe Tabelle "Tastenkombinationen"). Mit [Esc] blenden Sie die Leiste beziehungsweise das Suchfenster wieder aus.

Tastenkombinationen

PDF-Betrachter

Suche vorwärts beginnen

Suche rückwärts beginnen

Suche vorwärts fortsetzen

Suche rückwärts fortsetzen

Epdfview über GUI, [Umschalt]+[7],[Strg]+[F] n.v. [Eingabe] n.v.
Evince über GUI, [Umschalt]+[7],[Strg]+[F] n.v. [Strg]+[G] [Strg]+[Umschalt]+[G]
Okular über GUI, [Umschalt]+[7],[Strg]+[F] n.v. [F3] [Umschalt]+[F3]
Xpdf über GUI ("Fernglas"-Icon), [Strg]+[F] n.v. [Eingabe] n.v.
Apvlv [Umschalt]+[7] [Umschalt]+[ß] [N] [Umschalt]+[N]
Mupdf [Umschalt]+[7] [Umschalt]+[ß] [N] [Umschalt]+[N]
Zathura [Umschalt]+[7] [Umschalt]+[ß] [N] [Umschalt]+[N]

n.v. = nicht vorhanden; [Umschalt]+[7] = "/"; [Umschalt]+[ß] = "?"

Bei den Suchoptionen wird es teilweise recht dünn. Okular und Xpdf bieten immerhin eine Suche nach der exakten Groß- und Kleinschreibung an ("case sensitive"), Okular gestattet außerdem das Einschränken auf die aktuelle Seite (Abbildung 6). Evince blendet als Hilfe die Anzahl der Suchtreffer in der Suchleiste ein (Abbildung 7). Eine Suche mittels regulärer Ausdrücke lassen alle vier Programme vermissen.

Abbildung 6: Die Suchleiste in Okular (KDE).

Abbildung 7: Die Suchleiste in Evince (Gnome).

Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare
Suchen in Farbe
Markus Berlin, Freitag, 20. Januar 2012 09:37:48
Ein/Ausklappen

Vielen Dank für den schönen Artikel! Folgeartikel zu OCR oder auch zu genaueren PDF/PS-Innereien fände ich großartig. :)

Nur zwei Anmerkungen:

(1)

$ for datei in $(ls *.pdf); do pdftotext $datei - | grep --color Suchstring ; done

welchen Vorteil hat das gegenüber:

$ for datei in *.pdf; do pdftotext $datei - | grep --color Suchstring ; done

(2)

"""Da Less die farbliche Hervorhebung der Suchtreffer nicht übernimmt, können Sie dabei die grep-Option --color im Aufruf streichen."""

less übernimmt die Hervorhebung, wenn man ihm die Option "-R" gönnt.

Viele Grüße



Bewertung: 154 Punkte bei 9 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Hits
Wertung: 206 Punkte (13 Stimmen)

Schlecht Gut

Infos zur Publikation

Infos zur Publikation

title_2013_06

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,95 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 60,60) können Sie im Medialinx-Shop bestellen.

Tipp der Woche

Terminator
Viele Terminals im Griff mit Terminator
Tim Schürmann, 07.05.2013 10:57, 1 Kommentare

Wer morgens nach dem Einschalten des Rechners erst einmal mehrere Terminals öffnet und sich diese mühevoll auf dem Bildschirm drapiert, der sollte einen Blick auf Terminator werfen. Das kleine...

Aktuelle Fragen

Kontakt via QR code hinzufügen
Herman Sproesser, 17.05.2013 17:46, 3 Antworten
Hi hab in der aktuellen ausgabe 06.2013 den artikel über QR Codes gelesen. Ich hab nartürlich...
Dateimanager Dolphin, wo legt er die Datei Kommentare ab?
Uwe Heine, 16.05.2013 15:19, 1 Antworten
Suse Linux 12.1 - KDE 4.7.2 / Dolphin 1.7. Ich habe bei vielen Dateien über Dolphin Kommentare...
wie baut man Kernel Module so, dass sie mit jedem Kernel laden?
GoaSkin , 22.04.2013 10:22, 1 Antworten
Hallo, baut man anhand eines Kernel-Sources Module, nutzt Linux im Normalfall eine strikte V...
Problem beim Installieren von SuSe 12.3
Georg Prokert, 14.04.2013 00:04, 16 Antworten
Hallo, auf meinem neuem Laptop (Acer Aspire V3-771, Intel Core i5-3230 M, Intel HD Graphics 4...
lvm wieder loswerden
Peter Dibbern, 11.04.2013 16:28, 4 Antworten
Ich habe sämtliche alten Kisten ausgeschlachtet und aus der Teilen einen Rechner zusammengeschrau...