Home / LinuxUser / 2012 / 02 / In PDF- und PS-Dateien suchen

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

Eingedost
(161 Punkte bei 4 Stimmen)
Aufteiler
(161 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.

Suchen und Finden

In PDF- und PS-Dateien suchen

Device independent file format (DVI)

Etwas leichter hat es, wer für seine Dokumente das geräteunabhängige Dateiformat DVI [4] verwendet. Es entsteht beispielsweise als Zwischenergebnis, wenn man LaTeX-Dokumente nach Postscript übersetzt.

Sowohl Okular als auch der Veteran Xdvi ermöglichen eine Suche unabhängig von der Groß- und Kleinschreibung und heben die jeweiligen Fundstellen im Dokument farbig hervor. Xdvi gestattet bei der Recherche im Text auch die Verwendung regulärer Ausdrücke (Abbildung 4). Evince kann zwar ebenfalls DVI-Dateien lesen, fällt aber bei den verwendeten Fonts auf die Nase. Kurioserweise blieb im Test auch die Möglichkeit zur Suche deaktiviert.

Abbildung 4

Abbildung 4: So funktioniert die Suche im Betrachter Xdvi.

Zum im vorigen Abschnitt vorgestellten Aufruf auf der Kommandozeile für Postscript-Dateien gibt es mit dvitype ein Analogon für DVI:

dvitype Datei.dvi | grep --color Suchstring

Dvitype geht auf Donald E. Knuth zurück und bildet einen festen Bestandteil der Werkzeugsammlung des Textsatzsystems LaTeX. Das Tool analysiert die DVI-Datei und extrahiert neben den einzelnen Zeichen auch deren Position auf der Seite in der DVI-Datei. Mit Grep lassen sich dann jene Zeilen aus dem Ergebnis herausfiltern, die den Suchstring enthalten. In Bezug auf Umlaute und Encodings verhält sich Dvitype ähnlich unkomfortabel wie Pstotext und kommt ebenfalls nicht mit UTF-8 zurecht (Abbildung 5).

Abbildung 5

Abbildung 5: Ein "umlautbefreites" Suchergebnis nach der Ausgabe von Dvitype.

Portable Document Format

Anzeigeprogramme für das populäre PDF-Format gibt es inzwischen zuhauf. Die bekanntesten Werkzeuge dafür sind der Altmeister Xpdf sowie Evince aus dem Gnome-Projekt und Okular als KDE-Pendant. Als absolut ebenbürtig erweisen sich jedoch die deutlich schlankeren Alternativen Epdfview [5], Mupdf, Zathura und Apvlv. Die drei Letztgenannten orientieren sich in ihrer tastaturzentrierten Bedienung am Konzept des Texteditors Vi(m) [6].

Eine Liste freier PDF-Betrachter hält die Free Software Foundation Europe (FSFE) vor [7]. Sie setzt sich damit für eine anbieterunabhängige Auswahl ein und möchte der Öffentlichkeit Programme ins Bewusstsein rufen, die die vier Freiheiten respektieren – das Nutzen, Untersuchen, Weitergeben und Verbessern. Ein weiteres Ziel: Die starke Verknüpfung zwischen dem PDF-Format und Adobes Acrobat-Produktfamilie zu lösen sowie deutlich zu machen, dass es brauchbare und kostenfreie Alternativen gibt.

Alle Betrachter mit einer Menüleiste (Xpdf, Epdfview, Okular und Evince) verfügen über einen entsprechenden Menüpunkt zur Suche. Nach dessen Auswahl öffnet sich ein entsprechendes Eingabefenster. Bei allen Programmen mit Ausnahme von Xpdf erreichen Sie dieses Suchfenster zusätzlich über [Umschalt]+[7] ("/"). Dies spiegelt eine Tastenbelegung wieder, wie sie im Texteditor Vi(m) üblich ist. Die alternative Tastenkombination [Strg]+[F] unterstützen hingegen Evince, Okular, Epdfview und Xpdf.

Fast alle Programme blenden zur Suche am unteren Rand des Fensters eine kleine Leiste ein, teilweise mit einem Eingabefeld und mehreren Schaltflächen für die Suchrichtung und zusätzliche Optionen. Wieder kippt Xpdf aus der Reihe, bei dem ein separates Fenster erscheint.

Bei allen Programmen beginnt die Suche im Dokument bereits, noch während Sie das Suchwort eingeben. Der "Cursor" springt, ausgehend von der aktuellen Position, zum nächsten Suchtreffer im Dokument. Die Suche vorwärts und rückwärts bieten alle Betrachter an, nur jeweils verbunden mit einer anderen Tastenbelegung (siehe Tabelle "Tastenkombinationen"). Mit [Esc] blenden Sie die Leiste beziehungsweise das Suchfenster wieder aus.

Tastenkombinationen

PDF-Betrachter Suche vorwärts beginnen Suche rückwärts beginnen Suche vorwärts fortsetzen Suche rückwärts fortsetzen
Epdfview über GUI, [Umschalt]+[7],[Strg]+[F] n.v. [Eingabe] n.v.
Evince über GUI, [Umschalt]+[7],[Strg]+[F] n.v. [Strg]+[G] [Strg]+[Umschalt]+[G]
Okular über GUI, [Umschalt]+[7],[Strg]+[F] n.v. [F3] [Umschalt]+[F3]
Xpdf über GUI ("Fernglas"-Icon), [Strg]+[F] n.v. [Eingabe] n.v.
Apvlv [Umschalt]+[7] [Umschalt]+[ß] [N] [Umschalt]+[N]
Mupdf [Umschalt]+[7] [Umschalt]+[ß] [N] [Umschalt]+[N]
Zathura [Umschalt]+[7] [Umschalt]+[ß] [N] [Umschalt]+[N]
n.v. = nicht vorhanden; [Umschalt]+[7] = "/"; [Umschalt]+[ß] = "?"

Bei den Suchoptionen wird es teilweise recht dünn. Okular und Xpdf bieten immerhin eine Suche nach der exakten Groß- und Kleinschreibung an ("case sensitive"), Okular gestattet außerdem das Einschränken auf die aktuelle Seite (Abbildung 6). Evince blendet als Hilfe die Anzahl der Suchtreffer in der Suchleiste ein (Abbildung 7). Eine Suche mittels regulärer Ausdrücke lassen alle vier Programme vermissen.

Abbildung 6

Abbildung 6: Die Suchleiste in Okular (KDE).

Abbildung 7

Abbildung 7: Die Suchleiste in Evince (Gnome).

Tip a friend    Druckansicht Bookmark and Share
Kommentare
Suchen in Farbe
Markus Berlin, Freitag, 20. Januar 2012 09:37:48
Ein/Ausklappen

Vielen Dank für den schönen Artikel! Folgeartikel zu OCR oder auch zu genaueren PDF/PS-Innereien fände ich großartig. :)

Nur zwei Anmerkungen:

(1)

$ for datei in $(ls *.pdf); do pdftotext $datei - | grep --color Suchstring ; done

welchen Vorteil hat das gegenüber:

$ for datei in *.pdf; do pdftotext $datei - | grep --color Suchstring ; done

(2)

"""Da Less die farbliche Hervorhebung der Suchtreffer nicht übernimmt, können Sie dabei die grep-Option --color im Aufruf streichen."""

less übernimmt die Hervorhebung, wenn man ihm die Option "-R" gönnt.

Viele Grüße



Bewertung: 162 Punkte bei 13 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Hits
Wertung: 206 Punkte (13 Stimmen)

Schlecht Gut

Infos zur Publikation

Infos zur Publikation

LinuxUser 05/2014

Aktuelle Ausgabe kaufen:

Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,95 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 60,60) können Sie im Medialinx-Shop bestellen.

Tipp der Woche

Bilder vergleichen mit diffimg
Bilder vergleichen mit diffimg
Tim Schürmann, 01.04.2014 12:40, 1 Kommentare

Das kleine Werkzeug diffimg kann zwei (scheinbar) identische Bilder miteinander vergleichen und die Unterschiede optisch hervorheben. Damit lassen sich nicht nur Rätsel a la „Orignial und Fäls...

Aktuelle Fragen

programm suche
Hans-Joachim Köpke, 13.04.2014 10:43, 8 Antworten
suche noch programme die zu windows gibt, die auch unter linux laufen bzw sich ähneln sozusagen a...
Funknetz (Web-Stick)
Hans-Joachim Köpke, 04.04.2014 07:31, 2 Antworten
Bei Windows7 brauche ich den Stick nur ins USB-Fach schieben dann erkennt Windows7 Automatisch, a...
Ubuntu 13.10 überschreibt immer Windows 8 Bootmanager
Thomas Weiss, 15.03.2014 19:20, 8 Antworten
Hallo Leute, ich hoffe das ich richtig bin. Ich habe einen Dell Insipron 660 Ich möchte gerne Ub...
USB-PTP-Class Kamera wird nicht erkannt (Windows-only)
Wimpy *, 14.03.2014 13:04, 15 Antworten
ich habe meiner Frau eine Digitalkamera, AGFA Optima 103, gekauft und wir sind sehr zufrieden dam...
Treiber
Michael Kristahn, 12.03.2014 08:28, 5 Antworten
Habe mir ein Scanner gebraucht gekauft von Canon CanoScan LiDE 70 kein Treiber wie bekomme ich de...