AA_fetch_clicknow_sxc_678952.jpg

© Clicknow, sxc.hu

Dokumente indizieren und wiederfinden mit Docfetcher

Schnell gefunden

Indizierte Suchprogramme helfen bei großen Datenbeständen. Docfetcher erleichtert die Suche nach bestimmten Dateien.

Mit den Jahren wächst nicht nur die Lebenserfahrung, auch auf den Datenträgern sammeln sich im Laufe der Jahre etliche Dokumente an. Mit den herkömmlichen Mitteln der Ordnerstruktur und trotz sinnvoller Namen für Dateien findet sich hier nicht mehr allzu leicht und schnell etwas wieder. Einen Ausweg aus dieser Misere bieten Desktopsuchmaschinen: Sie ermöglichen es, den gesamten Datenbestand nach enthaltenen Begriffen zu durchsuchen.

Neben den unter Linux schon bekannten Vertretern dieser Zunft – Beagle, Tracker und Strigi – sowie der Google-Alternative Google Desktop mit Draht nach Mountain View existiert mit Docfetcher (http://docfetcher.sourceforge.net) eine weitere Alternative, die sogar von einem USB-Stick läuft.

Das Programm beherrscht die Suche in vielen Dateiformaten, darunter einfachen Textdateien, HTML, XML und SVG, PDF, verschiedenen Microsoft-Office-Formate (Word, Excel, Powerpoint), OpenOffice-Dokumenten (Calc, Draw und Impress) sowie RTF, Abiword und Microsoft Visio. Damit verfolgt es einen etwas anderen Ansatz als Catfish (siehe Artikel in dieser Ausgabe), das verschiedene Backends unter einem Dach vereint.

Nach dem Setup (siehe Kasten "Installation") starten Sie die Applikation über den entsprechenden Eintrag im Startmenü oder über den Befehl docfetcher in einer Konsole. Das Programmfenster besteht aus vier übersichtlichen Bereichen, wobei Sie primär den Suchbereich nutzen.

Installation

Docfetcher benötigt das Java Runtime Environment (JRE) ab Version 1.6.0. Sie können in einer Konsole den Befehl java -version eingeben, um die installierte Java-Version zu prüfen. Auf der Docfetcher-Homepage finden Sie ein Paket für Debian-basierte Distributionen, das Sie einfach über die jeweilige Funktion des Paketmanagements einspielen.

Sollten Sie eine Distribution mit einem anderen Paketierungssystem verwenden, nutzen Sie die portable Version, die als Zip-Archiv vorliegt. Laden Sie diese herunter und entpacken Sie sie in ein Verzeichnis Ihrer Wahl.

Bevor Sie eine Suche starten, gilt es zunächst einen Index zu erstellen. Hinter diesem Index verbirgt sich – wie bei einem Buch – ein Stichwortverzeichnis für Docfetcher. Für die schnelle Suche in Dokumenten durchstöbert die Software den Index nach den gewählten Suchbegriffen und zeigt bei Treffern das entsprechende Ergebnis an.

Das Indexmenü erreichen Sie über einen Klick mit der rechten Maustaste auf Suchbereich oder den Menüeintrag Index erstellen. Alternativ drücken Sie [Einfg]. Im ersten Schritt wählen Sie einen Ordner aus, den Sie indizieren wollen. Berücksichten Sie bei der Auswahl des zu indizierenden Ordners, dass das Erstellen des Index unso länger dauert, je größer die Anzahl der Dateien in diesem Ordner ausfällt. Während generische Desktopsuchmaschinen, wie Tracker unter Gnome, das Indizieren im Hintergrund erledigen, steht Docfetcher für die Dauer des Indexlaufs nicht zur Suche bereit.

Haben Sie sich für einen Ordner entschieden, öffnet sich für diesen der Dialog Indexverwaltung (Abbildung 1), den Sie in der Regel direkt mit Start bestätigen. Docfetcher visualisiert nun das Auslesen der Informationen aus den Dokumenten im ausgewählten Ordner und den gegebenenfalls dort enthaltenen Unterordnern.

Abbildung 1: Über den Dialog Indexverwaltung stoßen Sie den Aufbau eines Index für einen Dateiordner an.

Dokumente finden

Falls Sie keine weiteren Indizes anlegen möchten, können Sie nun mit der Suche starten. Geben Sie dazu in das Eingabefeld den oder die gewünschten Begriffe ein. Docfetcher sucht dann nach Dokumenten, die einen der beiden Begriffe beinhalten. Um Dokumente zu finden, die beide Begriffe beinhalten, verknüpfen Sie die Suchbegriffe mit einem logischen AND, zum Beispiel rechnung AND 2010. Möchten Sie eine bestimmte Wortfolge suchen, setzen Sie diese in Anführungszeichen, zum Beispiel "Chancen nutzen".

Zusätzlich haben Sie die Möglichkeit, Begriffe auszuschließen oder mit Platzhaltern zu suchen. Um einen Begriff auszuschließen, setzen Sie einfach ein Minuszeichen davor: Haus -bauen. Für die Suche mit Platzhaltern stehen das Fragezeichen und der Stern (Asterisk) bereit. Mit dem Fragenzeichen ersetzen Sie bei der Suche in Begriffen ein unbekanntes Zeichen. So erlaubt der Begriff bal? zum Beispiel die Suche nach "bald" oder "ball". Das Sternsymbol ersetzt dagegen mehrere unbekannte Zeichen: Haus* sucht nach allen Begriffen, die mit der Zeichenkette Haus beginnen.

Mit [Eingabe] starten Sie die Suchabfrage. Docfetcher zeigt daraufhin die Ergebnisse im entsprechenden Bereich an. Das Programm erlaubt es, diese zusätzlich zum Optimieren auch noch zu filtern. Auf der linken Fensterseite finden Sie alle Dateitypen, für die ein Suchfilter aktiv ist. Um zum Beispiel alle Word-Dokumente auszublenden, entfernen Sie das Häkchen bei MS Word (doc) und MS Word 2007 (docx, docm).

Der Filter wirkt sich unmittelbar auf das Ergebnis aus. Das gleiche gilt auch für mehrere Indizes: Sobald Sie das Kontrollkästchen vor einem Indexeintrag deaktivieren, blendet die Software alle Suchergebnisse aus diesem Index unverzüglich aus. Bei Bedarf grenzen Sie zusätzlich die Suche hinsichtlich der Dateigröße ein, indem Sie über die entsprechenden Felder unter Minimale / Maximale Dateigröße oben links (Abbildung 2) Dateien ausschließen. Befinden sich zum Beispiel viele kleine Textdateien oder riesige PDF-Dokumente für den professionellen Druck in einem Ordner, sparen Sie diese schon im Vorfeld aus.

Abbildung 2: Das Interface von Docfetcher zeigt auf einen Blick Filter, Indizes und Ergebnis an.

Vorschau und Anzeige

Damit Sie nicht gleich jedes PDF- oder Office-Dokument in dem von Ihnen installierten Betrachter laden müssen, präsentiert Docfetcher für Dateien aus dem Suchergebnis auf Mausklick eine Vorschau. Dabei handelt es sich allerdings um eine reine Textanzeige, sie sehen den Inhalt also ohne jegliche Formatierung und ohne Grafiken. Sicher fällt diese Art der Darstellung auf dem ersten Blick ein wenig gewöhnungsbedürftig aus, dafür geht sie sparsam mit den Systemressourcen um.

Nach dem Öffnen einer Datei per Doppelklick minimiert sich Docfetcher. Über ein entsprechendes Symbol in der Systemleiste rufen Sie es im Anschluss bei Bedarf wieder auf. Um ohne Umschweife schnell auf Docfetcher zuzugreifen, können Sie das Tool auch über die Tastenkombination [Strg]+[F8] direkt ansteuern.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Aktuelle Software
  • Software
    Im Quartalsrhythmus erscheinen viele Programme in neuer Version. Eine Auswahl stellen wir regelmäßig vor. Auf der Heft-DVD finden Sie die passenden Pakete und Installationshinweise (Teil 2/2).
  • Aktuelle Software im Kurztest
  • Neue Software (Teil 2/2)
    Im Quartalsrhythmus erscheinen viele Programme in neuer Version. Eine Auswahl stellen wir regelmäßig vor. Auf der Heft-DVD finden Sie die passenden Pakete und Installationshinweise. (Teil 2/2)
  • Sherlock Holmes der Neuzeit
    Seit einigen Wochen steht die lokale Suchmaschine Google Desktop auch für Linux zur Verfügung. Ob es gegen den Protagonisten Beagle bestehen kann, zeigt der Test.
Kommentare

Infos zur Publikation

LU 11/2017: Server für Daheim

Digitale Ausgabe: Preis € 8,50
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Stellenmarkt

Aktuelle Fragen

Lieber Linux oder Windows- Betriebssystem?
Sina Kaul, 13.10.2017 16:17, 3 Antworten
Hallo, bis jetzt hatte ich immer nur mit
IT-Kurse
Alice Trader, 26.09.2017 11:35, 2 Antworten
Hallo liebe Community, ich brauche Hilfe und bin sehr verzweifelt. Ih bin noch sehr neu in eure...
Backup mit KUP unter Suse 42.3
Horst Schwarz, 24.09.2017 13:16, 3 Antworten
Ich möchte auch wieder unter Suse 42.3 mit Kup meine Backup durchführen. Eine Installationsmöglic...
kein foto, etc. upload möglich, wo liegt mein fehler?
kerstin brums, 17.09.2017 22:08, 5 Antworten
moin, zum erstellen einer einfachen wordpress website kann ich keine fotos uploaden. vom rechne...
Arch Linux Netzwerkkonfigurationen
Franziska Schley, 15.09.2017 18:04, 0 Antworten
Moin liebe Linux community, ich habe momentan Probleme mit der Einstellung des Lan/Wlan in Arc...