Aus EasyLinux 03/2013

Software

Neue Software (Teil 2/2)

Im Quartalsrhythmus erscheinen viele Programme in neuer Version. Eine Auswahl stellen wir regelmäßig vor. Auf der Heft-DVD finden Sie die passenden Pakete und Installationshinweise (Teil 2/2).

DocFetcher – plattformübergreifende Desktop-Suchmaschine

Die Desktop-Suchmaschine DocFetcher hat im Vergleich zum in KDE eingebauten Nepomuk zwei Vorteile aufzuweisen: Sie indiziert auch neuere Microsoft-Office-Dateien, und sie funktioniert auch ohne Ressourcen fressenden Hintergrunddienst.

Ohne Suchmaschinen wäre das Internet beinahe nutzlos, denn wie sollte man in den Abermilliarden Dokumenten die gewünschte Information finden? Auch wenn die Zahl der Dokumente auf der heimischen Festplatte ein paar Größenordnungen kleiner ausfällt und der Computerbenutzer selbst die Verzeichnisstruktur anlegt, ist es nur allzu menschlich, hin und wieder den Überblick zu verlieren. Darum integriert die KDE-Desktop-Umgebung die Desktop-Suchmaschine Nepomuk, die den Inhalt der Dateien im Heimatverzeichnis durchforstet.

Stromfresser

Allerdings gerät der Einsatz von Nepomuk schnell zur Rechnerressourcenschlacht, wenn die Zahl der Dateien in den überwachten Verzeichnissen wächst. Der Hintergrunddienst braucht dann viel Speicher. Außerdem startet KDE mit aktiviertem Nepomuk deutlich langsamer: Die Software prüft beim Hochfahren alle Ordner auf Änderungen seit dem letzten Abmelden. Viele Benutzer deaktivieren den Indizierer daher in den Systemeinstellungen. Auf Laptops ist diese Optimierung wegen der Akkulaufzeit fast ein Muss.

CPU-schonende Alternativen zur KDE-Desktop-Suchmaschine bieten Recoll [1] und DocFetcher (Abbildung #) [2]. Letzteres Programm zeichnet sich dadurch aus, dass es die Dateiformate von Microsoft-Word-, Excel- und Visio-Dateien kennt, und zwar nicht nur die alten doc-Formate bis Word 2003, sondern auch die ab Office 2007 eingesetzten OpenXML-Formate (docx, xlsx oder pptx). Daher ist das Programm besonders für Windows-Umsteiger zu empfehlen, auch wenn die Entwickler die Microsoft-Office-Unterstützung deswegen eingebaut haben, weil das Java-Programm auch unter Windows läuft. Es versteht aber auch die Open-/LibreOffice-Dateiformate und lässt sich daher auf beiden Systemen gleich gut nutzen.

Abb. #: Die Desktop-Suchmaschine DocFetcher läuft unter Linux und Windows und kommt auch mit den unter beiden Systemen gebräuchlichen Dateiformaten zurecht.
Abb. #: Die Desktop-Suchmaschine DocFetcher läuft unter Linux und Windows und kommt auch mit den unter beiden Systemen gebräuchlichen Dateiformaten zurecht.

Außerdem kennt es das RTF-Format, ein klassisches Austauschformat für formatierten Text, sowie Abiword-Dateien. Neben den Office-Formaten indiziert die Software auch die Tags von JPG-, PNG- und SVG-Grafikdateien sowie Musikdateien im MP3- und Flac-Format. Auch PDF- und simple Textdateien werden indiziert.

Bereit zum Auspacken

DocFetcher benötigt keine Installation: Entpacken Sie einfach das Zip-Archiv und starten Sie das Programm mit einem Klick auf DocFetcher.sh.

Die Benutzeroberfläche ist schlicht gehalten: Links oben entscheiden Sie, welche Dateiformate die Suche erfasst. Im Unterfenster Suchbereich darunter wählen Sie die zu durchsuchenden Verzeichnisse, für die Sie allerdings zuvor einen Index erzeugen müssen. Das geschieht mit einem Rechtsklick auf das Unterfenster Suchbereich.

Da DocFetcher auf die auch im Unternehmensbereich genutzte leistungsstarke Suchmaschinen-Engine Lucene setzt, dauert selbst das Indizieren von Ordnern mit Zigtausend Dateien meist nur wenige Minuten. Natürlich hängt die Geschwindigkeit auch von Größe und Typ der enthaltenen Dateien ab.

Zum Suchen geben Sie einfach ein Schlagwort in das Textfeld neben dem Suchen-Button ein. Sie dürfen auch mehrere Begriffe mit OR und AND verknüpfen. Auch die Verneinung NOT versteht das Programm, um Dokumente mit bestimmten Schlagwörtern auszuschließen.

Wenn Sie nach einer genauen Abfolge von Worten suchen möchten, umschließen Sie diese wie bei Google mit Anführungszeichen. Das Fragezeichen steht für genau ein beliebiges Zeichen, ein Stern (*) für eine nicht festgelegte Anzahl unbekannter Zeichen (inklusive 0 Zeichen).

Doch damit nicht genug: DocFetcher beherrscht auch eine Suche nach ähnlichen Schlagwörtern: Seite~ findet nicht nur Vorkommen von „Seite“ sondern auch von „Saite“. In der Praxis noch nützlicher ist die Nachbarschaftssuche, mit der Sie Begriffe finden, zwischen denen nicht mehr als eine bestimmte Zahl anderer Wörter steht: schönes Leben ~2 trifft nur zu, wenn maximal zwei Wörter zwischen schönes und Leben stehen.

Auf dem Laufenden bleiben

Es gibt drei Verfahren, um die DocFetcher-Schlagwortlisten aktuell zu halten: Am einfachsten ist es, nach einem Rechtsklick auf einen Eintrag im Unterfenster Suchbereich / aktualisieren auszuwählen. Alternativ starten Sie auf der Kommandozeile /Pfad/zum/DocFetcher-Ordner/DocFetcher.sh --update-indexes. Dieser Aufruf frischt alle Indizes in einem Arbeitsschritt auf. Nach dem Eintragen des Befehls in den Aufgabenplaner der KDE-Systemeinstellungen läuft er automatisch im festgelegten Zeitabstand ab.

DIESEN ARTIKEL ALS PDF KAUFEN
EXPRESS-KAUF ALS PDFUmfang: 3 HeftseitenPreis €0,99
(inkl. 19% MwSt.)
KAUFEN
EasyLinux 03/2013 KAUFEN
EINZELNE AUSGABE Print-Ausgaben Digitale Ausgaben
ABONNEMENTS Print-Abos Digitales Abo
TABLET & SMARTPHONE APPS
Deutschland

Hinterlasse einen Kommentar

  E-Mail Benachrichtigung  
Benachrichtige mich zu: