Aufmacher Artikel

Suchspiel

Test: Desktop-Suchpmaschinen

10.01.2008 Im Laufe der Zeit wachsen die Datenmengen auf dem Rechner in beinahe unüberschaubare Dimensionen. Desktop-Suchprogramme helfen Ihnen, den Überblick zu behalten.

Jeder Computer-Anwender steht über Kurz oder Lang vor dem Problem, dass sich im Laufe der Jahre eine Unmenge an Daten ansammelt, bei der auch der ordnungsliebendste Mensch leicht den Überblick verliert. Finden Sie Dateien noch relativ leicht anhand ihrer Erweiterungen und des Alters, ist das Ende der Fahnenstange erreicht, wenn es um die Suche in deren Inhalten geht.

Hier helfen Volltextsuchprogramme, die nicht nur Namen speichern, sondern den kompletten Inhalt von Textdokumenten indizieren, während normale Suchprogramme wie die GNU Find Utilities (siehe Kasten Suchen mit Locate) lediglich die Suche nach Namen und Erweiterung ermöglichen. Damit sind die Fähigkeiten solcher Suchmaschinen aber noch lange nicht erschöpft. So zeigen sie beispielsweise gefundene Bild- und HTML-Dateien als Thumbnails in der Trefferliste oder Zusatzinformationen von Audio-Dateien.

Der Klassiker unter diesen Programmen ist Beagle [1]. Doch auch Google stellt seit einiger Zeit den Google Desktop [2] für Linux zur Verfügung, und bietet dem Platzhirschen paroli. Das bislang eher unbekannte Strigi [3] hat in Kubuntu 7.10 den Einzug in eine große Distribution gehalten. Da das Programm fester Bestandteil von KDE 4 ist, wird es in absehbarer Zeit auch in anderen Distributionen seine Dienste verrichten. Einen Ausblick lesen Sie im Kasten Wer ist Strigi.

Wer ist Strigi?

Strigi erlangt derzeit vor allem als Standardsuchmaschine im aktuellen Kubuntu 7.10 Aufmerksamkeit. Das im Gegensatz zu Beagle rudimentär anmutende Suchprogramm verfügt über verschiedene Bedienoberflächen. Unter Kubuntu stellt der KIO-Slave strigi die grafische Oberfläche, mit der Sie das Programm verwalten und Suchanfragen abschicken.

Der erste Test verlief jedoch ernüchternd. Zwar indizierte Strigi die Testdateien (2 GByte aus verschiedenen Dateitypen zusammengestellt) in einer annehmbaren Geschwindigkeit, von einer geringen Ressourcenauslastung konnte jedoch nicht die Rede sein. Während der Indexerstellung stieg die CPU-Auslastung auf 98%, der Suchindex wurde satte 324 MByte groß. Im Vergleich benötigten Google und Beagle mit jeweils etwa 50 MByte deutlich weniger Platz.

Punkten konnte Strigi bei der Volltextsuche: Jede Anfrage beantwortete das Programm in Sekundenbruchteilen. Die Suche nach Programmnamen verlief jedoch deutlich langsamer und benötigte im Schnitt etwa drei Sekunden. Da die getestete Version aus Kubuntu 7.10 keinerlei Kategorisierungen der Trefferanzeige besaß, war es oft schwierig, aus den Ergebnissen das gewünschte herauszufinden. Die Suche nach einem Begriff in Dateien eines bestimmten Typs unterstützt das Programm nicht. Die Ausgabe ist – wie der Rest der Verwaltungsoberfläche – spartanisch, die Informationen zu den Treffern sind vergleichsweise spärlich (Abbildung 1).

Abbildung 1

Abbildung 1: Die Anzeige der Suchergebnisse von Strigi ist aufs Wesentliche reduziert. Eine Untergliederung der Treffer in Kategorien fehlte.

Negativ aufgefallen ist darüber hinaus die mangelhafte Dokumentation. Weder eine Man-Page, noch eine integrierte Hilfe oder Online-Ratgeber unterstützen Sie beim Bedienen des Programms. So lassen sich Funktionsweisen und Fähigkeiten des Tools einzig durch Ausprobieren ermitteln.

Derzeit ist Strigi für Beagle und Google Desktop keine ernsthafte Konkurrenz. Das Programm zeigt jedoch gute Ansätze, so dass es in absehbarer Zukunft zu einer echten Alternative werden könnte.

Suchen mit "locate"

Anders als die hier vorgestellten Programme erlaubt locate lediglich die Suche nach Datei- und Verzeichnisnamen – das in einer atemberaubenden Geschwindigkeit. Das Programm ist Bestandteil des OpenSuse-Paketes findutils-locate, das neben dem Suchprogramm auch das Indizierungsprogramm updatedb enthält. Sowohl in Kubuntu 7.10 als auch in Mandriva 2008 ist locate bereits vorinstalliert. Da das Programm bei der Installation einen Cronjob-Eintrag erstellt, brauchen Sie sich um die Aktualisierungen des Indexes nicht mehr zu kümmern.

Die Suche starten Sie mit dem Aufruf locate "Suchbegriff" in der Konsole. Da die Ausgabe unter Umständen sehr lang gerät, hilft ein angehängtes | less, das sie seitenweise anzeigt. Eine sehr elegante Lösung, locate zu verwenden bietet der KIO-Slave kio-locate: Dieser erlaubt die Suche über die Adresszeile von Konqueror (Abbildung 2). Um ihn zu verwenden, stellen sie dem Suchbegriff ein locate: voran.

Abbildung 2

Abbildung 2: Der KIO-Slave "kio-locate" erlaubt die Suche direkt über die Adressleiste von Konqueror.

Kerry Beagle

Das für das Mono-Framework entwickelte Open-Source-Programm Beagle kam in der Vergangenheit vorwiegend in Distributionen mit Gnome-Desktops, beispielsweise Ubuntu, zum Einsatz. Mit der durchdachten und gut bedienbaren Oberfläche Kerry-Beagle hält es jetzt auch mehr und mehr in KDE-basierte Systeme wie Mandriva 2008 und OpenSuse 10.2/10.3 als Standardsuchprogramm Einzug. Kubuntu verwendet standardmäßig Strigi, Beagle ist jedoch bereits Bestandteil des DVD-Repositories. Zur Installation verwenden Sie den Paketmanager Adept und suchen nach beagle sowie kerry beagle.

Funktionsübersicht

Beagle unterstützt nicht nur die Volltextsuche in einer ganzen Reihe verschiedener Dateiformate, sondern findet auch Treffer in Histories und Logfiles von Programmen wie Kopete, Gaim oder Liferea. Darüber hinaus indiziert das Programm auch Mails von KMail und Thunderbird sowie Einträge in Adressbüchern und Kalender wie KOrganizer oder KAddressbook. Auch die Suche in komprimierten Formaten wie zip und tar.gz bewältigt die Applikation problemlos. Eine Übersicht finden Sie in der Tabelle Bewertungsmatrix.

Der Baegle-Daemon läuft kontinuierlich im Hintergrund. Kommen neue Dateien hinzu oder ändern sich deren Inhalte, registriert Beagle das in kürzester Zeit, meist weniger als eine Minute, und aktualisiert den Suchindex entsprechend. Anders als Google Desktop löscht Beagle nicht mehr vorhandene Dateien umgehend aus dem Suchindex.

In der Grundeinstellung indiziert das Programm das Home-Verzeichnis des angemeldeten Anwenders sowie Pfade zu Programmdokumentationen wie /usr/share/doc.

Bedienung und Suche

Die Benutzeroberfläche von Beagle starten Sie mit einen Klick auf das Hundekopf-Icon in der KDE-Kontrollleiste oder mit [F12]. Klicken Sie mit der rechten Maustaste darauf, öffnet sich der Suchverlauf des Programms. Am oberen Fensterrand finden Sie die Sucheingabe, im rechten Drittel die Suchoptionen und im Zentrum den Ausgabebereich.

Die Grundeinstellungen des Programms öffnen Sie über den Button Einrichten... am Fußende des Fensters. Hier legen Sie fest, welche Verzeichnisse Beagle indizieren soll und welche davon ausgeschlossen werden (Abbildung 3). Weiterhin stellen Sie über das Backend ein, welche Dateitypen das Programm beim Indizieren berücksichtigt.

Abbildung 3

Abbildung 3: Beagle verwendt zum Indizieren bestimmter Dateitypen so genannte Backends, die Sie in den Einstellungen (de)aktivieren.

Um die Suche zu starten, geben Sie in der Eingabeleiste den gewünschten Begriff ein und drücken [Eingabe]. Verwenden Sie mehrere Suchbegriffe, erlaubt Beagle mit OR zwischen diesen eine logische ODER-Verknüpfung. Das bedeutet, dass entweder der eine oder der andere Begriff im Dokument auftauchen muss. Kennen Sie bestimmte Suchwörter nicht vollständig, ergänzen Sie diese mit Platzhaltern, so genannten Wildcards (*). Um nach einem bestimmten Dateityp zu suchen, verwenden Sie die Anweisung ext:"Dateityp". Für die Suche nach mehreren zusammenhängenden Wortern setzen Sie diese in Anführungszeichen ("). Groß- und Kleinschreibung ignoriert Beagle.

Ein Beispiel: Die Eingabe von ext:txt *bsd OR linux sucht in allen Textdokumenten nach Stellen, die entweder den Begriff Linux oder bsd mit beliebigen Vorzeichen (FreeBSD), NetBSD etc.) enthalten. Generell dürfen Sie Wildcards nicht nur am Anfang und Ende des Suchbegriffs sondern an einer beliebigen Stelle, beispielsweise free*sd, verwenden.

Die Ausgabe beeinflussen Sie wesentlich mit der Anzeigenspalte im rechten Drittel des Fensters (Abbildung 4), das sich jedoch erst auf den zweiten Blick als Bedienelement entpuppt. Während Sie im oberen Teil der durch Linien getrennten Felder die angezeigten Gruppen wie Bilder oder Medien festlegen, sortieren Sie im Mittelteil die Ausgabe nach Kriterien wie Relevanz, Typ und Name. Im unteren Teil legen Sie fest, wie alt die Datei ist, die Sie suchen.

Beagle zeigt in der Grundeinstellung pro Ausgabeseite 20 Treffer an. Um zwischen den Ausgabeseiten zu blättern, benutzen Sie die Buttons Vorherige Ergebnisse und Weitere Ergebnisse am unteren Fensterrand. Die gezielte Anwahl einer bestimmten Seite oder der Sprung ans Ende der Ergebnisliste erlaubt das Frontend allerdings nicht.

Abbildung 4

Abbildung 4: Die Filter- und Sortieroptionen in der rechten Fensterspalte erlauben ein sehr genaues Eingrenzen der Suchergebnisse.

Bilder zeigt das Programmm ebenso wie Webseiten mit einer Thumbnail-Vorschau an. Über Links öffnen Sie wahlweise die gefundene Datei oder das Verzeichnisses, in dem sie sich befindet. Bei der Suche nach Audiodateien berücksichtigt Beagle sowohl Dateinamen als auch indizierte Metainformationen. Findet das Programm das gesuchte Wort in volltextindizierten Dokumenten, markiert es dieses im Vorschautext rot.

Die Suchzeiten von Beagle sind deutlich länger als die von Google Desktop. So benötigt die Suche nach dem Wort Linux im Schnitt zwischen drei und etwa vier Sekunden, während Google die gleiche Aufgabe in einem Zehntel der Zeit erledigt. Eine Funktion, die bestimmte Einträge partiell aus dem Suchindex zu löscht, fehlt Beagle.

Fazit

Beagle zeichnet sich vor allem durch seine umfangreichen Filterfunktionen zur Anzeige der Ausagbe aus. Bemerkenswert ist darüber hinaus, dass die Software auch den Inhalt gepackter Formate (zip, tar.gz etc.) indiziert. Negativ aufgefallen ist hingegen die eher mäßige Antwortzeit bei Suchanfragen. Beagle verzichtet weitgehend auf auf eine vernünftige Dokumentation und lässt den Anwender bei wichtigen Fragen allein.

Google Desktop

Mit Google Desktop hat der Suchmaschinenriese schon vor Jahren sein Betätigungsfeld auf die Datensuche auf lokalen Rechnern ausgedehnt, die Software stand jedoch bis vor Kurzem nur für Windows zur Verfügung. Die Linux-Variante startet nun einen Frontalangriff den freien Konkurrenten Beagle. Wir haben die die derzeit aktuelle Version 1.1.0 getestet.

Anders als Beagle unterliegt das Programm einer proprietären Lizenz und ist nicht quelloffen. Da es sich derzeit noch im Betastadium befindet, verbietet Google die Verbreitung auf Datenträgern, weswegen Sie die Software von der Herstellerseite als RPM-oder Debian-Paket herunterladen. Um Google Desktop zu installieren, starten Sie zunächst über das Schnellstartfenster ([Alt]+[F2]) mit der Eingabe von konsole ein Terminalfenster. Werden Sie danach mit su gefolgt vom Root-Passwort zum Administrator und installieren sie das Paket mit dem Kommando rpm -ivh google-desktop-linux.current.rpm. Benutzer von Ubuntu tippen stattdessen im Terminalfenster sudo dpkg -i google-desktop-linux_current_i386.deb.

Auf Googles Seite Linux Repositories[4] finden Sie alternativ Informationen darüber, wie Sie das Google Repository in den Paketmanager Ihrer Distribution einbinden. Beachten Sie, dass die Software nach der Installation unter anderem eine eindeutige ID sowie Informationen über die Installation an den Heimatserver versendet sowie automatisch Updates aus dem Netz nachlädt, wenn es welche gibt. Dieses Verhalten lässt sich vom Benutzer nicht beeinflussen.

Funktionsübersicht

Google Desktop verfolgt mit der Zweiteilung in Frontend und Indizierungs-Deamon die gleiche Strategie wie Beagle. Ein permanent laufender Dienst registriert im Hintergrund Veränderungen auf der Festplatte und ergänzt entsprechend den Suchindex. Anders als Beagle behält Google Einträge gelöschter Dateien auf Wunsch bei. Was zunächst unsinnig erscheint, erschließt sich schnell beim Betrachten der Suchergebnisse: Google hält im Volltext indizierte Dateien vollständig im Cache. So stehen Ihnen auch nach dem Löschen der Ursprungsdatei deren komplette Inhalte zur Verfügung. Darüber hinaus besitzt die Software eine Versionierungsfunktion, die Änderungen am Dokument registriert und weiteren Versionen anzeigt (Abbildung 5).

Abbildung 5

Abbildung 5: Ändert sich der Inhalt einer im Volltext indizierten Datei, hält Google Desktop auch die älteren Versionen vorrätig.

Google Desktop unterstützt bei der Volltextindizierung sowohl OpenOffice-Formate als auch MS-Office-Dokumente (Powerpoint, Excel, Word) PDF- und Postscript-Dateien. Von Bilddateien im PNG-, GIF-, oder JPG-Format erstellt die Software Thumbnail-Ansichten, die sie bei Treffern anzeigt. Eine Suche im Inhalt gepackter Dateien wie bei Beagle, kann Google Desktop allerdings nicht.

Google indiziert nicht nur E-Mails von Thunderbird, sondern auch Nachrichten auf dem Webmailer Google Mail, was aber ein entsprechendes Konto voraussetzt. Weitergehende Unterstützungen, beispielsweise von Instant-Messenger-Logs fehlen der Software allerdings. Zwar stehen auf der Webseite [5] diverse Indizierungs-Plug-ins zur Verfügung, welche die Fähigkeiten der Suchmaschine in die unterschiedlichsten Richtungen erweitern, jedoch laufen diese nur auf der Windows-Version des Programms.

Bedienung und Suche

Nach der Installation finden Sie in der KDE-Kontrollleiste ein spiralförmiges Icon. Ein Doppelklick darauf öffnet das Schnellsuchfeld, das Sie auch mit einem Doppelklick auf [Strg] öffnen. Schon während der Eingabe zeigt es in einer Liste die passenden Treffer an (Abbildung 6).

Abbildung 6

Abbildung 6: Das Schnellsuchfeld zeigt Treffer bereits während der Eingabe an.

Ein Klick auf Desktop-Suche:<Suchbegriff> zeigt alle Treffer im Browser an, die Ausagbe unterscheidet sich optisch nur durch die Kategorienliste unter dem Eingabefeld vom Online-Pendant. Je nach Dateityp ordnet Google Desktop Treffer verschiedenen Einträgen wie Dateien, Medien oder Webprotokolle zu. Ein Klick darauf zeigt ausschließlich Suchergebnisse der gewählten Kategorie (Abbildung 7).

Abbildung 7

Abbildung 7: Der Google Desktop fasst Suchergebnisse in Kategorien zusammen.

Um die Einstellungen der Desktopsuche zu verändern, klicken Sie auf den Link Desktop-Einstellungen links neben der Eingabeleiste. Über den Reiter Lokale Indizierung legen Sie fest, welche Dateitypen das Programm berücksichtigen soll und in welchen Verzeichnissen es das tut. Aktivieren Sie die Checkbox neben Gelöschte Elemente entfernen, bereinigt die Applikation den Suchindex, wenn eine Datei nicht mehr vorhanden ist. Unter Andere erreichen Sie erweiterte Funktionen. Anders als der Name vermuten lässt, aktivieren Sie damit allerdings keine zusätzlichen Funktionen, sondern erlauben es der Software, nicht personenbezogene Nutzungsdaten an einen Google-Server zu versenden. Angeblich handelt es sich dabei um Fehlerberichte, Suchgewohnheiten und statistische Werte. Die Software erlaubt es auch, einzelne Einträge aus dem Suchindex zu löschen.

Google: Fazit

Google legt mit der Desktopsuchmaschine ein grundsolides und durchdachtes Programm vor. Obwohl es sich noch in der Betaphase befindet, lief es im Test störungsfreier als diverse fertige Applikationen anderer Softwareschmieden. Bemerkenswert ist die Geschwindigkeit, mit der die Software Suchanfragen beantwortet: Es vergehen selten mehr als als 0,3 Sekunden, bis die Ergebnisse vorliegen.

Die Kategorisier- und Sortierfunktionen fallen im Vergleich zu Beagle eher mager aus. Auch der Umfang unterstützter Dateien ist gegenüber Beagle drastisch eingeschränkt. Google Desktop sucht zum Beispiel weder in gepackten Archiven noch kennt es speziellere Programme wie Gaim. Zusätzliche Plug-ins, die das ermöglichen würden, stehen lediglich für die Windows-Variante zur Verfügung. Dafür speichert die Software volltextindizierte Dateien komplett im Cache, bei Veränderungen sogar in verschiedenen Versionen.

Positiv fiel die umfangreiche und gut verständliche Dokumentation auf, die kaum Fragen offen lässt.

Fazit

Im direkten Vergleich liegen Beagle und der proprietäre Konkurrent Google Desktop relativ dicht beieinander. Während Google mit einer deutlich besseren Performance und einer Versionierung von volltextindizierten Dateien punktet, bietet Beagle eine umfangreichere Dateinunterstützung und indiziert auch den Inhalt in gepackter Archive.

Bewertungsmatrix

  Google Desktop Beagle
  http://desktop.google.com/de/linux/ http://beagle-project.org
Volltextindizierung:
Textformate doc, odt, txt, pdf, html doc, rtf, odt, txt, pdf, html
Tabellen ods ods
E-Mail Gmail (Online), Thunderbird Evolution, Thunderbird, Kmail
Webcache Firefox, Konqueror Opera, Firefox, Konqueror
Komprimierte Dateien Werden nicht unterstützt zip, tar.gz, bz2
Sonstige ps ps
Suchfunktionen:
Wildcards und Joker nein ja
Logische UND-Verknüpfung ja (1) ja (1)
Logische ODER-Verknüpfung nein ja
Ausschluss von Suchbegriffen (alle außer) ja ja
Suche nach Dateitypen ja (2) ja
Suche während der Eingabe ja (3) ja
Autovervollständigen nein nein
Trefferanzeige:
Thumbnails folgender Bildformate jpg, gif, png, bmp jpg, gif, png, tiff
Thumbnails von Webseiten aus dem Browsercache ja nein
Thumbnail-Anzeige von HTML-Seiten ja ja
Anzeige ganzer Dokumente aus dem Cache ja nein
Versionierung ja nein
Audio-Dateien:
Metadatenindizierung ogg, mp3 ogg, mp3, wma
Länge ja nein
Bitrate ja nein
Größe ja nein
Titel / Interpret ja ja
Pfad zur Datei ja ja
Erstelldatum ja ja
Sonstiges:
Treffer nach Kategorien geordnet ja ja
Sortieren nach Relevanz und Datum ja ja
Einzelne indizierte Einträge löschen ja nein
Persistenter Cache ja ja (4)
Verzeichnis-White- und Blacklist ja ja
Schnellsuche über Shortcut ja ja
Indexgröße (2 GByte indizierte Dateien) 47 MByte 45 MByte
Suchgeschwindigkeit (Durchschnitt) 0,2 Sekunden 3 Sekunden
Anmerkungen:
(1) Grundeinstellung
(2) Nur über das Webfrontend
(3) Nur im Schnellsuchfenster
(4) Nur über Kommandozeile konfigurierbar

Glossar

Backend

Als Backend bezeichnet man Programme, die im Hintergrund laufen und die der Benutzer über eine oder mehrere grafische Oberflächen, Frontends genannt, bedient.

Infos

[1] Beagle: http://beagle-project.org

[2] Google Desktop für Linux: http://desktop.google.com/de/linux/

[3] Strigi: http://strigi.sourceforge.net/

[4] Google Desktop Linux Repositories: http://www.google.com/linuxrepositories/

[5] Google Desktop Plug-ins: http://desktop.google.com/plugins/c/index/all.html?hl=de

Tip a friend    Druckansicht beenden Bookmark and Share
Kommentare