Aus LinuxUser 03/2008

Drei Desktop-Suchmaschinen im Vergleich

Recherche-Künstler

Mit der wachsenden Datenflut auf dem PC steigt der Bedarf, die Informationen in den Griff zu bekommen. Die Desktop-Suchmaschinen Beagle, Tracker und Strigi helfen dabei.

Google und Yahoo machen es seit Jahren vor: Großen Datenmengen ist nur mit Suchmaschinen beizukommen, in denen teures Know-how steckt. Sie müssen einerseits flexibel genug arbeiten, um erweiterte Suchanfragen effizient zu bearbeiten, andererseits sollen sie aber auch leicht zu bedienen sein, damit auch der ungeübte Benutzer damit nicht vor lauter Optionen den Überblick verliert. Auch nichtkommerzielle Projekte bieten Volltextsuchmaschinen, die es durchaus mit den Entwicklungen der Großen aufnehmen können.

Beagle

Novell entwickelt seit etwa 2004 eine Desktop-Suche namens Beagle. Das Programm entstand aus der Notwendigkeit heraus, Daten verschiedener Quellen zusammenzutragen und für den Anwender übersichtlich aufzubereiten. Die Anwendung trug ursprünglich den Namen Dashboard, weshalb unter anderem die Beagle-Mailingliste immer noch dashboard-hackers heißt. Die Anwendung scheiterte im ersten Anlauf jedoch daran, dass sie nicht in der Lage war, Abfragen schnell und effizient zu bearbeiten. Das in C# geschriebene Beagle [1] nutzt als Indexer die C#-Implementierung der Lucene-Engine [2] von Apache, was dem Problem Einhalt gebot.

Während für Gnome die grafische Oberfläche Beagle-search (Abbildung 1) die Arbeit vereinfacht, übernimmt in KDE eine GUI namens Kerry diese Aufgabe. Sie kommt unter anderem in OpenSuse und Kubuntu zum Einsatz. Aufgrund seines Alters stellt Beagle heute die ausgereifteste freie volltextbasierte Desktop-Suchmaschine dar. Mitte Dezember brachten die Entwickler die Version 0.3.1 heraus, die als Grundlage dieses Tests dient.

Abbildung 1: Beagles Suchdialog dient als zentrale Anlaufstelle für Suchanfragen. Auch Schlüsselwörter wie <code>date</code> unterstützt die Desktop-Suche.
Abbildung 1: Beagles Suchdialog dient als zentrale Anlaufstelle für Suchanfragen. Auch Schlüsselwörter wie date unterstützt die Desktop-Suche.

Beagle unterstützt eine Vielzahl von Dateitypen. Seit der Version 0.3.0 enthält die Desktop-Suche ein auf Ajax basierendes Webinterface. Via http://localhost:4000/ geben Sie Suchanfragen an Beagle weiter und erhalten die Ergebnisse in aufbereiteter Form im Webbrowser zurück. Im Test stellte sich heraus, dass Beagle recht sparsam mit den Ressourcen umgeht, was früher nicht immer der Fall war. Besonders mit Mono 1.2.6 reduzierten die Entwickler den Speicherhunger nochmals erheblich.

Tracker

Tracker [3] verwendet statt Lucene entweder QDBM[4] oder SQLite[5]. Das Anfang 2006 von Jamie McCracken ins Leben gerufene Projekt ist komplett in C geschrieben und legt besonderen Wert auf geringen Speicherverbrauch und niedrige CPU-Auslastung. Als weiteres Plus generiert Tracker im Vergleich zu Beagle den Suchindex etwa fünf Mal schneller.

Für Tracker existieren sowohl für Gnome als auch für KDE mehrere Frontends [6]. Tracker selbst besitzt weniger Abhängigkeiten als Novells Desktop-Suche Beagle. Wegen des noch recht geringen Alters gibt sich die Anwendung aber noch nicht so ausgereift wie der Konkurrent. Seit Version 7.10 setzt Ubuntu Tracker als Standard-Desktopsuche ein. Dieser Entscheidung ging jedoch eine hitzige Debatte über das Für und Wider voraus – zuvor setzte Ubuntu auf Beagle.

Zum Test verwendeten wir die Mitte Dezember erschienene Version 0.6.4. Ebenso wie bei Beagle greifen Sie mit Hilfe eines Desktop-Applets für Gnome auf Tracker zu, womit die Installation eines Frontends unter Gnome wegfällt. Tracker erlaubt sowohl das Einstellen des Ressourcenverbrauchs (Abbildung 2) als auch der Indizierungsgeschwindigkeit.

Abbildung 2: Das Dialogfenster "Einstellungen" erlaubt Ihnen unter anderem, den Ressourcenverbrauch festzulegen.
Abbildung 2: Das Dialogfenster „Einstellungen“ erlaubt Ihnen unter anderem, den Ressourcenverbrauch festzulegen.

Strigi

Strigi [7] setzt ebenfalls auf den C++-Port der Lucene-Engine, kann aber auch mit anderen Backends umgehen, wie etwa mit SQLite oder Hyper Estraier. Das in C++ geschriebene Programm unterstützt bei weitem nicht so viele Dateitypen wie Beagle oder Tracker. Bedenklich stimmt der verschwenderische Umgang von Strigi mit den Systemressourcen, obwohl auf der Homepage des Projektes eigentlich das Gegenteil steht.

Im Test setzten wir Version 0.5.7 ein, die der Autor Ende Oktober vorstellte. Leider gelang es nicht, eine Version aus dem SVN-Repository sinnvoll zu nutzen, da der Snapshot beim Indizieren des öfteren mit einem CLucene-Ausnahmefehler abstürzte.

Strigi dient als Standard-Desktopsuche für KDE 4.0, was angesichts des hohen Ressourcenverbrauchs eher verwundert. Diese Strategie sollten die KDE-Entwickler besser nochmals überdenken. Zum Testen von Suchanfragen verwendeten wir den Qt4-basierenden strigiclient (Abbildung 3).

Abbildung 3: Der Strigi-Client ist sehr rudimentär gehalten und umständlich zu bedienen. Er zeigt neben den indizierten Dateien und Wörtern auch die Indexgröße an.
Abbildung 3: Der Strigi-Client ist sehr rudimentär gehalten und umständlich zu bedienen. Er zeigt neben den indizierten Dateien und Wörtern auch die Indexgröße an.

Auf die Plätze …

Die drei Kandidaten ließen wir auf ein Home-Verzeichnis los, das etwa 80?000 Dateien beziehungsweise Ordner enthielt. Bewertet wurden dabei:

LinuxUser 03/2008 KAUFEN
EINZELNE AUSGABE Print-Ausgaben Digitale Ausgaben
ABONNEMENTS Print-Abos Digitales Abo
TABLET & SMARTPHONE APPS
Deutschland

Hinterlasse einen Kommentar

  E-Mail Benachrichtigung  
Benachrichtige mich zu: