Such!
Beagle, Strigi und Tracker
Tracker
Tracker verwendet als Backend die schlanke, aber dennoch leistungsfähige Datenbank SQLite. Durch den recht modularen Aufbau der Suchmaschine lassen sich verschiedene Konfigurationen realisieren, so auch eine, die den Analyseteil von Strigi verwendet. Im Test verzichteten wir jedoch auf diese Möglichkeit, vor allem, da diese Variante noch als experimentell deklariert ist.
Tracker geht im Vergleich zu Strigi äußerst schonend mit der CPU um. Auch der Speicherverbrauch kann sich sehen lassen: Der zentrale "Store"-Prozess benötigt gerade einmal gut 11 MByte Arbeitsspeicher, der eigentlich Datei-Schnüffler etwa 5 MByte. Im Ruhezustand geht der Verbrauch beider Prozesse noch weiter zurück, zusammen auf 13 MByte. Einzig der Extraktionsprozess braucht verlangt der CPU etwas mehr ab: Kurzzeitig lassen sich Spitzen bis knapp zur Hälfte der verfügbaren Prozessorleistung erkennen. Das System blieb aber gut zu bedienen – Einschränkungen wie bei Strigi gab es nicht. Nach etwa sechs Minuten waren alle Daten indiziert.
Im Test deaktivierten wir die Stopwords-Liste: In ihr befinden sich Wörter, die – sofern sie in Dateinamen vorkommen – nicht indiziert werden. Grund für die Existenz der Stopwords: Der Indizierungsvorgang soll nicht zu lange dauern und nicht unnötig Dateien analysieren. Die Stopword-Dateien für die verschiedenen Sprachen finden sich unter /usr/share/tracker/languages/.
Tracker liefert ähnlich gute Suchergebnisse wie Beagle, der Suchdialog beantwortet Anfragen recht zügig. In der Regel vergeht auch etwa die gleiche Zeit wie bei Beagle, bis die Ergebnisse erscheinen. Der Dialog (Abbildung 3) erscheint noch nicht ganz so ausgefeilt wie jener von Beagle, stellt jedoch die Suchergebnisse recht übersichtlich dar. Es bleibt abzuwarten, in welche Richtung die Entwickler den Dialog weiter ausbauen.
Abschließende Bewertung
Im Vergleich zum letzten Test Anfang 2008 rücken die Testkandidaten enger zusammen: Tracker liegt bei der Genauigkeit der Suchergebnisse nicht mehr weit von Beagle entfernt. Dabei geht er sorgsamer mit dem Arbeitsspeicher um. Zwar beansprucht Tracker die CPU etwas mehr, dafür verläuft der Indizierungsprozess wesentlich schneller. Die Zeit, die bis zur Beantwortung einer Anfrage vergeht, fällt bei beiden Suchmaschinen praktisch identisch aus.
Nicht so gut sieht es bei Strigi aus: Das Problem der hohen CPU-Last aus früheren Zeiten haben die Entwickler immer noch nicht behoben. Zudem scheint Strigi mehr Wert auf die Inhalte von Dateien zu legen, sodass das Programm bei einer Anfrage auf Dateinamen keine brauchbaren Resultat liefert. Ein weiteres Manko stellt das Frontend dar: Bislang gibt es keinen desktopneutralen, ordentlich bedienbaren Suchdialog. Immerhin konnten die Entwickler den Speicherverbrauch reduzieren.
Wer die Wahl hat, der sollte im Moment auf Beagle oder Tracker setzen. Bei Beagle gilt es jedoch anzumerken, dass noch nicht geklärt ist, ob das Programm neue Entwickler findet, die es weiter voranbringen [14]. Um Tracker scheint es besser bestellt zu sein: Nokia hat daran ein großes Interesse und integrierte es bereits in die neueste Maemo-Version [15].
Glossar
RDF
Resource Description Framework. Umfasst eine Reihe von Standards, die vom W3C herausgegeben werden. RDF dient zur formalen Beschreibung von Informationen über Objekte ("Ressourcen"), die durch eindeutige Bezeichner identifiziert werden.
Mono
Zu Microsoft .NET kompatible, freie Entwicklungs- und Laufzeitumgebung für plattformunabhängige Software. Zunehmend umstritten, da Teile der Mono-Klassenbibliothek möglicherweise Patente der Firma Microsoft berühren.
Xesam
Extensible Search and Metadata. Ursprünglich als Projekt Wasabi von Freedesktop.org gegründet, um eine Spezifikation für ein Framework zur Desktop-Suche zu spezifizieren.
Moonlight
Vom Mono-Projekt vorangetriebene Portierung des Webanwendungs-Frameworks Microsoft Silverlight, eines Konkurrenzprodukts zu Adobe Flash beziehungsweise Java FX.
Infos
[1] Nepomuk: http://www.semanticdesktop.org/
[2] SPARQL: http://www.w3.org/TR/rdf-sparql-query/
[3] RDF: http://www.w3.org/RDF/
[4] Nepomuk-Ontologie: http://www.semanticdesktop.org/ontologies/
[5] Xesam-Ontologie: http://xesam.org/main/XesamOntology
[6] Nepomuk und Xesam fusionieren: http://trueg.wordpress.com/2009/04/29/xesam_vs_nepomuk/
[7] Strigi: http://strigi.sourceforge.net/
[8] Tracker: http://projects.gnome.org/tracker/
[9] Beagle: http://www.beagle-project.org/
[10] KDE-Frontend für Beagle: http://de.opensuse.org/Kerry
[11] Test Desktop-Suchmaschinen: Christian Meyer, "Recherche-Künstler", LinuxUser 03/2008, S. 70, http://www.linux-community.de/artikel/14446/
[12] Ankündigung für Dashboard: http://mail.gnome.org/archives/dashboard-hackers/2003-July/msg00000.html
[13] Ankündigung für Beagle 0.0.0: http://mail.gnome.org/archives/dashboard-hackers/2004-June/msg00000.html
[14] Entwicklerschwund bei Beagle: http://mail.gnome.org/archives/dashboard-hackers/2009-September/msg00005.html
[15] Maemo: http://www.maemo.org/



