AA_beagle_sxc1048525_Mariana-Figueroa.jpg

© Mariana Figueroa, sxc.hu

Such!

Beagle, Strigi und Tracker

02.11.2009
Desktop-Suchmaschinen sollen Dateien und Inhalte auf dem Rechner komfortabel und schneller finden. Wir testen die Kontrahenten Beagle, Strigi und Tracker.

Um das Thema Desktopsuche ist es in den letzten Monaten recht ruhig geworden – außer von Nepomuk [1] gibt es nicht viel zu hören. Mit dem Framework Nepomuk versuchen die Entwickler, die Grundlagen für einen semantischen Desktop zu legen, der Beziehungen zwischen einzelnen Objekten – beispielsweise einem Foto, einem Text und einem E-Mail-Thread – miteinander verbinden kann. Angesichts immer größerer Datenträger und damit Informationsmengen versprechen derartige Verbindungen von Objekten eine Erleichterung bei der Suche nach Informationen. Intern werden Suchanfragen mittels SPARQL [2] (siehe Kasten "Die RDF-Anfragesprache SPARQL") realisiert, einer Anfragesprache für RDF-Dateien [3]. Eine solche Anfrage ähnelt einer SQL-Query, also einer relationalen Datenbankanfrage. Als Grundlage dienen jedoch RDF-Statements, die Sachverhalte und Beziehungen zwischen Objekten modellieren.

Die RDF-Anfragesprache SPARQL

SPARQL steht als rekursives Akronym für "SPARQL Protocol and RDF Query Language". Die RDF-Anfragesprache ähnelt der Structured Query Language (SQL) für relationale Datenbanken. Um etwa aus der Ressource <http://linux-user.de/test> "SPARQL" den Begriff "SPARQL" abzufragen, ist folgende Query notwendig:

SELECT ?title
WHERE
{
  <http://linux-user.de/test> nie:title ?title .
}

Die Syntax ist etwas gewöhnungsbedürftig, doch die Analogien zu SQL liegen klar auf der Hand.

Die Nepomuk-Ontologie [4] (siehe Kasten "Die Nepomuk-Ontologie") bildet dabei die Grundlage, genauer das Gerüst (Klassen und Eigenschaften zur Verwaltung von Metadaten) für ein RDF-Statement. Andere Ontologien, wie etwa Xesam [5], stampften die Entwickler zugunsten eines gemeinsamen Formats Ende April 2009 ein [6]. Damit steht ein Standard für alle Suchmaschinen bereit, wobei Strigi [7] und Tracker [8] diesen bereits ausgiebig nutzen. KDE setzt derzeit auf das Zugpferd Strigi. Nokia und Gnome verwenden hingegen Tracker, das derzeit in einer stabilen Version (ohne Nepomuk) und einer Entwicklerversion bereitsteht.

Die Nepomuk-Ontologie

Eine Ontologie dient im Allgemeinen dazu, Informationen formal zwischen Anwendungen auszutauschen. Auf diese Weise lassen sich auch Beziehungen zwischen diesen Anwendungen herstellen. Dabei stellen die unterschiedlichen Dateiformate der Anwendungen unterschiedlich ein Problem dar. Durch ein einheitliches Format – bei Nepomuk das RDF-Format – fällt diese Hürde weg, sodass Verknüpfungen erkennbar werden und der reibungslose Informationsaustausch sowie die Informationsextraktion möglich ist.

Beagle, Strigi, Tracker

Der in Mono entwickelten Suchmaschine Beagle [9] sind buchstäblich die Entwickler davongelaufen: Dem früher hauptsächlich von Novell vorangetriebenen Projekt fehlt es seit Mitte August an Programmierern. Die letzte Version 0.3.9 datiert von Anfang 2009, seitdem gab es kaum noch Veränderungen am Code. Auch wenn Beagle weitaus mehr Funktionen bietet, als es Tracker oder Strigi derzeit tun, erscheint fraglich, ob sich Entwickler finden, die das Programm fortführen.

Was Beagle der Konkurrenz voraus hat, sind die sogenannten Extraktoren: Diese Programmteile analysieren die verschiedenen Formate, etwa die Browser-Chronik oder E-Mails, und ziehen die relevanten Informationen heraus. Mehr als zwei Dutzend Extraktoren bietet Beagle, unter anderem für Firefox, Thunderbird, Pidgin oder auch Opera. Sowohl für Gnome als auch KDE stehen Frontends zur Verfügung: Beagle-Suche und Kerry [10], sodass sich die Suchmaschine also für beide große Desktops gleichermaßen eignet. Im Vergleich zu seinen Kontrahenten bringt Beagle einen besseren Suchdialog für Anfragen mit, der die Informationen einzelner Dateien übersichtlicher darstellt. Der Anwender kann durch die Ergebnisse blättern, was für einen wesentlich besseren Überblick sorgt.

Für Strigi gibt es derzeit nur ein Qt-Frontend, das noch immer so spartanisch daherkommt wie bei unserem letzten Test Anfang 2008 [11]. Zwar gibt es auch eine Strigi-Erweiterung für Gnomes Deskbar-Applet, doch funktionierte das Plugin im Test nicht, und so war das Qt-Frontend die einzige Möglichkeit, Strigi grafisch Informationen zu entlocken. Es scheint, dass die Entwickler Strigi nicht als Endbenutzersoftware anbieten möchten, sondern sich eher auf die Integration in KDEs Nepomuk konzentrieren. Im Test erwies es sich immer wieder als schwierig, Strigi Informationen herauszukitzeln. Die Aufbereitung der Sucheergebnisse kann man nicht gerade als gelungen bezeichnen.

Nicht ganz so schlimm ist es um den Tracker-Suchdialog bestellt. Zwar reicht er nicht an den Dialog von Beagle heran (der alle Suchergebnisse, entweder nach Kategorien getrennt oder komplett darstellt), er eignet sich aber, um Informationen der gefundenen Dateien zu entnehmen.

Die Testumgebung

Im Test zogen wir Beagle 0.3.9+git, Strigi 0.7.0 sowie Tracker 0.7.4 heran und verglichen die Indizierungszeit, den Speicherverbrauch, die CPU-Auslastung und die Zeit für eine Suchanfrage. Als Hardware diente ein Thinkpad X61s mit 3 GByte RAM und einer langsam getakteten 1.6 GHz Intel Core Duo CPU. Als Betriebssystem kam die Final von Ubuntu 9.10 "Karmic Koala" zum Einsatz. Die Programme mussten das persönliche Verzeichnis und eine externe Festplatte mit insgesamt 620 GByte an Daten indizieren.

Jede der drei Suchmaschinen wurde für einen unterschiedlichen Zweck entwickelt. Das ist einer der Gründe, wieso die Suchergebnisse für die jeweiligen Anfragen bei den Programmen recht unterschiedlich ausfallen. Auch die Anzahl der indizierten Dateien unterscheidet sich bei Beagle, Strigi und Tracker deutlich. Unter Berücksichtigung dieser Eigenheiten fällt es dennoch nicht schwer, Rückschlüsse auf die Qualität der jeweiligen Engine zu ziehen.

Der Schwerpunkt von Beagle liegt darauf, die Inhalte Dateien zu erfasse, die mit den unterschiedlichsten Anwendungen erstellt wurden. Kein Wunder also, dass Beagle über weitaus mehr Extraktoren verfügt als die Konkurrenz. Übrigens fördert Beagle bei der Suche nach einem Begriff nicht nur relevante Datei-Inhalte zutage, sondern auch Files mit passendem Namen. Strigi dagegen scheint weitaus mehr Wert auf Inhalte als auf Datei(nam)en zu legen: Die Suche nach einem Begriff bringt nicht zwangsläufig einen Treffer, selbst wenn eine Datei Begriff.txt existiert. Tracker wiederum verhält sich ähnlich wie Beagle, findet aber nicht so zuverlässig Inhalte von Dateien. Das hat wohl indirekt mit dem Entwicklungsstand der jeweiligen Extraktoren zu tun. Bei Tracker fehlen außerdem Extraktoren für Instant-Messaging-Programme wie Pidgin oder Empathy.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 

Ähnliche Artikel

  • Recherche-Künstler
    Mit der wachsenden Datenflut auf dem PC steigt der Bedarf, die Informationen in den Griff zu bekommen. Die Desktop-Suchmaschinen Beagle, Tracker und Strigi helfen dabei.
  • Xesam und Nepomuk fusionieren
    Sebastian Trüg erklärt die Konkurrenz zwischen den semantischen Frameworks Xesam und Nepomuk für beendet.
  • KDEs semantischer Desktop
    Über die Dienste von Nepomuk durchsuchen Sie nicht nur flott die Dateien auf Ihrem Rechner: Der semantische Desktop von KDE SC 4.4 hat weit mehr zu bieten.
  • Nepomuk und Strigi bei KDE4
  • Wo steht KDE 4.2?
    Das frisch erschienene KDE 4.2 sieht nicht nur toll aus, sondern bringt auch die von KDE 3 bekannten und geschätzten Fähigkeiten des K-Desktops wieder voll mit. Obendrein bietet KDE 4.2 aber noch viel mehr.
Kommentare
Tracker 0.7.14 wo ist die GUI
Reto Reto, Sonntag, 03. Januar 2010 15:43:19
Ein/Ausklappen

Hallo

Ich habe mir nun den neusten Tracker heruntergeladen und gemäss der ReadMe Datei losgelegt. Nach dem installieren aller Abhängigkeiten
sudo apt-get install zlib1g-dev libglib2.0-dev libpango1.0-dev libdbus-1-dev libdbus-glib-1-dev uuid-dev intltool libhal-dev libhal-storage-dev libxml2-dev libsqlite3-dev libtracker-gtk-dev

und der Feststellung, dass es keine Leerschläge im Installations-Pfad haben darf endlich stolzer besitzer eines indizierten PCs :)

Aber was ich noch vermisse, ist der schöne Suchdialog, wie in dem Artikel. Weiss jemand wie ich den Aufrufe oder installiere?

Vielen Dank für Tipps und Hinweise

Gruess
Reto


Bewertung: 183 Punkte bei 20 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
Alternative recoll
Jan (unangemeldet), Samstag, 21. November 2009 15:16:45
Ein/Ausklappen

Schade, dass Du nicht auch recoll getestet hast. Ich setze recoll schon seit vielen Monaten erfolgreich zur Desktopsuche ein, nachdem ich mit den anderen getesteten Kandidaten nicht zufrieden war.


Bewertung: 132 Punkte bei 28 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
Kann Tracker imap Postfächer scannen?
Jan Baden, Donnerstag, 05. November 2009 14:31:00
Ein/Ausklappen

Hallo,

weiß jemand, wie Tracker auch imap-Postfächer unter evolution durchsucht, die auch für den Offlinebetrieb heruntergeladen sind? Bei mir scheint das Standardmäßig nicht zu gehen.


Bewertung: 114 Punkte bei 26 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Infos zur Publikation

LU 11/2014: VIDEOS BEARBEITEN

Digitale Ausgabe: Preis € 4,95
(inkl. 19% MwSt.)

Mit der Zeitschrift LinuxUser sind Sie als Power-User, Shell-Guru oder Administrator im kleinen Unternehmen monatlich auf dem aktuelle Stand in Sachen Linux und Open Source.

Sie sind sich nicht sicher, ob die Themen Ihnen liegen? Im Probeabo erhalten Sie drei Ausgaben zum reduzierten Preis. Einzelhefte, Abonnements sowie digitale Ausgaben erwerben Sie ganz einfach in unserem Online-Shop.

NEU: DIGITALE AUSGABEN FÜR TABLET & SMARTPHONE

HINWEIS ZU PAYPAL: Die Zahlung ist auch ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!       

Tipp der Woche

Schnell Multi-Boot-Medien mit MultiCD erstellen
Schnell Multi-Boot-Medien mit MultiCD erstellen
Tim Schürmann, 24.06.2014 12:40, 0 Kommentare

Wer mehrere nützliche Live-Systeme auf eine DVD brennen möchte, kommt mit den Startmedienerstellern der Distributionen nicht besonders weit: Diese ...

Aktuelle Fragen

Artikelsuche
Erwin Ruitenberg, 09.10.2014 07:51, 1 Antworten
Ich habe seit einige Jahre ein Dugisub LinuxUser. Dann weiß ich das irgendwann ein bestimmtes Art...
Windows 8 startet nur mit externer Festplatte
Anne La, 10.09.2014 17:25, 6 Antworten
Hallo Leute, also, ich bin auf folgendes Problem gestoßen: Ich habe Ubuntu 14.04 auf meiner...
Videoüberwachung mit Zoneminder
Heinz Becker, 10.08.2014 17:57, 0 Antworten
Hallo, ich habe den ZONEMINDER erfolgreich installiert. Das Bild erscheint jedoch nicht,...
internes Wlan und USB-Wlan-Srick
Gerhard Blobner, 04.08.2014 15:20, 2 Antworten
Hallo Linux-Forum: ich bin ein neuer Linux-User (ca. 25 Jahre Windows) und bin von WIN 8 auf Mint...
Server antwortet mit falschem Namen
oin notna, 21.07.2014 19:13, 1 Antworten
Hallo liebe Community, Ich habe mit Apache einen Server aufgesetzt. Soweit, so gut. Im Heimnet...