Home / LinuxUser / 2009 / 12 / Such!

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

Eingedost
(161 Punkte bei 4 Stimmen)
Aufteiler
(161 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.

AA_beagle_sxc1048525_Mariana-Figueroa.jpg

© Mariana Figueroa, sxc.hu

Such!

Beagle, Strigi und Tracker

02.11.2009 Desktop-Suchmaschinen sollen Dateien und Inhalte auf dem Rechner komfortabel und schneller finden. Wir testen die Kontrahenten Beagle, Strigi und Tracker.

Um das Thema Desktopsuche ist es in den letzten Monaten recht ruhig geworden – außer von Nepomuk [1] gibt es nicht viel zu hören. Mit dem Framework Nepomuk versuchen die Entwickler, die Grundlagen für einen semantischen Desktop zu legen, der Beziehungen zwischen einzelnen Objekten – beispielsweise einem Foto, einem Text und einem E-Mail-Thread – miteinander verbinden kann. Angesichts immer größerer Datenträger und damit Informationsmengen versprechen derartige Verbindungen von Objekten eine Erleichterung bei der Suche nach Informationen. Intern werden Suchanfragen mittels SPARQL [2] (siehe Kasten "Die RDF-Anfragesprache SPARQL") realisiert, einer Anfragesprache für RDF-Dateien [3]. Eine solche Anfrage ähnelt einer SQL-Query, also einer relationalen Datenbankanfrage. Als Grundlage dienen jedoch RDF-Statements, die Sachverhalte und Beziehungen zwischen Objekten modellieren.

Die RDF-Anfragesprache SPARQL

SPARQL steht als rekursives Akronym für "SPARQL Protocol and RDF Query Language". Die RDF-Anfragesprache ähnelt der Structured Query Language (SQL) für relationale Datenbanken. Um etwa aus der Ressource <http://linux-user.de/test> "SPARQL" den Begriff "SPARQL" abzufragen, ist folgende Query notwendig:

SELECT ?title
WHERE
{
  <http://linux-user.de/test> nie:title ?title .
}

Die Syntax ist etwas gewöhnungsbedürftig, doch die Analogien zu SQL liegen klar auf der Hand.

Die Nepomuk-Ontologie [4] (siehe Kasten "Die Nepomuk-Ontologie") bildet dabei die Grundlage, genauer das Gerüst (Klassen und Eigenschaften zur Verwaltung von Metadaten) für ein RDF-Statement. Andere Ontologien, wie etwa Xesam [5], stampften die Entwickler zugunsten eines gemeinsamen Formats Ende April 2009 ein [6]. Damit steht ein Standard für alle Suchmaschinen bereit, wobei Strigi [7] und Tracker [8] diesen bereits ausgiebig nutzen. KDE setzt derzeit auf das Zugpferd Strigi. Nokia und Gnome verwenden hingegen Tracker, das derzeit in einer stabilen Version (ohne Nepomuk) und einer Entwicklerversion bereitsteht.

Die Nepomuk-Ontologie

Eine Ontologie dient im Allgemeinen dazu, Informationen formal zwischen Anwendungen auszutauschen. Auf diese Weise lassen sich auch Beziehungen zwischen diesen Anwendungen herstellen. Dabei stellen die unterschiedlichen Dateiformate der Anwendungen unterschiedlich ein Problem dar. Durch ein einheitliches Format – bei Nepomuk das RDF-Format – fällt diese Hürde weg, sodass Verknüpfungen erkennbar werden und der reibungslose Informationsaustausch sowie die Informationsextraktion möglich ist.

Beagle, Strigi, Tracker

Der in Mono entwickelten Suchmaschine Beagle [9] sind buchstäblich die Entwickler davongelaufen: Dem früher hauptsächlich von Novell vorangetriebenen Projekt fehlt es seit Mitte August an Programmierern. Die letzte Version 0.3.9 datiert von Anfang 2009, seitdem gab es kaum noch Veränderungen am Code. Auch wenn Beagle weitaus mehr Funktionen bietet, als es Tracker oder Strigi derzeit tun, erscheint fraglich, ob sich Entwickler finden, die das Programm fortführen.

Was Beagle der Konkurrenz voraus hat, sind die sogenannten Extraktoren: Diese Programmteile analysieren die verschiedenen Formate, etwa die Browser-Chronik oder E-Mails, und ziehen die relevanten Informationen heraus. Mehr als zwei Dutzend Extraktoren bietet Beagle, unter anderem für Firefox, Thunderbird, Pidgin oder auch Opera. Sowohl für Gnome als auch KDE stehen Frontends zur Verfügung: Beagle-Suche und Kerry [10], sodass sich die Suchmaschine also für beide große Desktops gleichermaßen eignet. Im Vergleich zu seinen Kontrahenten bringt Beagle einen besseren Suchdialog für Anfragen mit, der die Informationen einzelner Dateien übersichtlicher darstellt. Der Anwender kann durch die Ergebnisse blättern, was für einen wesentlich besseren Überblick sorgt.

Für Strigi gibt es derzeit nur ein Qt-Frontend, das noch immer so spartanisch daherkommt wie bei unserem letzten Test Anfang 2008 [11]. Zwar gibt es auch eine Strigi-Erweiterung für Gnomes Deskbar-Applet, doch funktionierte das Plugin im Test nicht, und so war das Qt-Frontend die einzige Möglichkeit, Strigi grafisch Informationen zu entlocken. Es scheint, dass die Entwickler Strigi nicht als Endbenutzersoftware anbieten möchten, sondern sich eher auf die Integration in KDEs Nepomuk konzentrieren. Im Test erwies es sich immer wieder als schwierig, Strigi Informationen herauszukitzeln. Die Aufbereitung der Sucheergebnisse kann man nicht gerade als gelungen bezeichnen.

Nicht ganz so schlimm ist es um den Tracker-Suchdialog bestellt. Zwar reicht er nicht an den Dialog von Beagle heran (der alle Suchergebnisse, entweder nach Kategorien getrennt oder komplett darstellt), er eignet sich aber, um Informationen der gefundenen Dateien zu entnehmen.

Die Testumgebung

Im Test zogen wir Beagle 0.3.9+git, Strigi 0.7.0 sowie Tracker 0.7.4 heran und verglichen die Indizierungszeit, den Speicherverbrauch, die CPU-Auslastung und die Zeit für eine Suchanfrage. Als Hardware diente ein Thinkpad X61s mit 3 GByte RAM und einer langsam getakteten 1.6 GHz Intel Core Duo CPU. Als Betriebssystem kam die Final von Ubuntu 9.10 "Karmic Koala" zum Einsatz. Die Programme mussten das persönliche Verzeichnis und eine externe Festplatte mit insgesamt 620 GByte an Daten indizieren.

Jede der drei Suchmaschinen wurde für einen unterschiedlichen Zweck entwickelt. Das ist einer der Gründe, wieso die Suchergebnisse für die jeweiligen Anfragen bei den Programmen recht unterschiedlich ausfallen. Auch die Anzahl der indizierten Dateien unterscheidet sich bei Beagle, Strigi und Tracker deutlich. Unter Berücksichtigung dieser Eigenheiten fällt es dennoch nicht schwer, Rückschlüsse auf die Qualität der jeweiligen Engine zu ziehen.

Der Schwerpunkt von Beagle liegt darauf, die Inhalte Dateien zu erfasse, die mit den unterschiedlichsten Anwendungen erstellt wurden. Kein Wunder also, dass Beagle über weitaus mehr Extraktoren verfügt als die Konkurrenz. Übrigens fördert Beagle bei der Suche nach einem Begriff nicht nur relevante Datei-Inhalte zutage, sondern auch Files mit passendem Namen. Strigi dagegen scheint weitaus mehr Wert auf Inhalte als auf Datei(nam)en zu legen: Die Suche nach einem Begriff bringt nicht zwangsläufig einen Treffer, selbst wenn eine Datei Begriff.txt existiert. Tracker wiederum verhält sich ähnlich wie Beagle, findet aber nicht so zuverlässig Inhalte von Dateien. Das hat wohl indirekt mit dem Entwicklungsstand der jeweiligen Extraktoren zu tun. Bei Tracker fehlen außerdem Extraktoren für Instant-Messaging-Programme wie Pidgin oder Empathy.

Tip a friend    Druckansicht Bookmark and Share
Kommentare
Tracker 0.7.14 wo ist die GUI
Reto Reto, Sonntag, 03. Januar 2010 15:43:19
Ein/Ausklappen

Hallo

Ich habe mir nun den neusten Tracker heruntergeladen und gemäss der ReadMe Datei losgelegt. Nach dem installieren aller Abhängigkeiten
sudo apt-get install zlib1g-dev libglib2.0-dev libpango1.0-dev libdbus-1-dev libdbus-glib-1-dev uuid-dev intltool libhal-dev libhal-storage-dev libxml2-dev libsqlite3-dev libtracker-gtk-dev

und der Feststellung, dass es keine Leerschläge im Installations-Pfad haben darf endlich stolzer besitzer eines indizierten PCs :)

Aber was ich noch vermisse, ist der schöne Suchdialog, wie in dem Artikel. Weiss jemand wie ich den Aufrufe oder installiere?

Vielen Dank für Tipps und Hinweise

Gruess
Reto


Bewertung: 174 Punkte bei 14 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
Alternative recoll
Jan (unangemeldet), Samstag, 21. November 2009 15:16:45
Ein/Ausklappen

Schade, dass Du nicht auch recoll getestet hast. Ich setze recoll schon seit vielen Monaten erfolgreich zur Desktopsuche ein, nachdem ich mit den anderen getesteten Kandidaten nicht zufrieden war.


Bewertung: 118 Punkte bei 21 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
Kann Tracker imap Postfächer scannen?
Jan Baden, Donnerstag, 05. November 2009 14:31:00
Ein/Ausklappen

Hallo,

weiß jemand, wie Tracker auch imap-Postfächer unter evolution durchsucht, die auch für den Offlinebetrieb heruntergeladen sind? Bei mir scheint das Standardmäßig nicht zu gehen.


Bewertung: 119 Punkte bei 17 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Hits
Wertung: 116 Punkte (20 Stimmen)

Schlecht Gut

Infos zur Publikation

Infos zur Publikation

LinuxUser 05/2014

Aktuelle Ausgabe kaufen:

Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,95 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 60,60) können Sie im Medialinx-Shop bestellen.

Tipp der Woche

Bilder vergleichen mit diffimg
Bilder vergleichen mit diffimg
Tim Schürmann, 01.04.2014 12:40, 1 Kommentare

Das kleine Werkzeug diffimg kann zwei (scheinbar) identische Bilder miteinander vergleichen und die Unterschiede optisch hervorheben. Damit lassen sich nicht nur Rätsel a la „Orignial und Fäls...

Aktuelle Fragen

programm suche
Hans-Joachim Köpke, 13.04.2014 10:43, 8 Antworten
suche noch programme die zu windows gibt, die auch unter linux laufen bzw sich ähneln sozusagen a...
Funknetz (Web-Stick)
Hans-Joachim Köpke, 04.04.2014 07:31, 2 Antworten
Bei Windows7 brauche ich den Stick nur ins USB-Fach schieben dann erkennt Windows7 Automatisch, a...
Ubuntu 13.10 überschreibt immer Windows 8 Bootmanager
Thomas Weiss, 15.03.2014 19:20, 8 Antworten
Hallo Leute, ich hoffe das ich richtig bin. Ich habe einen Dell Insipron 660 Ich möchte gerne Ub...
USB-PTP-Class Kamera wird nicht erkannt (Windows-only)
Wimpy *, 14.03.2014 13:04, 15 Antworten
ich habe meiner Frau eine Digitalkamera, AGFA Optima 103, gekauft und wir sind sehr zufrieden dam...
Treiber
Michael Kristahn, 12.03.2014 08:28, 5 Antworten
Habe mir ein Scanner gebraucht gekauft von Canon CanoScan LiDE 70 kein Treiber wie bekomme ich de...