Suchen

Die Suche mit Recoll funktioniert ähnlich wie die im Internet: Sie geben einen oder mehrere Suchbegriffe in eine Suchmaske ein und erhalten eine Liste passender Dokumente. Recoll versucht, deren Relevanz zu ermitteln und platziert die wichtigsten möglichst weit oben. Dabei unterscheidet Recoll zwischen einer einfache Suche und einer erweiterte Suche.

Bei der voreingestellten einfachen Suche trennen Leerzeichen die einzelnen Suchbegriffe. Abbildung 3 zeigt, was eine Suche nach "Recoll" in einem Index ergibt, der /usr/share/ umfasst, also auch alle relevanten Dokumente zum Programm. Neuere Versionen von Recoll bieten eine zusätzliche tabellenbasierte Darstellung an, die der rechte Schalter in der Werkzeugleiste aktiviert.

Abbildung 3: Die Suchergebnisse in der voreingestellten Darstellung. Preview öffnet die Datei voreingestellt in einer reinen (extrahierten) Textform, Open via Dateimanager. Die mimeview-Datei im Konfigurationsverzeichnis erlaubt, diese Zuordnungen anzupassen.

Ein weiterer Schalter neben dem Eingabefeld legt fest, wie Recoll die Suchbegriffe interpretiert: Reicht es, wenn einer der Suchbegriffe auftritt (Irgendein Ausdruck), müssen das Dokument alle enthalten (Alle Ausdrücke) oder wird nach Dateinamen gesucht?

Die Einstellung Suchsprache (Query Language) bewirkt, dass Sie jedem Element einer Suchanfrage einen Typbezeichner (siehe Tabelle "Recoll Query Language: Typbezeichner") voranstellen dürfen, also etwa author:"Karsten Günther", statt "Karsten Günther". Recoll unterstützt die Suche nach konkreten Phrasen, diese Sie dazu in doppelte Hochkommata einfassen. Ein nachgestelltes l deaktiviert das Stemming, ein p wirkt als NEAR, ein o kennzeichnet ungefähre Angaben und eine Dezimalzahl wie 3.5 dient als Gewichtung.

Recoll Query Language: Typbezeichner

Bezeichner Bedeutung
title, subject, caption Titel, Betreff, Legende/Unterschrift/Beschriftung
recipient, author Empfänger, Autor
keyword Schlüsselwörter
filename, ext, dir Dateiname, Dateiextension, Verzeichnisname
type, rclcat, mime Dokumententyp, Kategorie, MIME-Typ
date für Datumsangaben in der Form JJJJ-MM-TT oder Perioden

Mehrere Suchbegriffe verknüpft Recoll durch ein logisches UND (explizit als AND angegeben), alternativ stehen ODER (OR) und NICHT (hier reicht ein vorangestelltes Minuszeichen) zur Verfügung. Klammern gruppieren Teilausdrücke noch zusätzlich. In der ersten Zeile der Suchergebnisse bietet Suche zeigen eine einfache Möglichkeit, sich die Syntax der aktuellen Anfrage in der Query Language anzeigen zu lassen – so erhalten Sie schnell eine Eindruck von deren Syntax und Anwendung. Aus der Eingabe aus dem obigen Beispiel, gefolgt von p, konstruiert Recoll die folgende Abfrage:

Suchdetails: ((Akarsten NEAR 2 Agunther))

Die erweiterte Suche bietet eine einfache Möglichkeit, die Anzahl der Suchergebnisse einzuschränken. Der entsprechende Dialog (Abbildung 4) steht sowohl im Werkzeugmenü als auch über den linken Button in der Werkzeugleiste zur Verfügung. Die Schalter in der unteren Werkzeugleiste dienen dazu, nur in bestimmten Dokumententypen zu suchen.

Abbildung 4: Die erweiterte Suche erlaubt das Einschränken der Suchergebnisse.

Die Suchbegriffe dürfen auch Wildcards enthalten. Dabei steht das Sternchen wie üblich für beliebig viele Zeichen, das Fragezeichen für genau ein Zeichen (am Wortanfang verzögert dies die Suche erheblich) und die eckigen Klammern kennzeichnen Bereiche, bei denen die Grenzen mit enthalten sind. Recoll verfügt über ein spezielles Werkzeug, um diese Ausdrücke zu testen (Abbildung 5), den Ausdruck Explorer (Term Explorer, im Menü Werkzeug). Er funktioniert ähnlich wie ein Stichwortverzeichnis und zeigt alle auf das eingegebene Muster passen Indexeinträge. Vervollständigen aktiviert das Stemming und konstruiert die Einträge.

Abbildung 5: Der Explorer zeigt die zum eingegebenen Suchmuster oder Suchbegriff passenden Indexeinträge.

Fazit

Recoll bietet ein sehr einfach zu nutzendes Frontend für die Desktopsuche, ohne gleich alle erweiterten Funktionen vor dem Anwender zu verbergen. Die im Hintergrund eingesetzte Such-Engine Xapian gehört mit zu den besten Open-Source-Lösungen für diese Aufgabe und setzt viele moderne Konzepte um. Durch die Trennung von Front- und Backend gibt es vielfältige Möglichkeiten, den Index zu nutzen, beispielsweise auch über das Web-Frontend Omega [5]

Infos

[1] Recoll: http://www.recoll.org

[3] Recoll-Quellcode: http://www.lesbonscomptes.com/recoll/download.html

[2] Suchmaschine Xapian: http://xapian.org

[4] Xapian-Quellcode: http://xapian.org/download

[5] Omega: http://trac.xapian.org/wiki/Omega

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 3 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 

Ähnliche Artikel

  • Nadel im Heuhaufen
    Ob Brief ans Finanzamt oder Mail vom Onlinehändler – mit der Desktopsuchmaschine Recoll finden Sie wichtige Dateien mit wenigen Mausklicks.
  • Angetestet
  • Tausende Dateien und Ordner: den Überblick behalten
    Überquellende Papierstapel mit unsortierter Post erschweren die Suche nach einem wichtigen Dokument, und das gilt analog auch für digitale Dokumente auf dem Linux-PC. Wir präsentieren Lösungen für eine aufgeräumte Platte, auf der Sie schnell finden, was Sie suchen.
Kommentare

Infos zur Publikation

LU 12/2014: ANONYM & SICHER

Digitale Ausgabe: Preis € 4,95
(inkl. 19% MwSt.)

Mit der Zeitschrift LinuxUser sind Sie als Power-User, Shell-Guru oder Administrator im kleinen Unternehmen monatlich auf dem aktuelle Stand in Sachen Linux und Open Source.

Sie sind sich nicht sicher, ob die Themen Ihnen liegen? Im Probeabo erhalten Sie drei Ausgaben zum reduzierten Preis. Einzelhefte, Abonnements sowie digitale Ausgaben erwerben Sie ganz einfach in unserem Online-Shop.

NEU: DIGITALE AUSGABEN FÜR TABLET & SMARTPHONE

HINWEIS ZU PAYPAL: Die Zahlung ist auch ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!       

Tipp der Woche

Ubuntu 14.10 und VirtualBox
Ubuntu 14.10 und VirtualBox
Tim Schürmann, 08.11.2014 18:45, 0 Kommentare

Wer Ubuntu 14.10 in einer virtuellen Maschine unter VirtualBox startet, der landet unter Umständen in einem Fenster mit Grafikmüll. Zu einem korrekt ...

Aktuelle Fragen

Nach Ubdates alles weg ...
Maria Hänel, 15.11.2014 17:23, 4 Antworten
Ich brauche dringen eure Hilfe . Ich habe am wochenende ein paar Ubdates durch mein Notebook von...
Brother Drucker MFC-7420
helmut berger, 11.11.2014 12:40, 1 Antworten
Hallo, ich habe einen Drucker, brother MFC-7420. Bin erst seit einigen Tagen ubuntu 14.04-Nutzer...
Treiber für Drucker brother MFC-7420
helmut berger, 10.11.2014 16:05, 2 Antworten
Hallo, ich habe einen Drucker, brother MFC-7420. Bin erst seit einigen Tagen ubuntu12.14-Nutzer u...
Can't find X includes.
Roland Welcker, 05.11.2014 14:39, 1 Antworten
Diese Meldung erhalte ich beim Versuch, kdar zu installieren. OpenSuse 12.3. Gruß an alle Linuxf...
DVDs über einen geeigneten DLNA-Server schauen
GoaSkin , 03.11.2014 17:19, 0 Antworten
Mein DVD-Player wird fast nie genutzt. Darum möchte ich ihn eigentlich gerne abbauen. Dennoch wür...