Home / LinuxUser / 2007 / 04 / Nadel im Heuhaufen

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

War doch klar...
(241 Punkte bei 17 Stimmen)
Re: War doch klar...
(178 Punkte bei 7 Stimmen)
Re: Skype für 64-Bit-Prozessor u. Suse 12.1
(161 Punkte bei 4 Stimmen)
Kubuntu verliert Finanzierung
(130 Punkte bei 4 Stimmen)
Offen fürs Geschäft
(80 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Nadel im Heuhaufen

Dateien finden mit Recoll

Finderlohn

Sobald der Index steht, können Sie nach Begriffen suchen. Dazu tippen Sie einfach das entsprechende Wort oder die Wörter in das Eingabefeld oberhalb der Ergebnisbox und klicken auf Search. Recoll schlägt im Index nach und präsentiert anschließend in einer Liste alle Dokumente, in denen das gesuchte Wort auftaucht (Abbildung 2). Ähnlich wie die Internetsuchmaschine Google sortiert die Software alle gefundenen Dokumente nach Relevanz im Hinblick auf die vorgegebenen Stichwörter.

Abbildung 2: Recoll zeigt zwei Dokumente aus dem Heimatverzeichnis an, die den Begriff "Geld" enthalten. Zwischen Groß- und Kleinschreibung unterscheidet Recoll dabei nicht.

Sofern die Suchmaschine dabei gut geraten hat, finden Sie direkt im obersten Eintrag genau das von Ihnen gesuchte Dokument. Ein Klick auf Edit startet ein passendes Betrachtungsprogramm. In den Einstellungen unter Preferences | Query configuration auf dem Register User Interface hinter Manage dürfen Sie die verwendeten Anwendungen anpassen.

Standardmäßig führt Recoll alle Dokumente auf, die mindestens einen der Suchbegriffe enthalten. Möchten Sie hingegen nur Ergebnisse sehen, die wirklich alle eingetippten Wörter umfassen, so wählen Sie in der Liste direkt links neben dem Eingabefeld den Punkt All terms. Komplette Phrasen setzen Sie in Anführungszeichen.

Möchten Sie die Suchanfrage etwas detaillierter steuern, finden Sie hinter Tools | Advanced Search die Eingabemaske aus Abbildung 3. Dort legen Sie Wörter fest, die nicht im Dokument auftauchen dürfen, und schränken im unteren Bereich die Suche auf bestimmte Dateiformate ein.

Abbildung 3: In der erweiterten Suchmaske schränken Sie die Suche weiter ein. Hier sucht Recoll nach Dokumenten, die den Begriff "Geld", aber nicht "Finanzen" enthalten, und die entweder als RTF oder Word-Dokument vorliegen.

Trickkiste

Manchmal kommt es vor, dass Sie sich nicht mehr erinnern, wie das gesuchte Wort genau lautete. Bei der Suche nach dem Brief für das Finanzamt käme der Begriff "Geld" als Suchkriterium in Frage. Vielleicht stand in dem Brief damals aber auch der Plural "Gelder". Sofern Sie das Wörterbuch Aspell installiert haben, kümmert sich Recoll automatisch um dieses Problem. Standardmäßig fahndet es selbständig nach allen Wörtern mit gleichem Wortstamm.

Im Fall von "Geld" würden somit auch alle Dokumente gefunden, in denen die Wörter "Geldes" oder "Gelder" vorkommen. Außerdem beugt das Programm zusätzlich Verben, soweit möglich. Damit Recoll dabei die korrekte Sprache wählt, geben Sie diese in den Einstellungen unter Preferences | Query configuration auf dem Register Search parameters unter Stemming language vor.

Dort stand allerdings nach der Installation nur english zur Auswahl. Ein Blick in das Verzeichnis .recoll/xapiandb zeigte, dass sich dort ein Unterverzeichnis stem_english befindet, in dem wiederum Indexdateien liegen. Die Beispielkonfiguration zeigte, dass die Option indexstemminglanguages die entsprechenden Sprachen enthalten muss, bei denen das Programm vom Wortstamm ausgehend auch verwandte Begriffe sucht.

Bei dieser Form der Suche setzt Recoll zusätzlich zur Xapian-Engine auf die Snowball-Engine [4]. Welche Sprache die zum Erzeugen der Wortstammdaten versteht, zeigt die passende Website. Standardmäßig erzeugt die Software nur Wortstammdaten für die englische Sprache. Füllen Sie daher die besagte Option mit english german auf, um für diese beiden die entsprechenden Indexe zu erzeugen. Ein erneuter Indizierungslauf mit Recollindex erzeugt dann mit stem_german ein Unterverzeichnis auf Grundlage des deutschen Wörterbuchs.

Bei Tippfehlern im Suchbegriff läuft jede Suche jedoch ins Leere. In solch hartnäckigen Fällen hilft der "Term Explorer" weiter (Tools | Term explorer). Mit ihm durchsuchen Sie die Liste der im Index vorgehaltenen Begriffe (Wildcard und Regexp), nutzen die Wortstammsuche (Stem expansion) oder prüfen mittels Aspell Ihr Suchwort (Spelling/Phonetik).

Letzteres setzt allerdings voraus, dass neben dem Aspell-Programm auch die notwendigen Dictionaries vorliegen. So zeigte sich beispielsweise eine frische Installation von Ubuntu 6.10 trotz deutscher Sprachauswahl nicht in der Lage, diese gleich ins System zu integrieren. Hier war Nacharbeit angesagt: Erst nach Installation des Pakets aspell-de funktionierte das Feature.

Im Term Explorer stöbern Sie ähnlich wie in einem Wörterbuch: Einfach den entsprechenden Begriff eintippen und auf Expand klicken. Bei der Suche mittels Wildcards oder regulären Ausdrücken sowie bei der Wortstammsuche liefert das Programm eine Liste mit Treffern und Anzahl zurück. Ein Doppelklick auf einen Begriff übernimmt den Begriff in die Suchleiste. Etwas ungünstig wirkte sich bei diesem Test aus, dass das Fenster des Term Explorers die Leiste verdeckte, und somit nicht sofort klar war, was der Doppelklick bewirkte.

Die Funktionen Wildcard und Regexp verstehen Platzhalter, wie * oder ?. Die Arbeitsweise unterscheidet sich jedoch in einer etwas gewöhnungsbedürftigen Weise: So liefert bei Wildcard ein *ung alle Wörter, die in den untersuchten Dokumenten vorkommen und auf ung enden. Bei der Funktion Regexp erzielt der Suchbegriff [A-z]*ung ein annähernd ähnliches Ergebnis – wobei dies nicht die Begriffe berücksichtigt, die Ziffern im ersten Wortteil enthalten.

Abbildung 4: Der Term Explorer erlaubt es auf vielfältige Weise, den Index nach Vorkommen von Begriffen und ähnlichen Wörtern zu durchsuchen.

Hausverbot

Standardmäßig berücksichtigt Recoll alle Dokumente im Heimatverzeichnis des aktuellen Benutzers. Möchten Sie dieses Verhalten ändern und beispielsweise bestimmte Unterverzeichnisse von der Suche ausschließen, so bleibt derzeit nur ein manueller Eingriff in die Konfigurationsdateien. Letztere finden sich im versteckten Unterverzeichnis .recoll, wo übrigens auch der Index liegt.

Dort öffnen Sie die Datei recoll.conf mit einem Texteditor und fügen den Eintrag topdirs = hinzu, falls dieser nicht vorhanden ist. Ihm folgen, jeweils durch ein Leerzeichen getrennt, alle Verzeichnisse, die Recoll bei der Suche berücksichtigt. Unterverzeichnisse schließt die Suchmaschine dabei automatisch mit ein.

Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare

Hits
Wertung: 36 Punkte (5 Stimmen)

Schlecht Gut

Infos zum Autor

Tim Schürmann

Tim Schürmann

Tim Schürmann ist Diplom-Informatiker und derzeit als freier Autor unterwegs. Mehr Informationen finden Sie auf seiner Homepage unter www.tim-schuermann.de.


Infos zur Publikation

Infos zur Publikation

LinuxUser 03/2012

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,50 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 56,10) können Sie im LNM-Shop bestellen.

Tipp der Woche

Duden Korrektor unter 64-Bit
Duden Korrektor unter 64-Bit
Tim Schürmann, 06.02.2012 10:36, 0 Kommentare

Der Duden Korrektor bietet eine äußerst nützliche Rechtschreib- und Grammatikkorrektur für LibreOffice und bringt in der aktuellen Version 8 e...

Aktuelle Fragen

Ubuntu 11.10 Compiz 3D Cube flackern
Moritz Obenauer, 12.02.2012 12:25, 0 Antworten
Hallo! Ich habe Ubuntu 11.10 mit Unity und den Compiz 3D Cube ein gerichtet. Er funktioniert...
Suse 12.1 Bootvorgang bleibt seit Update stehen
Wimpy *, 12.02.2012 09:22, 4 Antworten
Seit Update auf Kernel 3.1.9-1.4-desktop i686 bleibt der Bootvorgang stehen. Es erscheint der gr...
N24 Stick (Huawei E173) und Ubuntu 11.04
Patrick Obenauer, 11.02.2012 11:54, 1 Antworten
Hallo zusammen! Ich benutze einen alten Laptop, der mit Ubuntu 11.04 flott und problemlos läuft....
Wie kann man beim Einsatz von Compiz die Fenster-Dekoration einstellen?
GoaSkin , 10.02.2012 20:12, 0 Antworten
Hallo, ich nutze Linux Mint mit dem Gnome-Derivat Mate. Da die Distribution Compiz nicht autom...
rndc reload zone - failed bad zone
Ludwig jun. B., 06.02.2012 16:08, 2 Antworten
Schönen guten Tag, ich habe folgendes Problem. Immer wenn ich folgendes Kommando ausführen bek...