nepomuk-logo.png

Daten mit Bedeutung

Die neuen Features von KDE 4.4: Teil 5

17.02.2010
In KDE 4 hält der semantische Desktop Einzug. Über die Nepomukdienste kann der Benutzer nun flott durch seine Dateien suchen. Der semantische Desktop hat jedoch weit mehr zu bieten, als nur die Desktopsuche.

"I have a dream for the Web become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers." Tim Berners-Lee, 1999

10 Jahre nachdem Tim Berners-Lee, Urvater des World Wide Web seine Vision von einer semantischen, das heißt auf Bedeutung basierenden Struktur des Web verkündete, ist davon bisher noch nicht sehr viel passiert, zumindest nicht im Web. Aber auch auf dem lokalen Computer beherrschen weiterhin traditionelle Dateisysteme die Oberfläche.

Das von der Europäischen Gemeinschaft initiierte Forschungsprojekt Nepomuk [1] setzte sich zum Ziel, die Daten des Benutzers zu vereinen. Dabei soll eine persönliche, auf für den Benutzer zugänglicheren Konzepten basierende Datenquelle dem Datenwirrwarr Struktur verleihen, und es ermöglichen, verschiedene Datenquellen, miteinander thematisch zu verlinken. Die Daten des Benutzers erhalten auf diese Weise eine zusätzliche Bedeutung (siehe Kasten "Metadaten").

Metadaten

Beim semantischen Desktop geht es um Metadaten, also Informationen, die der Datei angeheftet werden. Dies kann ein Kommentar sein, eine Bewertung oder ein Schlagwort. Metadaten beschränken sich allerdings nicht auf diese allgemeinen Attribute. Für ein digitales Photo finden Sie zum Beispiel typischerweise die Auflösung der Aufnahme, die Belichtungszeit, den Zeitpunkt der Aufnahme und vieles mehr.

Metadaten können dabei nicht nur Dateien angeheftet werden, sondern auch anderen Artefakten, wie zum Beispiel URLs, Projekte, Personen, usw. Welche Arten Ressourcen es gibt, ist dabei offen standardisiert in den auf Freedesktop.org entwickelten Ontologien [2]. In diesen Ontologien werden semantische Ressourcen definiert, und welche Metadaten für diese sinnvoll sind. Ontologien normalisieren also das Format verschiedener Ressourcen.

Ein interessanter Aspekt an Metadaten im Sinne des semantischen Desktops ist, dass man auch Ressourcen miteinander verbinden kann. So entsteht quasi ein semantisches Netz, was sich über ihre Informationen legt und den Zugriff darauf erlaubt.

Im Rahmen des Nepomuk-Forschungsprojekts wurde an einer ersten Implementation des semantischen Desktops innerhalb der KDE Software Compilation gearbeitet [3]. Schon das Release von KDE 4.0 enthielt die entsprechenden Grundlagen, für den Benutzer war allerdings noch nicht sehr viel zu holen: Die Neuerungen beschränkten sich zum größten Teil auf neue Funktionen in KDE's Entwickler-Kit.

Nepomuk in KDE 4.4

Die Achillesferse der KDE-Implementation von Nepomuk – und damit des semantischen Desktops in KDE – bildet die Performance. Nepomuk kümmert sich nicht selber um das Speichern der Daten, sondern überlässt dies einer speziell dafür entwickelten Datenbank. Mit KDE SC 4.4 liefert das Nepomuk-Team um Sebastian Trüg ein neues, auf der RDF-Datenbank Virtuoso basierendes Speicher-Backend mit. Virtuoso löst neben dem Performance-Problem auch Lizenz- und Paketierungsprobleme und ebnet den Weg, um die Technologien des semantischen Desktops weiter umzusetzen.

In den Systemeinstellungen finden Sie unter Erweitert die Einstellungen für die Desktopsuche. Hier können Sie die semantischen Funktionen einschalten. Schalten Sie den Strigi Datei-Indexer ein, dann werden auch Daten auf ihrer Festplatte indiziert. Im Reiter Datei-Indizierung finden Sie die genauen Pfade die indiziert werden.

Schaltet man die Festplattenindexierung ab, kann man weiterhin auf die Nepomuk Datenbank zugreifen, der Dateiindex steht in den den Resultaten der Desktopsuche dann allerdings nicht mehr als Datenquelle mit aktuellen Daten zur Verfügung.

Die Nepomukdienste lassen sich auch komplett abschalten. In den Applikationen, und selbstverständlich in der Plasma Arbeitsumgebung stehen dann allerdings Features wie Annotation, Bewertung und Tagging nicht mehr zur Verfügung. Da nicht alle Linux Distributionen den semantischen Desktop und damit die Suchfunktionen in der Voreinstellung einschalten, lohnt sich ein Blick in die Einstellungen.

Neu in 4.4 ist die Option, Daten auf Wechselmedien zu indizieren. So können Dokumente auf einem USB Stick automatisch gescannt werden, und stehen damit in der Desktopsuche als mögliche Resultate zur Verfügung. Diese Dateien werden dabei nur eingeblendet, wenn der entsprechende Datenträger auch verfügbar ist. Dies wird anhand eines Identifikationsstrings für das Medium bestimmt. Intern hilft hier KDEs Hardware-Framework Solid. Benutzen Sie Nepomuk für größere Datenmengen, empfiehlt es sich, in den Erweiterten Einstellungen Nepomuk etwas mehr Speicher zuzugestehen.

Das Indizieren geht recht flott, sodass es sich auch für größere Datenmengen eignet. Wie lange es genau dauert, hängt maßgeblich von der Zahl und Art der Dateien ab, die sie in den Suchindex aufnehmen wollen. Wenn der Indexer aktiv ist, finden Sie das Nepomuk-Icon im Systemabschnitt der Kontrollleiste. Es wird automatisch ausgeblendet, wenn der Indexer inaktiv ist. Über das Kontextmenü können sie den Indexer auch zeitweise deaktivieren, falls er ihnen doch mal in den Weg kommen sollte.

Abbildung 1: Einstellungen für die Desktopsuche.

Desktopsuche à la KDE

Starten Sie unter KDE 4.4 den Dateimanager Dolphin bemerken Sie im rechten oberen Teil die neue Suchezeile (falls nicht sichtbar, einfach über das Menü Einstellungen | Angezeigte Werkzeugleistenaktivieren). Diese erweiterte Eingabezeile assistiert ihnen dabei, Ihre Suchaufgabe zu definieren. Tippen Sie hier einen Begriff ein, werden zum Beispiel Optionen angeboten, nach einem Tag zu suchen. Die Vervollständigung vergleicht dabei die Eingabe bereits während des Tippens mit vorhandenen Schlagworten. So können Sie die ersten Buchstaben tippen, zum Beispiel Wallpaper um Bilder die sie vorher als "Wallpaper" markiert haben zu finden.

Geben Sie einen Begriff ein, und bestätigen Sie diesen mit der Eingabetaste, sucht Dolphin nach Dateien in denen dieser Begriff vorkommt. Wenn sie die Volltextsuche in den Systemeinstellungen aktiviert haben, können sie hiermit also auch innerhalb von Dateien suchen. Ihre Suche verfeinern Sie weiter, indem Sie auf den "+" Knopf klicken, womit ihnen weitere Suchkriterien geboten werden. Setzen Sie Typ auf Text, werden nicht nur plain/text-Dateien gefunden, sondern zum Beispiel auch OpenDocument- und PDF-Dokumente.

Benötigen Sie eine bestimmte Suchaufgabe mehrmals, dann klicken Sie auf Speichern, um diese Suchaufgabe in das Orte-Menü aufzunehmen. Dieser Mechanismus ermöglicht es, Dokumente auch einfach aus anderen Programmen zu öffnen. Sie finden die als Ort gespeicherten Suchen in der Seitenleiste des Datei Öffnen-Dialogs. Dabei werden selbstverständlich nicht die Ergebnisse selber gespeichert, sondern die Suchaufgabe. Dies ermöglicht es die Suche auf dem neusten Stand auszuführen.

Hierzu nutzt KDE ein virtuelles KIO-Dateisystem, das die Suche unabhängig vom Programm abwickelt. Die Suchanfrage speichert KDE in den Orten als nepomuksearch:/-URL, die auf eine SPARQL Query verweist. Die Suchaufgabe wird dabei während der Wiedergabe durch einen internen Benachrichtigungsmechanismus aktualisiert. Tippen Sie einfach mal in die Adresszeile in Dolphin nepomuksearch://linux und schauen Sie was passiert.

Abbildung 2: Desktopsuche im Dateimanager.

Die Integration der Desktopsuche auf Dateimanagement-Ebene erweist sich dabei als besonders flexibel, wenn Sie bestimmte Dokumente in einem größeren Verzeichnisbaum suchen wollen. Während Sie mit Dolphin durch ihre Daten surfen, können sie von dort aus auch direkt eine Suche starten.

In der Suchen-Ausklappbox können Sie die Suche auf ihre Position im Verzeichnisbaum beschränken. Weitere Suchkriterien, wie zum Beispiel der Dateityp lassen sich bequem mit dem "+"-Knopf hinzufügen. Auch das Datum der letzten Änderung kann man hier genauer angeben, um so zum Beispiel länger nicht bearbeitete Dateien aus den Resultaten auszuschließen. Selbstverständlich können sie hier auch die Suche auf eine minimale Bewertung einschränken. Eine schicke Dreingabe bei der Wiedergabe ist übrigens Dolphins Gruppierungsoption, die Sie im Ansicht-Menü finden.

In Dolphins Seitenleiste, die sie mit [F11] anzeigen, finden Sie einige zur Datei gespeicherte Metadaten. Hier können sie auch bequem einer oder mehreren Dateien gleichzeitig ein Schlagwort oder einen Kommentar geben. Um die Bewertung zu ändern, klicken Sie auf die Reihe mit den fünf Sternen. Dabei können Sie auch halbe Sterne vergeben, die Bewertung wird intern als Wert zwischen eins und zehn gespeichert.

Abbildung 3: Anzeige und Bearbeiten von Metadaten.

Der schnelle Zugriff auf die Suchergebnisse erweist sich auch im Datei Öffnen-Dialog als sehr praktisch. In der Seitenleiste finden sie hier die Orte, und damit auch die gespeicherten Suchanfragen zurück. Anstatt sich zeitraubend durch Verzeichnisbäume zu hangeln um bestimmte Dateien zu finden, können Sie hier voreingestellte Suchanfragen benutzen, und so zusammengehörende Dateien komfortabel gleichzeitig öffnen, auch wenn sie in verschiedenen Verzeichnissen gespeichert sind. Dies könnte sich leicht zu einem Feature entwickeln, dass sie nicht mehr missen möchten.

Abbildung 4: Desktopsuche aus dem Datei Öffnen-Dialog heraus.

Kreativ mit Plasma

Diese tiefgreifende Integration des semantischen Desktop erlaubt ihnen auch etwas kreativere Möglichkeiten im Umgang mit ihren Dateien. Legen Sie sich doch mal ein Ordner Ansicht-Miniprogramm auf den Desktop, und richten Sie es auf eine nepomuksearch:/-URL – oder gleich auf einen ihrer als Ort gespeicherten Suchanfragen. In Plasma 4.4 haben die KDE Entwickler nochmal in die Trickkiste gegriffen, und haben das Drag & Drop von Daten auf den Desktop erweitert. Schon in 4.3 konnte man lokale Links auf den Desktop ziehen und dort ablegen, und damit ein Ordner Ansicht-Miniprogramm erstellen, oder zum Beispiel eine Textdatei auf den Desktop legen, um einen Notizzettel mit dem Text der Datei zu erstellen. Dieser Mechanismus bietet eine sehr natürliche Umgangweise mit dem Desktop, da Sie nicht nachdenken müssen, welches Miniprogramm Sie jetzt benutzen, sondern einfach Daten auf dem Desktop ablegen können, wobei Plasma ihnen dann entsprechend passendes Miniprogramm erstellt.

Abbildung 5: Nepomuksuche auf dem Desktop.

Applikationen

Je mehr Applikationen beim Sammeln der Metadaten zusammenarbeiten, das hisst denselben Index zum Speichern ihrer Metainformationen benutzen, desto attraktiver wird es für andere Applikationen auch auf diesen Speicher zuzugreifen. Dies befördert den Austausch von Informationen zwischen Applikationen, und ermöglicht damit auch ergonomischere Workflows.

Abbildung 6: Metadaten im Bildbetrachter.

Im Bildbetrachter Gwenview erfahren Sie, dass die Integration von Metadaten auch weitergehen kann, als nur Dateien zu öffnen. Wenn sie im Ansicht-Menü unter Vorschaubilder die Bewertung einschalten, können sie Bilder direkt im Übersichtsmodus bewerten. Hierfür sind übrigens auch Kurzbefehle festgelegt. Drücken sie beim Betrachten eines Bildes auf eine Zahl zwischen eins und fünf, wird das Bild mit der entsprechenden Bewertung versehen. Auf diese Art können sie der Masse von Bildern schnell Klasse verleihen. Im Übersichtsmodus den sie beim Start von Gwenview vorfinden, können sie direkt auf Schlagworte zugreifen, sodass sie ihre Bilder auch "semantisch" betrachten können.

Abbildung 7: Bilder nach Schlagwort betrachten.

Was ist mit Mails?

Konkret wird die mit KDE SC 4.5 im kommenden Sommer erwartete Umstellung von Kontact auf Akonadi diese Features auch in den PIM-Bereich bringen. Akonadi übernimmt dann die Rolle des zentralen Nachrichtencenters in der KDE Software Compilation. Die KMail-Hacker benutzen die Nepomuk-Technologien zur Indexierung von Emails. Auch ihre Attachments bleiben dabei nicht außen vor. Da die zur Datenindexierung verwendete Libstreams auch die Suche in einem verschachtelten Dokument ermöglicht, wird auch zum Beispiel ein Dokument, das in einem gezippten Archiv einer E-Mail beilag untersucht. Die aus den E-Mails extrahierten Metadaten werden über Nepomuk verlinkt gespeichert, sodass sich eine semantische Struktur über die E-Mail legen lässt. Dies verkürzt nicht nur die Suche nach bestimmten Mails, sondern ermöglicht auch die Wiedergabe von Nachrichten im Kontext anderer Daten. Der semantische Desktop hat also noch längst nicht alle möglichen Features erreicht.

Infos

[1] Nepomuk-Homepage: http://nepomuk.semanticdesktop.org

[2] Ontologien: http://www.semanticdesktop.org/ontologies/

[3] Nepomuk (KDE): http://nepomuk.kde.org

Ähnliche Artikel

Kommentare
Netter Versuch aber das reicht nicht!
Martin Lüchem, Donnerstag, 05. August 2010 13:27:52
Ein/Ausklappen

Schön, dass hier mal etwas erklärt wird über die Desktop-Suche. Allerdings ist mir das zu ungenau!

- Warum heißt das "Desktop-Suche"? Schränkt sich das auf den Desktop ein, den es seit KDE 4 / Plasma als solches ja gar nicht mehr gibt?

- Was tun die verschiedenen beteiligten Module? Das muss man schon allein deshalb wissen, weil die Sache z.B. unter Debian Testing, KDE 4.4.5 nicht funktioniert und - was noch schlimmer ist - zu erheblichen Performance-Problemen führt. Bei mir "ideln" Nepomuk und Strigi vor sich hin, der Lüfter bläst unablässig, KMail ist langsam und instabil und ich kann keinerlei Fortschritt erkennen.

- Wie schaltet man die Module an oder ab? Es ist nur erwähnt aber weder gibt es in den Menüs die entsprechend benannten Module unter diesem Namen noch ist genaueres erklärt.

- Teilweise ist das auch fehlerhaft, was hier beschrieben wird. Ich finde z.B. keine Option "Volltextsuche". Wo ist die?

Schade! Martin


Bewertung: 177 Punkte bei 16 Stimmen.
Den Beitrag bewerten: Gut / Schlecht