nepomuk.png

© LNM AG

Daten mit Bedeutung

KDEs semantischer Desktop

12.03.2010
Über die Dienste von Nepomuk durchsuchen Sie nicht nur flott die Dateien auf Ihrem Rechner: Der semantische Desktop von KDE SC 4.4 hat weit mehr zu bieten.

"I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computer", fasste der Urvater des World Wide Web, Tim Berners-Lee, 1999 seine Vorstellung von der Zukunft des Netzes zusammen. Gut zehn Jahre später ist von dieser Vision der semantischen, das heißt auf Bedeutung basierenden Struktur des Web noch nicht sehr viel zu sehen. Auch auf dem lokalen Computer beherrschen weiterhin traditionelle Dateisysteme die Oberfläche.

Die Datenmenge, mit der sich die Computerbenutzer konfrontiert sehen, steigt ständig. Klassische Dateisysteme bieten Daten in einer hierarchischen Struktur an und organisieren sie dazu in Ordnern. Dabei speichern sie Metadaten nur auf Dateiebene und oft nur individuell – man muss sie also für jede Datei einzeln abrufen. Diese Struktur trägt weder der Zusammengehörigkeit von Dateien Rechnung, noch dem Kontext, in dem die Daten für den Benutzer relevant sind.

Das von der Europäischen Gemeinschaft initiierte Forschungsprojekt Nepomuk [1] hat sich das Ziel gesetzt, die Daten des Benutzers zu vereinen. Dabei soll eine persönliche Datenquelle dem Datenwirrwarr Struktur verleihen, die auf Konzepten basiert, die für den Benutzer zugänglicher ausfallen. Zudem soll Nepomuk es ermöglichen, verschiedene Datenquellen (zum Beispiel Dateien) miteinander thematisch zu verlinken. Das soll den Daten des Benutzers wortwörtlich Bedeutung hinzufügen.

Im Rahmen des Nepomuk-Forschungsprojekts arbeiteten die Entwickler an einer ersten Implementation des semantischen Desktops innerhalb der KDE Software Compilation. Schon mit dem Release von KDE 4.0 kamen die Basics in der Entwicklungsplattform mit. Für den Benutzer war hier allerdings noch nicht sehr viel zu holen, da sich die Neuerungen zum größten Teil auf neue Funktionen in KDE's Entwickler-Kit beschränkten.

Metadaten

Beim semantischen Desktop geht um Metadaten, also solche Informationen, die der Datei angeheftet werden. Dabei kann es sich um einen Kommentar handeln, eine Bewertung oder ein Schlagwort. Metadaten beschränken sich allerdings nicht auf diese allgemeinen Attribute. Für ein digitales Photo umfassen sie zum Beispiel typischerweise auch Zeitpunkt und Auflösung der Aufnahme, die Belichtungszeit, die Blende und vieles mehr.

Solche Metadaten lassen sich nicht nur Dateien anheften, sondern auch anderen Artefakten, wie zum Beispiel URLs, Projekten, Personendaten, und so fort. Welche Arten Ressourcen es dazu gibt,legen die auf Freedesktop.org entwickelten Ontologien [2] in Form eines offenen Standards fest. Diese Ontologien definieren zum einen semantische Ressourcen und zum anderen, welche Metadaten für diese jeweils sinnvoll sind – Sie normalisieren also das Format verschiedener Ressourcen.

Ein interessanter Aspekt der Metadaten im Sinne des semantischen Desktops: Man kann auch Ressourcen selbst miteinander verbinden. So entsteht quasi ein semantisches Netz, das sich über die Informationen legt und den Zugriff darauf erlaubt.

Ontologien – was ist was?

Um mit Dokumenten auf der Abstraktionsebene des semantischen Desktops umgehen zu können, muss man sich auf bestimmte Definitionen einigen, um den Datenaustausch und die inhaltliche Verlinkung erst einmal möglich zu machen. Dazu legen die Nepomuk-Ontologien Konzepte wie Person, Nachricht und Aufgabe sowie deren Relationen fest.

Um eine Person abzubilden, gibt es in Nepomuk die NCO-Ontologie. Sie bildet nicht nur Adressbucheinträge ab, sondern unter anderem auch Gesprächspartner im Chat und Kontakte in sozialen Netzwerken. Mittlerweile verwenden auch andere Projekte die Nepomuk-Ontologien, wie zum Beispiel die Suchmaschine Tracker. Das erlaubt prinzipiell einen einfachen Datenaustausch zwischen diesen Programmen.

Inkrementelle Entwicklung

In den auf Version 4.0 folgenden Releases der KDE Software Compilation konnten Sie schrittweise verfolgen, wie Nepomuk sich weiterentwickelt und die KDE-Programme mehr und mehr von den Möglichkeiten profitieren, die Nepomuk bietet. So hielt vor rund einem Jahr mit KDE 4.2 beinahe unbemerkt ein Plugin für KRunner Einzug, also für Plasmas Mini-Kommandozeile. Es listete alle Dateien auf, die zu einem Suchbegriff gefunden wurden, sodass man auf einmal an den gewohnten Stellen erweiterte Funktionalität finden konnte.

Die Achillesferse der KDE-Implementation von Nepomuk [3] – und damit des semantischen Desktops in KDE – bildete jedoch die Performance. Nepomuk kümmert sich nicht selbst um das Speichern der Daten, sondern überlässt dies einer speziell dafür entwickelten Datenbank. KDE 4.3 lieferte dabei zwei Optionen mit: Redland und Sesame2.

Das in C++ geschriebene Redland zeigte sich dabei wenig leistungsfähig, was zu langen Suchanfragen führte und damit effektiv die Brauchbarkeit von Nepomuk in vielen Fällen stark beschnitt. Das Sesame2-Speicherbackend läuft zwar um Einiges schneller, erzielte aber trotzdem noch nicht die für viele Szenarios benötigte Performance. Außerdem verursachte es einige Kopfschmerzen beim Paketieren, da sich in der in Java geschriebenen Sesame2-Datenbank binäre Dateien mit unklarer Lizenz befanden.

Mit KDE SC 4.4 liefert das Team um Sebastian Trüg, dem KDE-Hauptentwickler von Nepomuk, jedoch ein neues, auf der RDF-Datenbank Virtuoso [4] basierendes Speicher-Backend mit. Virtuoso räumt die Probleme sowohl hinsichtlich der Lizenz und Paketierung als auch insbesondere der Performance weitgehend aus. Damit macht es den Weg frei, die Technologien rund um den semantischen Desktop weiter umzusetzen.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 

Related content

  • Xesam und Nepomuk fusionieren
    Sebastian Trüg erklärt die Konkurrenz zwischen den semantischen Frameworks Xesam und Nepomuk für beendet.
  • Daten mit Bedeutung
    In KDE 4 hält der semantische Desktop Einzug. Über die Nepomukdienste kann der Benutzer nun flott durch seine Dateien suchen. Der semantische Desktop hat jedoch weit mehr zu bieten, als nur die Desktopsuche.
  • Nepomuk Webminer in Version 0.6

    Der Entwickler Jörg Ehrichs hat seine KDE-Software Nepomuk Webminer, die im Internet nach Metadaten sucht, in Version 0.6 veröffentlicht.
  • Finden statt suchen
    Aufgabe: Finden Sie alle Dateien auf Ihrem Rechner, die Sie per Mailanhang von Ihrem Freund Max bekommen haben.
  • Fehlersuche in Kontact, Akonadi und Nepomuk
    KDEs Groupware-Client Kontact glänzt zwar mit beeindruckender Funktionsvielfalt, produziert jedoch gelegentlich auch ärgerliche Fehler. Kein Problem – wenn Sie wissen, wo Sie hinlangen müssen.
Kommentare
Und die Praxis heute?
Hans-Dieter Schulze, Freitag, 12. März 2010 18:42:12
Ein/Ausklappen

Schade, dass im Artikel nicht auf die derzeitigen Probleme eingegangen wird.
Ich nutze die aktuelle KDE-Version 4.4.1.
Die Volltextindizierung funktioniert bei vielen PDF-Dokumenten nicht.
Der Indexer läuft fast permanent mit hoher CPU- und Speicherlast.
Obwohl sich in den meisten Verzeichnissen nichts ändert, werden diese neu indiziert und die Anzahl der indizierten Dateien schwankt zwichen 31000, 0 und 31000 .

Es gibt also noch viel zu tun.


Bewertung: 153 Punkte bei 17 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Infos zur Publikation

title_2014_08

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

Mit der Zeitschrift LinuxUser sind Sie als Power-User, Shell-Guru oder Administrator im kleinen Unternehmen monatlich auf dem aktuelle Stand in Sachen Linux und Open Source.

Sie sind sich nicht sicher, ob die Themen Ihnen liegen? Im Probeabo erhalten Sie drei Ausgaben zum reduzierten Preis. Einzelhefte, Abonnements sowie digitale Ausgaben erwerben Sie ganz einfach in unserem Online-Shop.

NEU: DIGITALE AUSGABEN FÜR TABLET & SMARTPHONE

HINWEIS ZU PAYPAL: Die Zahlung ist auch ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!       

Tipp der Woche

Schnell Multi-Boot-Medien mit MultiCD erstellen
Schnell Multi-Boot-Medien mit MultiCD erstellen
Tim Schürmann, 24.06.2014 12:40, 0 Kommentare

Wer mehrere nützliche Live-Systeme auf eine DVD brennen möchte, kommt mit den Startmedienerstellern der Distributionen nicht besonders weit: Diese ...

Aktuelle Fragen

Server antwortet mit falschem Namen
oin notna, 21.07.2014 19:13, 1 Antworten
Hallo liebe Community, Ich habe mit Apache einen Server aufgesetzt. Soweit, so gut. Im Heimnet...
o2 surfstick software für ubuntu?
daniel soltek, 15.07.2014 18:27, 1 Antworten
hallo zusammen, habe mir einen o2 surfstick huawei bestellt und gerade festgestellt, das der nic...
Öhm - wozu Benutzername, wenn man dann hier mit Klarnamen angezeigt wird?
Thomas Kallay, 03.07.2014 20:30, 1 Antworten
Hallo Team von Linux-Community, kleine Zwischenfrage: warum muß man beim Registrieren einen Us...
openSUSE 13.1 - Login-Problem wg. Fehler im Intel-Grafiktreiber?
Thomas Kallay, 03.07.2014 20:26, 8 Antworten
Hallo Linux-Community, habe hier ein sogenanntes Hybrid-Notebook laufen, mit einer Intel-HD460...
Fernwartung für Linux?
Alfred Böllmann, 20.06.2014 15:30, 7 Antworten
Hi liebe Linux-Freunde, bin beim klassischen Probleme googeln auf www.expertiger.de gestoßen, ei...