Suchmaschine Open Semantic Search 14.05.18 erschienen

Suchmaschine
Suchmaschine

Eigene interne Suchmaschine für Dokumente, Dateien, Intranet und News

Markus Mandalka
23.05.2014 Die datenschutzfreundlich und unabhängig selbst betreibbare Suchmaschine ermöglicht leichtes, schnelles und übersichtliches Durchsuchen, Navigieren und Filtern, Sichten und Analysieren, Ordnen und Organisieren großer, verteilter und heterogener Dokumentensammlungen und Datenbestände

Die datenschutzfreundlich und unabhängig betreibbare Suchmaschine Open Semantic Search ist in Version 14.05.18 erschienen.

Die modulare Suchlösung basiert auf der Open Source Enterprise-Search Software Apache Solr und integriert sie mit verschiedenen Linux Standard-Tools.

Sie ermöglicht einfaches, leichtes, schnelles und übersichtliches Durchsuchen (Volltextsuche), Navigieren und Filtern (explorative Suche und Facettensuche), Sichten und Analysieren (Preview und Datenvisualisierung), Ordnen und Organisieren (Tagging oder Schlagworte, Verknüpfungen, Annotation, Bewertungen und Metadatenverwaltung) und internem Monitoring (auf dem Laufenden bleiben durch Abonnieren differenzierter Newsfeeds und Activity-Streams) auch sehr großer, verteilter und heterogener Dokumentensammlungen und Datenbestände.

Die indexierten Daten können in verschiedenen Dateiformaten vorliegen, wie z.B. Dokumente, Präsentationen, Dateien, Bilder, Videos oder Tabellen und aus verschiedenen Datenquellen stammen, wie z.B. Dateien und Verzeichnisse, Fileserver, CMS, Website, Wikis, Datenbanken oder News aus RSS-Newsfeeds.

Dabei werden auch viele in grafischen Formaten vorliegende Texte, wie z.B. Scans oder fotografierte Dokumente per automatischer Texterkennung (OCR) mit Tesseract ausgelesen und indexiert.

Das Suchinterface bzw. Userinterface eignet sich für den Einsatz auf Webseiten und ist zum größten Teil schon für mobile Geräte bzw. Handy und Tablets optimiert (Responsive Design).

Die integrierten Softwarepakete für Annotation und Tagging sind teamfähig bzw. auch für kollaborative Recherchen nutzbar.

Die freie Software ist inklusive Quellcode auf der Projektseite zum Download verfügbar.

Während die zuvor veröffentlichte verschlüsselte Suchlösung InvestiGateIX als abgeschottete Umgebung für einzelne Recher konzipiert wurde, die sich selbst von Laien installieren lässt, bietet Open Semantic Search die bei InvestiGateIX zum Einsatz kommende Suchmaschinensoftware als teamfähige Version für Server bzw. Redaktionen.

Mit dieser Open Source Software ist der datenschutzfreundliche Betrieb wie auch die kollaborative Nutzung einer eigenen internen Suchmaschine, bei der Suchanfragen, zu durchsuchenden Daten und Dokumente im Haus bzw. in der Redaktion verbleiben, auch Teams möglich, die beim gemeinsamen Einordnen, Strukturieren, Analysieren, Taggen und Annotieren zusammen arbeiten.

Wegen der möglichst geringen Abhängigkeiten und technischen Anforderungen der Benutzerschnittstelle bzw. des Solr-Clients und responsiven User Interface (neben Solr reicht Standard Webspace mit PHP) lässt sich dieses auch zum einfachen und Aufsetzen einer Website für Dokumentensuche bzw. Erschliessung von Dokumenten verwenden.

So können auch größere Dokumentensammlungen günstig, schnell und einfach mit komfortablen Übersichts-, Sichtungs, Download- und Abonniermöglichkeiten sowie mächtigen Filter- und Suchfunktionen im Internet der Allgemeinheit oder als Intranetlösung ausgewählten Medienpartnern zugänglich gemacht werden, ohne jedes Dokument einzeln in ein CMS uploaden und einpflegen zu müssen.

Dazu gibt es ein kurzes Tutorial zur Installation einer solchen Suchmaschine auf Ubuntu oder Debian Linux in wenigen Schritten.

Ähnliche Artikel

Kommentare

Aktuelle Fragen

Nach Ubdates alles weg ...
Maria Hänel, 15.11.2014 17:23, 4 Antworten
Ich brauche dringen eure Hilfe . Ich habe am wochenende ein paar Ubdates durch mein Notebook von...
Brother Drucker MFC-7420
helmut berger, 11.11.2014 12:40, 1 Antworten
Hallo, ich habe einen Drucker, brother MFC-7420. Bin erst seit einigen Tagen ubuntu 14.04-Nutzer...
Treiber für Drucker brother MFC-7420
helmut berger, 10.11.2014 16:05, 2 Antworten
Hallo, ich habe einen Drucker, brother MFC-7420. Bin erst seit einigen Tagen ubuntu12.14-Nutzer u...
Can't find X includes.
Roland Welcker, 05.11.2014 14:39, 1 Antworten
Diese Meldung erhalte ich beim Versuch, kdar zu installieren. OpenSuse 12.3. Gruß an alle Linuxf...
DVDs über einen geeigneten DLNA-Server schauen
GoaSkin , 03.11.2014 17:19, 0 Antworten
Mein DVD-Player wird fast nie genutzt. Darum möchte ich ihn eigentlich gerne abbauen. Dennoch wür...