Suchmaschine Open Semantic Search 14.05.18 erschienen

Suchmaschine
Suchmaschine

Eigene interne Suchmaschine für Dokumente, Dateien, Intranet und News

Markus Mandalka
23.05.2014 Die datenschutzfreundlich und unabhängig selbst betreibbare Suchmaschine ermöglicht leichtes, schnelles und übersichtliches Durchsuchen, Navigieren und Filtern, Sichten und Analysieren, Ordnen und Organisieren großer, verteilter und heterogener Dokumentensammlungen und Datenbestände

Die datenschutzfreundlich und unabhängig betreibbare Suchmaschine Open Semantic Search ist in Version 14.05.18 erschienen.

Die modulare Suchlösung basiert auf der Open Source Enterprise-Search Software Apache Solr und integriert sie mit verschiedenen Linux Standard-Tools.

Sie ermöglicht einfaches, leichtes, schnelles und übersichtliches Durchsuchen (Volltextsuche), Navigieren und Filtern (explorative Suche und Facettensuche), Sichten und Analysieren (Preview und Datenvisualisierung), Ordnen und Organisieren (Tagging oder Schlagworte, Verknüpfungen, Annotation, Bewertungen und Metadatenverwaltung) und internem Monitoring (auf dem Laufenden bleiben durch Abonnieren differenzierter Newsfeeds und Activity-Streams) auch sehr großer, verteilter und heterogener Dokumentensammlungen und Datenbestände.

Die indexierten Daten können in verschiedenen Dateiformaten vorliegen, wie z.B. Dokumente, Präsentationen, Dateien, Bilder, Videos oder Tabellen und aus verschiedenen Datenquellen stammen, wie z.B. Dateien und Verzeichnisse, Fileserver, CMS, Website, Wikis, Datenbanken oder News aus RSS-Newsfeeds.

Dabei werden auch viele in grafischen Formaten vorliegende Texte, wie z.B. Scans oder fotografierte Dokumente per automatischer Texterkennung (OCR) mit Tesseract ausgelesen und indexiert.

Das Suchinterface bzw. Userinterface eignet sich für den Einsatz auf Webseiten und ist zum größten Teil schon für mobile Geräte bzw. Handy und Tablets optimiert (Responsive Design).

Die integrierten Softwarepakete für Annotation und Tagging sind teamfähig bzw. auch für kollaborative Recherchen nutzbar.

Die freie Software ist inklusive Quellcode auf der Projektseite zum Download verfügbar.

Während die zuvor veröffentlichte verschlüsselte Suchlösung InvestiGateIX als abgeschottete Umgebung für einzelne Recher konzipiert wurde, die sich selbst von Laien installieren lässt, bietet Open Semantic Search die bei InvestiGateIX zum Einsatz kommende Suchmaschinensoftware als teamfähige Version für Server bzw. Redaktionen.

Mit dieser Open Source Software ist der datenschutzfreundliche Betrieb wie auch die kollaborative Nutzung einer eigenen internen Suchmaschine, bei der Suchanfragen, zu durchsuchenden Daten und Dokumente im Haus bzw. in der Redaktion verbleiben, auch Teams möglich, die beim gemeinsamen Einordnen, Strukturieren, Analysieren, Taggen und Annotieren zusammen arbeiten.

Wegen der möglichst geringen Abhängigkeiten und technischen Anforderungen der Benutzerschnittstelle bzw. des Solr-Clients und responsiven User Interface (neben Solr reicht Standard Webspace mit PHP) lässt sich dieses auch zum einfachen und Aufsetzen einer Website für Dokumentensuche bzw. Erschliessung von Dokumenten verwenden.

So können auch größere Dokumentensammlungen günstig, schnell und einfach mit komfortablen Übersichts-, Sichtungs, Download- und Abonniermöglichkeiten sowie mächtigen Filter- und Suchfunktionen im Internet der Allgemeinheit oder als Intranetlösung ausgewählten Medienpartnern zugänglich gemacht werden, ohne jedes Dokument einzeln in ein CMS uploaden und einpflegen zu müssen.

Dazu gibt es ein kurzes Tutorial zur Installation einer solchen Suchmaschine auf Ubuntu oder Debian Linux in wenigen Schritten.

Ähnliche Artikel

Kommentare

955 Hits
Wertung: 108 Punkte (5 Stimmen)

Schlecht Gut

Aktuelle Fragen

Server antwortet mit falschem Namen
oin notna, 21.07.2014 19:13, 1 Antworten
Hallo liebe Community, Ich habe mit Apache einen Server aufgesetzt. Soweit, so gut. Im Heimnet...
o2 surfstick software für ubuntu?
daniel soltek, 15.07.2014 18:27, 1 Antworten
hallo zusammen, habe mir einen o2 surfstick huawei bestellt und gerade festgestellt, das der nic...
Öhm - wozu Benutzername, wenn man dann hier mit Klarnamen angezeigt wird?
Thomas Kallay, 03.07.2014 20:30, 1 Antworten
Hallo Team von Linux-Community, kleine Zwischenfrage: warum muß man beim Registrieren einen Us...
openSUSE 13.1 - Login-Problem wg. Fehler im Intel-Grafiktreiber?
Thomas Kallay, 03.07.2014 20:26, 8 Antworten
Hallo Linux-Community, habe hier ein sogenanntes Hybrid-Notebook laufen, mit einer Intel-HD460...
Fernwartung für Linux?
Alfred Böllmann, 20.06.2014 15:30, 7 Antworten
Hi liebe Linux-Freunde, bin beim klassischen Probleme googeln auf www.expertiger.de gestoßen, ei...