Eigene interne Suchmaschine für Dokumente, Dateien, Intranet und News

Suchmaschine
Suchmaschine

Suchmaschine Open Semantic Search 14.05.18 erschienen

Markus Mandalka
23.05.2014 Die datenschutzfreundlich und unabhängig selbst betreibbare Suchmaschine ermöglicht leichtes, schnelles und übersichtliches Durchsuchen, Navigieren und Filtern, Sichten und Analysieren, Ordnen und Organisieren großer, verteilter und heterogener Dokumentensammlungen und Datenbestände

Die datenschutzfreundlich und unabhängig betreibbare Suchmaschine Open Semantic Search ist in Version 14.05.18 erschienen.

Die modulare Suchlösung basiert auf der Open Source Enterprise-Search Software Apache Solr und integriert sie mit verschiedenen Linux Standard-Tools.

Sie ermöglicht einfaches, leichtes, schnelles und übersichtliches Durchsuchen (Volltextsuche), Navigieren und Filtern (explorative Suche und Facettensuche), Sichten und Analysieren (Preview und Datenvisualisierung), Ordnen und Organisieren (Tagging oder Schlagworte, Verknüpfungen, Annotation, Bewertungen und Metadatenverwaltung) und internem Monitoring (auf dem Laufenden bleiben durch Abonnieren differenzierter Newsfeeds und Activity-Streams) auch sehr großer, verteilter und heterogener Dokumentensammlungen und Datenbestände.

Die indexierten Daten können in verschiedenen Dateiformaten vorliegen, wie z.B. Dokumente, Präsentationen, Dateien, Bilder, Videos oder Tabellen und aus verschiedenen Datenquellen stammen, wie z.B. Dateien und Verzeichnisse, Fileserver, CMS, Website, Wikis, Datenbanken oder News aus RSS-Newsfeeds.

Dabei werden auch viele in grafischen Formaten vorliegende Texte, wie z.B. Scans oder fotografierte Dokumente per automatischer Texterkennung (OCR) mit Tesseract ausgelesen und indexiert.

Das Suchinterface bzw. Userinterface eignet sich für den Einsatz auf Webseiten und ist zum größten Teil schon für mobile Geräte bzw. Handy und Tablets optimiert (Responsive Design).

Die integrierten Softwarepakete für Annotation und Tagging sind teamfähig bzw. auch für kollaborative Recherchen nutzbar.

Die freie Software ist inklusive Quellcode auf der Projektseite zum Download verfügbar.

Während die zuvor veröffentlichte verschlüsselte Suchlösung InvestiGateIX als abgeschottete Umgebung für einzelne Recher konzipiert wurde, die sich selbst von Laien installieren lässt, bietet Open Semantic Search die bei InvestiGateIX zum Einsatz kommende Suchmaschinensoftware als teamfähige Version für Server bzw. Redaktionen.

Mit dieser Open Source Software ist der datenschutzfreundliche Betrieb wie auch die kollaborative Nutzung einer eigenen internen Suchmaschine, bei der Suchanfragen, zu durchsuchenden Daten und Dokumente im Haus bzw. in der Redaktion verbleiben, auch Teams möglich, die beim gemeinsamen Einordnen, Strukturieren, Analysieren, Taggen und Annotieren zusammen arbeiten.

Wegen der möglichst geringen Abhängigkeiten und technischen Anforderungen der Benutzerschnittstelle bzw. des Solr-Clients und responsiven User Interface (neben Solr reicht Standard Webspace mit PHP) lässt sich dieses auch zum einfachen und Aufsetzen einer Website für Dokumentensuche bzw. Erschliessung von Dokumenten verwenden.

So können auch größere Dokumentensammlungen günstig, schnell und einfach mit komfortablen Übersichts-, Sichtungs, Download- und Abonniermöglichkeiten sowie mächtigen Filter- und Suchfunktionen im Internet der Allgemeinheit oder als Intranetlösung ausgewählten Medienpartnern zugänglich gemacht werden, ohne jedes Dokument einzeln in ein CMS uploaden und einpflegen zu müssen.

Dazu gibt es ein kurzes Tutorial zur Installation einer solchen Suchmaschine auf Ubuntu oder Debian Linux in wenigen Schritten.

Ähnliche Artikel

Kommentare
Support ist quasi nicht vorhanden
Ilo (unangemeldet), Mittwoch, 04. Mai 2016 09:36:15
Ein/Ausklappen

Leider werden Fragen zur Konfiguration oder Pfadanpassung (z.B. windows share) nicht beantwortet. Wenn es wenigstens ein Forum gäbe, wo sich die Leute gegenseitig helfen könnten, wenn schon die Entwickler sich nicht rühren.
Aber auch da Fehlanzeige. Denn so ganz trivial ist das ganze nicht, bis es läuft. Out-of-the-box ist hier mal gar nix. Bei mir läuft z.B. ausschließlich nur die VM korrekt. Da gibt es ind er Unterstützung noch einiges zu tun! Sehr schade! :(


Bewertung: 229 Punkte bei 18 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Aktuelle Fragen

Bash awk Verständnis-Frage
Josef Federl, 22.07.2017 17:46, 0 Antworten
#!/bin/bash # Skriptdateiname = test.sh spaltennummer=10 wert=zehner awk '{ $'$spaltennummer'...
Bash - verschachtelte Variablenersetzung, das geht doch eleganter als meine Lösung?
Josef Federl, 18.07.2017 20:24, 2 Antworten
#!/bin/bash #Ziel des Skriptes wird sein die ID zu extrahieren hier nur als Consolentest: root@...
Speicherplatzfreigabe mit "sudo apt-get clean" scheitert
Siegfried Böttcher, 16.07.2017 21:16, 2 Antworten
Speicherplatzfreigabe mit "sudo apt-get clean" scheitert, weil aus mir unerfindlichen Gründen im...
Möchte Zattoo vom PC am Fernsehgerät sehen können
Ilona Nikoui, 15.07.2017 18:25, 3 Antworten
Hallo, ich habe mein Fernsehgerät, ein LG 26LE3300 mit dem PC verbunden per HDMI Kabel, wie empfo...
TUXEDO und Hardwareauswahl , fragwürdig / Kritik
Josef Federl, 11.07.2017 12:44, 7 Antworten
Auf tuxedocomputers.com steht: "....Aber wir können auch Linux und das so, dass "einfach" alles...