Eigene interne Suchmaschine für Dokumente, Dateien, Intranet und News

Suchmaschine
Suchmaschine

Suchmaschine Open Semantic Search 14.05.18 erschienen

Markus Mandalka
23.05.2014 Die datenschutzfreundlich und unabhängig selbst betreibbare Suchmaschine ermöglicht leichtes, schnelles und übersichtliches Durchsuchen, Navigieren und Filtern, Sichten und Analysieren, Ordnen und Organisieren großer, verteilter und heterogener Dokumentensammlungen und Datenbestände

Die datenschutzfreundlich und unabhängig betreibbare Suchmaschine Open Semantic Search ist in Version 14.05.18 erschienen.

Die modulare Suchlösung basiert auf der Open Source Enterprise-Search Software Apache Solr und integriert sie mit verschiedenen Linux Standard-Tools.

Sie ermöglicht einfaches, leichtes, schnelles und übersichtliches Durchsuchen (Volltextsuche), Navigieren und Filtern (explorative Suche und Facettensuche), Sichten und Analysieren (Preview und Datenvisualisierung), Ordnen und Organisieren (Tagging oder Schlagworte, Verknüpfungen, Annotation, Bewertungen und Metadatenverwaltung) und internem Monitoring (auf dem Laufenden bleiben durch Abonnieren differenzierter Newsfeeds und Activity-Streams) auch sehr großer, verteilter und heterogener Dokumentensammlungen und Datenbestände.

Die indexierten Daten können in verschiedenen Dateiformaten vorliegen, wie z.B. Dokumente, Präsentationen, Dateien, Bilder, Videos oder Tabellen und aus verschiedenen Datenquellen stammen, wie z.B. Dateien und Verzeichnisse, Fileserver, CMS, Website, Wikis, Datenbanken oder News aus RSS-Newsfeeds.

Dabei werden auch viele in grafischen Formaten vorliegende Texte, wie z.B. Scans oder fotografierte Dokumente per automatischer Texterkennung (OCR) mit Tesseract ausgelesen und indexiert.

Das Suchinterface bzw. Userinterface eignet sich für den Einsatz auf Webseiten und ist zum größten Teil schon für mobile Geräte bzw. Handy und Tablets optimiert (Responsive Design).

Die integrierten Softwarepakete für Annotation und Tagging sind teamfähig bzw. auch für kollaborative Recherchen nutzbar.

Die freie Software ist inklusive Quellcode auf der Projektseite zum Download verfügbar.

Während die zuvor veröffentlichte verschlüsselte Suchlösung InvestiGateIX als abgeschottete Umgebung für einzelne Recher konzipiert wurde, die sich selbst von Laien installieren lässt, bietet Open Semantic Search die bei InvestiGateIX zum Einsatz kommende Suchmaschinensoftware als teamfähige Version für Server bzw. Redaktionen.

Mit dieser Open Source Software ist der datenschutzfreundliche Betrieb wie auch die kollaborative Nutzung einer eigenen internen Suchmaschine, bei der Suchanfragen, zu durchsuchenden Daten und Dokumente im Haus bzw. in der Redaktion verbleiben, auch Teams möglich, die beim gemeinsamen Einordnen, Strukturieren, Analysieren, Taggen und Annotieren zusammen arbeiten.

Wegen der möglichst geringen Abhängigkeiten und technischen Anforderungen der Benutzerschnittstelle bzw. des Solr-Clients und responsiven User Interface (neben Solr reicht Standard Webspace mit PHP) lässt sich dieses auch zum einfachen und Aufsetzen einer Website für Dokumentensuche bzw. Erschliessung von Dokumenten verwenden.

So können auch größere Dokumentensammlungen günstig, schnell und einfach mit komfortablen Übersichts-, Sichtungs, Download- und Abonniermöglichkeiten sowie mächtigen Filter- und Suchfunktionen im Internet der Allgemeinheit oder als Intranetlösung ausgewählten Medienpartnern zugänglich gemacht werden, ohne jedes Dokument einzeln in ein CMS uploaden und einpflegen zu müssen.

Dazu gibt es ein kurzes Tutorial zur Installation einer solchen Suchmaschine auf Ubuntu oder Debian Linux in wenigen Schritten.

Ähnliche Artikel

Kommentare
Support ist quasi nicht vorhanden
Ilo (unangemeldet), Mittwoch, 04. Mai 2016 09:36:15
Ein/Ausklappen

Leider werden Fragen zur Konfiguration oder Pfadanpassung (z.B. windows share) nicht beantwortet. Wenn es wenigstens ein Forum gäbe, wo sich die Leute gegenseitig helfen könnten, wenn schon die Entwickler sich nicht rühren.
Aber auch da Fehlanzeige. Denn so ganz trivial ist das ganze nicht, bis es läuft. Out-of-the-box ist hier mal gar nix. Bei mir läuft z.B. ausschließlich nur die VM korrekt. Da gibt es ind er Unterstützung noch einiges zu tun! Sehr schade! :(


Bewertung: 143 Punkte bei 5 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Aktuelle Fragen

Probleme mit MPC/MPD
Matthias Göhlen, 27.09.2016 13:39, 0 Antworten
Habe gerade mein erstes Raspi Projekt angefangen, typisches Einsteigerding: Vom Raspi 3B zum Radi...
Soundkarte wird erkannt, aber kein Ton
H A, 25.09.2016 01:37, 6 Antworten
Hallo, Ich weiß, dass es zu diesem Thema sehr oft Fragen gestellt wurden. Aber da ich ein Linu...
Scannen nur schwarz-weiß möglich
Werner Hahn, 20.09.2016 13:21, 2 Antworten
Canon Pixma MG5450S, Dell Latitude E6510, Betriebssyteme Ubuntu 16.04 und Windows 7. Der Canon-D...
Meteorit NB-7 startet nicht
Thomas Helbig, 13.09.2016 02:03, 4 Antworten
Verehrte Community Ich habe vor Kurzem einen Netbook-Oldie geschenkt bekommen. Beim Start ersch...
windows bootloader bei instalation gelöscht
markus Schneider, 12.09.2016 23:03, 1 Antworten
Hallo alle zusammen, ich habe neben meinem Windows 10 ein SL 7.2 Linux installiert und musste...