Eigene interne Suchmaschine für Dokumente, Dateien, Intranet und News

Suchmaschine
Suchmaschine

Suchmaschine Open Semantic Search 14.05.18 erschienen

Markus Mandalka
23.05.2014 Die datenschutzfreundlich und unabhängig selbst betreibbare Suchmaschine ermöglicht leichtes, schnelles und übersichtliches Durchsuchen, Navigieren und Filtern, Sichten und Analysieren, Ordnen und Organisieren großer, verteilter und heterogener Dokumentensammlungen und Datenbestände

Die datenschutzfreundlich und unabhängig betreibbare Suchmaschine Open Semantic Search ist in Version 14.05.18 erschienen.

Die modulare Suchlösung basiert auf der Open Source Enterprise-Search Software Apache Solr und integriert sie mit verschiedenen Linux Standard-Tools.

Sie ermöglicht einfaches, leichtes, schnelles und übersichtliches Durchsuchen (Volltextsuche), Navigieren und Filtern (explorative Suche und Facettensuche), Sichten und Analysieren (Preview und Datenvisualisierung), Ordnen und Organisieren (Tagging oder Schlagworte, Verknüpfungen, Annotation, Bewertungen und Metadatenverwaltung) und internem Monitoring (auf dem Laufenden bleiben durch Abonnieren differenzierter Newsfeeds und Activity-Streams) auch sehr großer, verteilter und heterogener Dokumentensammlungen und Datenbestände.

Die indexierten Daten können in verschiedenen Dateiformaten vorliegen, wie z.B. Dokumente, Präsentationen, Dateien, Bilder, Videos oder Tabellen und aus verschiedenen Datenquellen stammen, wie z.B. Dateien und Verzeichnisse, Fileserver, CMS, Website, Wikis, Datenbanken oder News aus RSS-Newsfeeds.

Dabei werden auch viele in grafischen Formaten vorliegende Texte, wie z.B. Scans oder fotografierte Dokumente per automatischer Texterkennung (OCR) mit Tesseract ausgelesen und indexiert.

Das Suchinterface bzw. Userinterface eignet sich für den Einsatz auf Webseiten und ist zum größten Teil schon für mobile Geräte bzw. Handy und Tablets optimiert (Responsive Design).

Die integrierten Softwarepakete für Annotation und Tagging sind teamfähig bzw. auch für kollaborative Recherchen nutzbar.

Die freie Software ist inklusive Quellcode auf der Projektseite zum Download verfügbar.

Während die zuvor veröffentlichte verschlüsselte Suchlösung InvestiGateIX als abgeschottete Umgebung für einzelne Recher konzipiert wurde, die sich selbst von Laien installieren lässt, bietet Open Semantic Search die bei InvestiGateIX zum Einsatz kommende Suchmaschinensoftware als teamfähige Version für Server bzw. Redaktionen.

Mit dieser Open Source Software ist der datenschutzfreundliche Betrieb wie auch die kollaborative Nutzung einer eigenen internen Suchmaschine, bei der Suchanfragen, zu durchsuchenden Daten und Dokumente im Haus bzw. in der Redaktion verbleiben, auch Teams möglich, die beim gemeinsamen Einordnen, Strukturieren, Analysieren, Taggen und Annotieren zusammen arbeiten.

Wegen der möglichst geringen Abhängigkeiten und technischen Anforderungen der Benutzerschnittstelle bzw. des Solr-Clients und responsiven User Interface (neben Solr reicht Standard Webspace mit PHP) lässt sich dieses auch zum einfachen und Aufsetzen einer Website für Dokumentensuche bzw. Erschliessung von Dokumenten verwenden.

So können auch größere Dokumentensammlungen günstig, schnell und einfach mit komfortablen Übersichts-, Sichtungs, Download- und Abonniermöglichkeiten sowie mächtigen Filter- und Suchfunktionen im Internet der Allgemeinheit oder als Intranetlösung ausgewählten Medienpartnern zugänglich gemacht werden, ohne jedes Dokument einzeln in ein CMS uploaden und einpflegen zu müssen.

Dazu gibt es ein kurzes Tutorial zur Installation einer solchen Suchmaschine auf Ubuntu oder Debian Linux in wenigen Schritten.

Ähnliche Artikel

Kommentare
Support ist quasi nicht vorhanden
Ilo (unangemeldet), Mittwoch, 04. Mai 2016 09:36:15
Ein/Ausklappen

Leider werden Fragen zur Konfiguration oder Pfadanpassung (z.B. windows share) nicht beantwortet. Wenn es wenigstens ein Forum gäbe, wo sich die Leute gegenseitig helfen könnten, wenn schon die Entwickler sich nicht rühren.
Aber auch da Fehlanzeige. Denn so ganz trivial ist das ganze nicht, bis es läuft. Out-of-the-box ist hier mal gar nix. Bei mir läuft z.B. ausschließlich nur die VM korrekt. Da gibt es ind er Unterstützung noch einiges zu tun! Sehr schade! :(


Bewertung: 203 Punkte bei 15 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Aktuelle Fragen

WLAN lässt sich nicht einrichten
Werner Hahn, 21.03.2017 14:16, 0 Antworten
Dell Latitude E6510, Ubuntu 16.4, Kabelbox von Telecolumbus. Nach Anklicken des Doppelpfeiles (o...
"Mit Gwenview importieren" funktioniert seit openSuse 42.2 nicht mehr
Wimpy *, 20.03.2017 13:34, 2 Antworten
Bisher konnte ich von Digitalkamera oder SD-Karte oder USB-Stick Fotos mit Gwenview importieren....
Ich habe eine awk Aufgabe und bekomme es nicht so Recht hin
Dennis Hamacher, 10.03.2017 18:27, 1 Antworten
Ich hoffe Ihr könnt mir dabei helfen oder mir zeigen wie der Befehl richtig geschrieben wird. Ich...
Unter Linux Open Suse Leap 42.1 einen Windows Boot/ ISO USB Stick erstellen...
Tim Koetsier, 07.03.2017 15:26, 1 Antworten
Hallo, weiß jemand wie ich oben genanntes Vorhaben in die Tat umsetzen kann ? Wäre echt dankba...
Druckertreiber installieren OpenSuse42.1
Tim Koetsier, 07.03.2017 15:22, 1 Antworten
hallo, kann mir BITTE jemand helfen ich verzweifel so langsam. Habe einen Super Toner von Canon...