AA_PO-23665-123RF-tiero_123RF-Aktenschrank.jpg

© tiero, 123RF

PDF-Dokumente webbasiert verwalten mit I-Librarian

Sauber archiviert

Um einen Wust von PDF-Dateien in eine ordentliche Form zu bringen, greifen Sie am besten zum webbasierten I-Librarian. Es verwaltet alle Dokumente sauber geordnet an zentraler Stelle.

Aufgrund seiner Eigenschaften gehören PDF-Dateien heute mit Abstand zum am meisten verbreiteten Format für Dokumente. Linux unterstützt das Darstellen und das Ausdrucken mit zahlreichen Werkzeugen, wie den Readern Evince, Okular oder Xpdf. Das Extrahieren einzelner Seiten oder der Text- und Bildinhalte eines PDF-Dokuments erfordert ebenfalls keine Magie: Pdftk zerlegt die Dateien seitenweise, Pdftotext erzeugt eine ASCII-Version des Texts, und Pdfimages speichert die eingebettete Bilder.

Einige Probleme bleiben beim Umgang mit den PDF-Dokumenten aber doch: Oft korrespondiert der Dateiname nur unzureichend mit dem Inhalt. Außerdem haben Sie keinen direkten Zugriff auf den Inhalt eines Dokuments, wenn Sie es nicht selbst durchsehen und sich die relevanten Informationen merken. Darüber hinaus verschließen sich die in einer Datei enthaltenen Texte und Bilder dem direkten Zugriff.

Sie haben natürlich die Möglichkeit, einzelne Teile vieler PDFs durch Drucken in eine Datei zu extrahieren, sofern der Ersteller dies beim Anfertigen des PDFs erlaubt hat. Aber selbst, wenn das möglich ist, stehen Sie immer noch vor der Aufgabe, manuell alle Artikel zu extrahieren, zu benennen und zu verwalten.

Genau da setzen setzen Dokumentmanagementsysteme (DMS) wie I-Librarian an: Sie registrieren die Dokumente und speichern bei Bedarf zusätzliche Metadaten in einer speziellen Datenbank. Anschließend haben Sie die Möglichkeit, die Datenbank nach den Metadaten zu durchsuchen.

Das Programm I-Librarian nutzt Document Object Identifier (DOI, [2]), um Dokumente eindeutig zu identifizieren. Eine Volltextsuche in den Inhalten unterstützt die Software bisher nicht. Möchten Sie diese Funktion nutzen, benötigen Sie eine Software wie Recoll [3].

Aber I-Librarian bietet dafür etwas anderes: So haben Sie die Möglichkeit, zusammen mit anderen Autoren Dokumente zu erstellen, Daten und Dokumente aus dem System weiterzugeben, sie mit Anmerkungen zu versehen oder zu ordnen. Eine umfangreiche Feature-Liste des Programms finden Sie im Netz [4].

Der erste Start

I-Librarian nutzen Sie über einen Webserver, also etwa Apache (siehe Kasten "Installation"). Geben Sie zum Start in den Browser die URL http://127.0.0.1/librarian oder http://127.0.0.1:8080/librarian ein [5]. Beim ersten Start legen Sie einen Account an, unter dem I-Librarian die von Ihnen verwalteten Dokumente speichert.

Installation

Für Ubuntu und einige andere Distributionen stellen die Entwickler fertige Pakete bereit [10]. Damit vereinfacht sich die Installation nach dem Entpacken der Pakete auf das interaktive Einrichten. Zunächst wechseln Sie in das beim Entpacken entstandene Verzeichnis I,-Librarian-2.9-Ubuntu/ (sic!). Dort starten Sie das Skript install.sh, das Sie durch die Konfiguration führt.

Dazu will es zuerst den Pfad für das gewünschte Programmverzeichnis wissen. Dann installiert es die noch benötigten Pakete nach. Anschließend fragt der Installer nach, ob Sie für die Installation einen Alias in der Konfiguration von Apache anlegen möchten. Damit ist die eigentliche Installation abgeschlossen. Weitere Details zur Einrichtung, insbesondere auch die Anpassungen des Webservers beschreibt eine ausführliche Website [11].

Die Entwickler bieten darüber hinaus eine manuelle Installationsvariante an, die mehr Flexibilität erlaubt. Beim Webserver ist das Programm nicht auf den Apache festgelegt. Verwenden Sie jedoch eine andere Software, benötigt es Handarbeit, um die Konfiguration zu erstellen.

I-Librarian setzt neben dem Webserver noch PHP5 sowie die PHP-Module php5-sqlite (auch als php-pdo bekannt) sowie php5-dg voraus. Weiterhin benötigt das DMS die poppler-utils sowie die bibutils. Ghostscript und Pdftk stehen in der Regel in allen Distributionen bereit.

Die webbasierte Oberfläche von I-Librarian bietet am oberen Rand sechs Menüpunkte an:

  • Library zeigt alle Einträge und dient zur Suche.
  • Shelf enthält aktuell zu bearbeitende Dokumente.
  • Über Desk verwalten Sie Projekte.
  • Mittels Clipboard erreichen Sie den temporären Speicher.
  • Über Add Record fügen Sie neue Einträge hinzu
  • Unter Tools finden Sie verschiedene Funktionen zum Bearbeiten der Dokumente.

In einem ersten Schritt pflegen Sie die Dateien ins System ein, die Sie verwalten wollen. Es gibt dazu zwei Möglichkeiten: Entweder wählen Sie einzelne Dokumente aus und laden diese oder lesen über PDF Batch Import lokale Verzeichnisse mit Dokumenten ein.

Um ein einzelnes Dokument zu laden, wechseln Sie in den Bereich Add Record. Eine lokal vorhandene Datei laden Sie über die Schaltfläche Choose File (Abbildung 1). Für eine im Internet frei zugängliche PDF-Datei kopieren Sie deren URL in das Eingabefeld PDF from the Web:. In beiden Fällen führt ein Klick auf den Schalter Save oben links dazu, dass die I-Librarian die Datei einliest.

Abbildung 1: Neue Dokumente laden Sie über Add Record.

Anschließend zeigt das DMS eine Vorschau an (Abbildung 2). Oberhalb der Vorschau finden Sie mehrere Schaltflächen, über die Sie bei Bedarf das Dokument bewerten (Paper Rating) und einordnen (Add to ...). Mit Save übernehmen Sie die Änderungen ins System.

Abbildung 2: Nach dem Laden eines Dokuments zeigt das DMS eine Vorschau an und bietet die Möglichkeit, die Metadaten zu ergänzen.

Zu den primärer Aufgaben von I-Librarian gehört das Verwalten von naturwissenschaftlichen und medizinischen Veröffentlichungen. Daher integriert das System eine Reihe von speziellen Literaturdatenbanken, wie Pubmed, Pubmed Central, NASA ADS, Arxiv, Jstor oder Highwire Press, aus denen Sie bei Bedarf die Metadaten für die Dokumente direkt abrufen. Das Online-Handbuch liefert Informationen zum Einsatz der Datenbanken [6]. Wissenschaftliche Publikationen aus dem Internet findet die Software, wenn Sie deren Metadaten in die Suchmaske eingeben. Anschließend haben Sie die Möglichkeit, das Dokument nur zu laden oder auch zu importieren.

Beim Batch-Import versucht die Software alle im Verzeichnis vorhandenen PDFs einzulesen. Auf Wunsch berücksichtigt das Programm dabei Unterverzeichnisse. Dieser Modus spart zwar Zeit, führt aber unter Umständen zu doppelten Einträgen. Das verschwendet nicht nur Speicherplatz, sondern verringert auch die Übersichtlichkeit. Damit dies nicht geschieht, stellt I-Librarian unter Tools die Funktion Find Duplicates bereit (Abbildung 3).

Abbildung 3: Doppelte Einträge in der Datenbank finden Sie mit der Funktion Find Duplicates im Bereich Tools.

Weitere Einstellungen nehmen Sie in den Bereichen Settings und Installation Details vor. Der Menüpunkt User Management erlaubt es, die Accounts für die Datenbank zu administrieren.

Den Metadaten, die zum Verwalten der Dokumente dienen, kommt eine besonders große Bedeutung zu: Für Dokumente ohne DOI-Eintrag sollten Sie die wichtigsten Metadaten selbst eingeben – nur so klappt der Einsatz der Software optimal. Die Suchfunktionen basieren im Wesentlichen auf den Meta-Informationen. Haben Sie fehlende Daten nicht beim Einlesen eingetragen, wechseln Sie in den Bereich Library. Dort klicken Sie das gewünschte Dokument an, woraufhin das Programm die Informationen zum Dokument anzeigt (Abbildung 4). Eine Beschreibung aller Metadaten-Felder findet sich im Netz [7].

Abbildung 4: Fehlende Metadaten für die Dokumente geben Sie bei Bedarf nachträglich ein.

Zum Sortieren der Dokumente bietet die Applikation neben den Projekten zusätzlich Kategorien an. Neue Kategorien legen Sie beim Einlesen an. Möchten Sie später welche hinzufügen, verwenden Sie Tools | Edit Categories. Die Maske bietet außerdem die Möglichkeit, bestehende Kategorien umzubenennen oder zu löschen. In den Bereichen Library oder Shelf ordnen Sie die Dateien den Kategorien zu.

Wann immer es darum geht, eine Aktion auf viele Dateien gleichzeitig anzuwenden, bietet sich der Einsatz des sogenannten Omnitools an. Sie finden den Button dafür ober rechts im Bereich Library (Abbildung 5).

Abbildung 5: Viele Einträge gleichzeitig bearbeiten Sie am einfachsten mit dem Omnitool.

Sobald Sie ein Dokument aufrufen – I-Librarian nutzt dafür voreingestellt einen internen Viewer, der auf Ghostscript, Pdftk und Poppler basiert – bietet das Programm eine Reihe spezieller Funktionen an (Abbildung 6). Diese hängen im Detail vom verwendeten PDF-Viewer ab. Das erlaubt es, auf unterschiedliche Weise Anmerkungen vorzunehmen oder Teile eines Dokuments zu kopieren.

Abbildung 6: Der interne Viewer bietet einige Funktionen zum Erstellen von Anmerkungen und um Teile von Seiten als Bilder zu speichern. Verwenden Sie Okular, ist aber deutlich mehr möglich.

Welchen Viewer das DMS verwendet stellen Sie unter Tools | Settings ein. Hier besteht die Möglichkeit, externe Viewer einzubinden. Als besonders leistungsfähig erweist sich wieder Okular. Dieser Viewer kommt in Konqueror automatisch als eingebettete Komponente zum Einsatz.

Wie Sie die Dokumente mit Anmerkungen versehen, hängt vom verwendeten PDF-Viewer ab. Bei Konqueror mit Okular stehen neun Möglichkeiten zum Markieren bereit. Der eingebaute, auf Ghostscript basierende Viewer bietet da deutlich weniger. Markierungen, die Sie mit Okular eingetragen haben, bearbeiten oder ergänzen Sie bei Bedarf nachträglich wieder mit diesem Programm. Das gelingt beim eingebauten Viewer nicht so leicht.

Möchten Sie mit Okular nachträglich etwas in die PDF-Datei eintragen, öffnen Sie über [F6] die Leiste links, in der sich die erforderlichen Werkzeuge befinden. Das kleine Fenster stellt die Varianten ein. Links neben der Vorschau finden Sie die vorhandenen Marken unter Rezensionen.

Abbildung 7: Drei Anmerkungen mit Okular: Der Kasten um points of interest, die Marke hinter POIs und die Haftnotiz kamen erst nachträglich ins Dokument.

Alle Anmerkungen speichert Okular im Verzeichnis ~/.kde/share/apps/okular/docdata/ in Dateien mit Namen in der Form 449418.00000026.000-000_Dateiname.xml. Geben Sie diese Dateien zusammen mit der PDF-Datei an einen anderen Bearbeiter weiter, sieht dieser die Anmerkungen beim Öffnen mit Okular ebenfalls. Ansonsten bleibt noch die Möglichkeit, die Kommentare über den Umweg LaTeX einzubauen (siehe Kasten "Kommentare einbetten") – ein nicht immer praktikabler Weg.

Kommentare einbetten

Es gibt eine relativ einfache Möglichkeit, PDF-Dokumente dauerhaft mit Anmerkungen zu versehen. Sie erzeugen dazu ein neues Dokument, das aus dem Original-PDF besteht und das Sie um die Anmerkungen ergänzen.

Dazu bietet sich der Einsatz des LaTeX-Makropakets PDFPages an, das mit dem Befehl \includepdf in der Lage ist, einzelne Seiten oder ganze Dokumente zu importieren. Dabei können Sie für jede Seite mit dem Befehl pagecommand=Seitenbefehle spezielle Kommandos übergeben, mit deren Hilfe Sie die Anmerkungen setzen. Listing 1 zeigt ein Beispiel für den Code eines neuen Dokuments.

Der Befehl pages= erwartet als Argument die Nummer(n) der Seite(n), auf denen Sie Anmerkungen anbringen wollen. Über den Bindestrich nehmen Sie alle Seiten der Originaldatei auf. Ansonsten definieren Sie einzelne Bereiche und fügen diese durch Kommata zusammen.

Das Kommando \seitenbefehle enthält den Code zum Setzen der Anmerkungen. Normalerweise kommt die Picture-Umgebung zum Einsatz, um das Material zu positionieren. In diese platzieren Sie über \put den gewünschten Text.

Listing 1

    
[...]
\documentclass[...]{article}
\usepackage{pdfpages}
\pagestyle{empty}
\def\seitenbefehle{...}
\begin{document}
\includepdf[pagecommand=\seitenbefehle, pages=-,...]{Original-PDF}
\end{document}

Fazit

I-Librarian erweist sich als ein spannendes und nützliches Werkzeug, mit dem Sie Übersicht in die immer noch sperrigen PDF-Dokumente bringen.

Doch wo Licht ist, da gibt es auch Schatten: Es fehlen Funktionen, um größere Textbereiche aus den angezeigten Dokumenten zu kopieren, zudem fehlt eine Volltextsuche über alle Dokumente. Die vielen unterschiedlichen Schaltflächen, die sich über das gesamte Browserfenster verteilen und teilweise etwas kryptische Bezeichner aufweisen, erschweren manchmal den Zugriff auf die Funktionen.

Wie so oft fehlt auch bei I-Librarian eine vernünftige Dokumentation, die den Einstieg erleichtert. Daher lohnt ein Blick in die Tutorials [8]. Am Anfang empfiehlt es sich, mit einem eher übersichtlichen Projekt zu beginnen. Eine fertiges Beispiel für I-Librarian finden Sie im Netz [9]

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 4 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • PDF-Sammlung mit Notizen

    I, Librarian, eine freie Webanwendung zum Sammeln und Verwalten von PDF-Artikeln, ist in Version 2.5 mit neuen Features erhältlich.
  • Angemerkt
    Digitale Post-Its im PDF helfen beim Teamwork. Aber nur wenige Applikationen kleben den virtuellen Zettel an die richtige Stelle.
Kommentare

Infos zur Publikation

LU 10/2017: Daten retten & sichern

Digitale Ausgabe: Preis € 8,50
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Stellenmarkt

Aktuelle Fragen

Lieber Linux oder Windows- Betriebssystem?
Sina Kaul, 13.10.2017 16:17, 2 Antworten
Hallo, bis jetzt hatte ich immer nur mit
IT-Kurse
Alice Trader, 26.09.2017 11:35, 2 Antworten
Hallo liebe Community, ich brauche Hilfe und bin sehr verzweifelt. Ih bin noch sehr neu in eure...
Backup mit KUP unter Suse 42.3
Horst Schwarz, 24.09.2017 13:16, 3 Antworten
Ich möchte auch wieder unter Suse 42.3 mit Kup meine Backup durchführen. Eine Installationsmöglic...
kein foto, etc. upload möglich, wo liegt mein fehler?
kerstin brums, 17.09.2017 22:08, 5 Antworten
moin, zum erstellen einer einfachen wordpress website kann ich keine fotos uploaden. vom rechne...
Arch Linux Netzwerkkonfigurationen
Franziska Schley, 15.09.2017 18:04, 0 Antworten
Moin liebe Linux community, ich habe momentan Probleme mit der Einstellung des Lan/Wlan in Arc...