Dateien nach HTML konvertieren

*2html

Das wichtigste Format des Web ist HTML, doch viele Daten liegen in anderen Dateiformaten vor, als Office-Dokumente, Tabellen, Acrobat- oder gar ASCII-Dateien. Dieser Artikel behandelt Konvertierungsmethoden.

Interessant ist bei der Konvertierung verschiedenster Dokumenttypen nach HTML nicht nur das "wie" sondern auch das "wie gut": So verfügen die meisten Office-Pakete (unter Linux und Windows) zwar über eine HTML-Export-Option, die Ergebnisse sind aber oft unbefriedigend.

Microsoft Word

Für die Konvertierung von Word-Dokumenten gibt es verschiedene Möglichkeiten. Zum einen bietet Word (2000) unter dem Menüpunkt Datei/Als Webseite speichern eine eigene Konvertierungsfunktion. Die damit erstellten HTML-Dateien lassen sich im Web-Browser gut betrachten, sind aber für die Weiterbearbeitung nicht sonderlich gut geeignet, da diverse Styles definiert und laufend im Fließtext verwendet werden; so werden etwa die einzelnen Elemente einer Auflistung nicht einfach durch

<li>Text</li>

sondern durch eine Zeile der Form

<li class=MsoNormal style='mso-list:l0 level1 lfo1;tab-stops:list 36.0pt'>Text</li>

präsentiert. Um schnell eine Word-Datei ins Netz zu stellen, ist dies eine praktikable Möglichkeit; sie erfordert aber eine Windows- und Word-Installation.

Wer die HTML-Dateien noch weiter bearbeiten möchte oder keinen Zugriff auf MS Word hat, der wird sich für Alternativen interessieren. Eine davon ist das Programm word2x. Die aktuelle Version 0.005 finden Sie im Web unter http://word2x.alcom.co.uk/. Im Test ließ sich ein Word-8-Dokument nicht konvertieren (die Ausgabe war leer). Speziell für das aktuelle Word-8-Format gibt es das Tool wv (früher mswordview genannt); dessen Homepage ist http://www.wvWare.com/. Sind die wv-Tools aktiviert, lässt sich über den Befehl

wvHtml test.doc test.html

eine Datei konvertieren. Die Ergebnisse der Konvertierung sind allerdings noch enttäuschender als beim Abspeichern unter Word: Das oben besprochene, einfache Auflistungselement nimmt hier die folgende Form an:

<li><p><div align="left" style="  padding: 0.00mm 0.00mm 0.00mm 0.00mm; "> <p style="text-indent: 0.00mm; text-align: left; line-height: 4.166667mm; color: Black; background-color: White; ">
Text
</p></div></li>

Dazu kommt noch, dass Überschriften nicht HTML-konform als <h1>, <h2> etc. ausgezeichnet sind. Die wv-Tools bieten neben Word noch LaTeX, PostScript, PDF und weitere Formate für die Ausgabe an, aber auch das von wvLaTeX generierte LaTeX-Format lässt sich mit latex2html (siehe unten) nicht in brauchbares HTML umwandeln.

StarOffice

Wie Word bietet auch das Textmodul von StarOffice einen HTML-Export an. Dieser erzeugt durchaus brauchbares HTML, und so kann über StarOffice natürlich auch eine Word-Datei exportiert werden. Zum Exportieren wählen Sie einfach Datei/Speichern unter und dann das Dateiformat HTML (StarOffice Writer).

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

Kommentare

Infos zur Publikation

LU 04/2017: SPEZIAL-DISTRIBUTIONEN

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Aktuelle Fragen

WLAN lässt sich nicht einrichten
Werner Hahn, 21.03.2017 14:16, 0 Antworten
Dell Latitude E6510, Ubuntu 16.4, Kabelbox von Telecolumbus. Nach Anklicken des Doppelpfeiles (o...
"Mit Gwenview importieren" funktioniert seit openSuse 42.2 nicht mehr
Wimpy *, 20.03.2017 13:34, 2 Antworten
Bisher konnte ich von Digitalkamera oder SD-Karte oder USB-Stick Fotos mit Gwenview importieren....
Ich habe eine awk Aufgabe und bekomme es nicht so Recht hin
Dennis Hamacher, 10.03.2017 18:27, 1 Antworten
Ich hoffe Ihr könnt mir dabei helfen oder mir zeigen wie der Befehl richtig geschrieben wird. Ich...
Unter Linux Open Suse Leap 42.1 einen Windows Boot/ ISO USB Stick erstellen...
Tim Koetsier, 07.03.2017 15:26, 1 Antworten
Hallo, weiß jemand wie ich oben genanntes Vorhaben in die Tat umsetzen kann ? Wäre echt dankba...
Druckertreiber installieren OpenSuse42.1
Tim Koetsier, 07.03.2017 15:22, 1 Antworten
hallo, kann mir BITTE jemand helfen ich verzweifel so langsam. Habe einen Super Toner von Canon...