Zunächst ein etwas kryptischer Befehl:
iconv -f ISO-8859-15 -t UTF-8 original.txt > neu.txt
Mit diesem lassen sich Dokumente mit einer ISO-8859-15-Kodierung nach UTF-8 konvertieren. Der Parameter -f steht für from, -t steht für to und die Datei original.txt wird zur Datei neu.txt. Umgekehrt funktioniert’s natürlich auch.
Meist erkennt man solche “falsch kodierten” Dokumente an den darin enthaltenen Sonderzeichen: ä,ö,ü oder ß gibt der Texteditor falsch an. Kann man nun die Kodierung im Editor nicht ändern, lassen sich Texte auf der Konsole mit iconv umwandeln.
Um herauszufinden, ob ein Text nun in den Kodierungen UTF-8 oder ISO-8859-15 gespeichert wurde, gibt man zum Beispiel
file original.txt
ein. Will man nun wissen, welche Kodierungen iconv überhaupt unterstützt, lautet der Befehl:
iconv --list | more
Es gibt andere Tools, die einen ähnlichen Job machen, das bekannteste dürfte Recode sein, aber iconv scheint mir eine gute Alternative zu sein.





