Stolperstellen

Das erfolgreiche Nutzen des Screenreaders und der daran gekoppelten Braille-Zeile und Sprachausgabe setzt voraus, dass sich die Textdaten in Form von einzelnen Zeichen überhaupt aus dem PDF-Dokument oder vom Bildschirm identifiziert und extrahiert lassen. Besonders ärgerlich ist es, wenn die Extraktion nur teilweise gelingt oder als Ergebnis lediglich ein wirrer Buchstabensalat entsteht.

Enthalten gescannte Dokumente oder Rastergrafiken beispielsweise Buchstaben, Ziffern oder eine Handschrift ausschließlich als Pixelfolge, lässt sich diese nicht automatisch ablesen, erkennen oder erraten und entfällt daher komplett. Auch mit dem Zwischenschritt über eine OCR-Software gelingt eine Erkennung nur bis zu einem gewissen Grad [20]. Weitere mögliche Stolperstellen in PDF-Dokument sind zum Beispiel:

  • Artefakte (Linien, Marken, Bilder, Hervorhebungen),
  • mehrspaltiger Text,
  • Bilder ohne Alternativ-Text,
  • Fußnoten und Lesezeichen,
  • Kopf- und Fußzeilen sowie Seitennummern,
  • Seitenumbrüche im Fließtext und harte Trennstriche,
  • PDF-Erweiterungen (etwa Javascript) sowie
  • PDF-Nutzungseinschränkungen (Drucken).

Die Vorverarbeitung für den Screenreader versucht zunächst, die richtige Reihenfolge für das Vorlesen der Textelemente zu erkennen. Ohne korrekte Markierung der Textblöcke fehlt dem Programm jedoch die Orientierung im Datenstrom. Das fällt besonders bei mehrspaltigem Text auf, sowie bei Tabellen und Abbildungen, die in den Textfluss eingebettet sind. Der Screenreader muss klar alle irrelevanten Elemente erkennen können, die er nicht vorlesen soll: beispielsweise Hintergrundgrafiken, Seitennummern oder Kopf- und Fußzeilen.

Eine weitere Hürde stellen Umlaute, Sonderzeichen und nicht zueinander passende oder noch nicht vollständig unterstützte Zeichencodierungen dar (ASCII, ISO8859-15, Unicode). Das gilt sowohl für die einzelnen Programme, die die beispielsweise Umlaute unterschiedlich darstellen (":u" oder ""u"), als auch für die Ausgabegeräte und die verarbeiteten PDF-Dokumente. Bedenklich sind nicht etwa die Standards an und für sich, sondern vielmehr der Reifegrad des Zusammenspiels der einzelnen Komponenten. Deutlich wird das erst, wenn man die Komponenten zusammen nutzt und sich dabei herausstellt, dass etwa eine Braille-Zeile nichts mit UTF-8-kodiertem Text anfangen kann.

Alle Buchstaben aus dem PDF-Dokument, die nicht erkannt wurden, lassen sich weder an die Braille-Zeile noch an die Sprachausgabe weiterleiten. Diese Zeichen fehlen letztendlich im Datenstrom, die Informationen gehen für den Benutzer somit vollständig verloren.

Darstellung von Bilddaten

Bilddaten lassen sich als solche nicht auf einer Braille-Zeile ausgeben. Üblicherweise fügt man stattdessen eine Beschreibung in den Text ein oder fertigt auf Spezialpapier oder Folie eine spezielle Prägung der Abbildung an, die der blinde Benutzer ertasten kann.

Sofern die Textelemente einer Abbildung als separate Ebene vorliegen, lassen zumindest diese sich aus dem Bild extrahieren. Kommt etwa das Vektorgrafikformat SVG zum Einsatz, wertet man dazu die Textknoten (<text>) aus, im Speziellen den Inhalt des <tspan>-Tags. In Abbildung 5 (eine mit Inkscape erzeugte SVG-Datei) ist das Ergebnis die weiß hinterlegte Buchstabenfolge XSLT/XSL-FO.

Abbildung 5: Screenreader können zwar keine Grafiken vorlesen, aber zumindest die Textknoten aus einer SVG-Datei.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Accessibility für PDF-Dokumente
    Barrierefreie PDF-Dokumente lassen sich nicht auf Knopfdruck erzeugen. Um die Zugänglichkeit für die Benutzer sicherzustellen, gilt es die erstellten PDFs genau zu prüfen und noch verbleibende Hindernisse manuell zu beseitigen.
  • Scheibchenweise
    Der fünfte Teil der Postscript/PDF-Reihe legt den Fokus auf Tipps und Tricks, die den Umgang mit Postscript und PDF im Alltag leichter machen.
  • Vinux: Ubuntu-Derivat für Blinde und Sehbehinderte
    Die Linux-Distribution Vinux für Sehbehinderte setzt in ihrer dritten Release auf Ubuntu 10.04 LTS auf. Als Deb-Paket will die Softwaresammlung bestehende Distributionen auf Knopfdruck barrierefrei machen.
  • Zugang für alle
    Linux bietet Menschen mit Behinderungen eine Vielzahl von Möglichkeiten, barrierefrei mit dem Computer zu arbeiten. Wir geben Ihnen eine Übersicht.
  • Yudit it!
    Wer multilinguale Texte korrekt erfassen und bearbeiten will, stößt mit herkömmlichen Texteditoren schnell an Grenzen. Yudit schafft Abhilfe.
Kommentare

Infos zur Publikation

LU 12/2017: Perfekte Videos

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Stellenmarkt

Aktuelle Fragen

EasyBCD/NeoGrub
Wolfgang Conrad, 17.12.2017 11:40, 0 Antworten
Hallo zusammen, benutze unter Windows 7 den EasyBCD bzw. NEOgrub, um LinuxMint aus einer ISO Dat...
Huawei
Pit Hampelmann, 13.12.2017 11:35, 2 Antworten
Welches Smartphone ist für euch momentan das beste? Sehe ja die Huawei gerade ganz weit vorne. Bi...
Fernstudium Informatik
Joe Cole, 12.12.2017 10:36, 2 Antworten
Hallo! habe früher als ich 13 Jahre angefangen mit HTML und später Java zu programmieren. Weit...
Installation Linux mint auf stick
Reiner Schulz, 10.12.2017 17:34, 3 Antworten
Hallo, ich hab ein ISO-image mit Linux Mint auf einem Stick untergebracht Jetzt kann ich auch...
Canon Maxify 2750 oder ähnlicher Drucker
Hannes Richert, 05.12.2017 20:14, 4 Antworten
Hallo, leider hat Canon mich weiterverwiesen, weil sie Linux nicht supporten.. deshalb hier die...