Home / LinuxUser / 2006 / 03 / Tote Links finden

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

War doch klar...
(243 Punkte bei 15 Stimmen)
Re: War doch klar...
(179 Punkte bei 5 Stimmen)
Re: Skype für 64-Bit-Prozessor u. Suse 12.1
(161 Punkte bei 4 Stimmen)
Kubuntu verliert Finanzierung
(130 Punkte bei 4 Stimmen)
Offen fürs Geschäft
(80 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Webfehler aufspüren

Tote Links finden

01.03.2006 Jeder komplexere Internet-Auftritt bringt im Verlauf seiner Existenz zunehmend tote Links hervor. Mit Linkchecker spüren Sie Verweise ins Nichts ohne große Umstände auf.

Wer größere Internet-Seiten betreut, kennt das Problem mit den toten Links: Externe Seiten verschwinden im Nirvana, beim Aufrufen der entsprechenden Verweise findet der Browser keine Seite. Das Suchen nach derartigen Fehlern im Gewebe des weltweiten Netzes ist oftmals aufwändig – der Artikel verrät Ihnen, wie Sie mit Linkchecker [1] einfacher auf die Jagd nach "Laufmaschen" im Netz gehen.

Zur Installation von Linkchecker greifen Sie am besten auf eine vorkompilierte Version zurück. Für RPM-basierte Systeme wie Suse oder Fedora finden Sie ein entsprechendes RPM-Paket der aktuellen Version 3.3 sowie ein Quellcode-Archiv unter [2]. Benutzer eines Debian-Derivats sollten einen Blick auf [3] werfen oder Linkchecker über apt-get install linkchecker installieren.

Einfache Lückensuche

Die Benutzung von Linkchecker erfolgt über die Kommandozeile nach dem Muster linkchecker Optionen Testobjekt , wobei es sich bei Testobjekt entweder um eine lokale oder eine über HTTP respektive FTP erreichbare entfernte Datei handelt. Die Eingabe von linkchecker www.linux-user.de ist möglich, da Linkchecker die URL-Präfixe http:// bzw. ftp:// automatisch ergänzt. Nutzen Sie das Internet über einen Proxy, teilen Sie das dem Lückensucher über die Umgebungsvariablen http_proxy, https_proxy, ftp_proxy und gopher_proxy mit. Wie Sie die Benutzervariablen setzen, hängt von der eingesetzten Shell ab: Unter der Bash-Shell erledigt dies ein export http_proxy="http://localhost:8080", Liebhaber der Tc-Shell verwenden den Befehl setenv http_proxy "http://localhost:8080". Ein Proxy, der auf localhost am Port 8080 lauscht, leitet die Link-Überprüfung ins Internet weiter.

Wie Linkchecker funktioniert, offenbart eine nicht ganz standardkonforme, einfache HTML-Datei namens test.html: Der Aufruf linkchecker test.html ist zunächst nicht sonderlich erfolgreich – der Lückensucher meldet, dass er einen Link geprüft und keinen Fehler gefunden habe (Abbildung 1). In der Testdatei verstecken sich aber tatsächlich drei Links, von denen zwei ins Nirgendwo führen.

Abbildung 1: Linkchecker hat Probleme mit dem Dateisystem. Er ignoriert gleich zwei Fehler und testet nur einen Link.

Wird die selbe Datei test.html hingegen von einem Webserver ausgeliefert, spürt Linkchecker die fehlerhaften Links auf (Abbildung 2). Die Dokumentation weist zudem darauf hin, dass die aktuelle Version nicht mit JavaScript kooperiert.

Abbildung 2: Fehler gefunden: Im Zusammenspiel mit einem Webserver findet Linkchecker die Fehler, er prüft – inklusive der Datei "test.html" – vier Links und meldet zwei als defekt.

Das richtige Strickmuster

Neben der einfachen Textausgabe erfolgt die Fehlerdiagnose wahlweise auch über die in Tabelle 1 aufgeführten Ausgabeformate. Je nachdem, ob Sie eine Bildschirmdarstellung wünschen oder eine spezielle Ausgabedatei benötigen, wechseln Sie über --output=html bzw. --file-output=html/Dateiname ins HTML-Format. Geben Sie für die Ausgabedatei keinen Dateinamen an, nennt Linkchecker die Datei linkchecker-out und ergänzt sie um den festgelegten Dateityp, zum Beispiel zu linkchecker-out.html. Abbildung 3 zeigt die Browser-Ansicht einer erzeugten Ausgabedatei: Praktisch sind hier vor allem die Links, anhand derer Sie das Ergebnis der Suche gleich noch einmal überprüfen.

Parallel zur Ausgabe in eine Datei erfolgt eine Standardausgabe im Terminal. Soll Linkchecker gänzlich im Hintergrund werkeln, empfiehlt sich die Verwendung der Option -q: Sie unterdrückt die Ausgabe im Terminal. Einige Ausgabeformate wie gml benötigen zusätzlich die Option --verbose, da andernfalls die erzeugten Graphen Lücken enthalten. Linkchecker bezieht auf diese Weise Informationen über funktionierende Links in den Graphen mit ein.

Abbildung 3: Äußerst praktisch ist die Ausgabe des Ergebnisses in einem HTML-Dokument: Die Links in der HTML-Ausgabe nutzen Sie gleich auch zum Prüfen des Ergebnisses.

Tabelle 1: Ausgabeformate

Schlüsselwort

Bedeutung

text Standard-Textausgabe als flacher Text
html Ausgabe als HTML-Code, der auch gleich Links auf die referenzierten Seiten enthält
csv Ausgabe als komma-separierter Text, mit einer URL pro Zeile.
gml Ausgabe als Graph im GML-Format [6]
dot Ausgabe als Graph im .dot-Format [7]
gxml Ausgabe im GraphXML-Format [4]. Anzeigeprogramme gibt es u.a. hier [5]
xml Maschinenlesbar: Die Ausgabe im XML-Format
sql Ausgabe als INSERT-Anweisung in SQL
blacklist Mit dieser Option loggt Linkchecker ausschließlich Informationen über Fehler und schreibt diese in die Datei ~/.linkchecker/blacklist. Das ist sinnvoll für die Automatisierung mit Hilfe von Cron-Jobs.
none keine Ausgabe, sinnvoll für Skripte
Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare

969 Hits
Wertung: 0 Punkte (0 Stimmen)

Schlecht Gut

Infos zur Publikation

Infos zur Publikation

LinuxUser 03/2012

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,50 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 56,10) können Sie im LNM-Shop bestellen.

Tipp der Woche

Duden Korrektor unter 64-Bit
Duden Korrektor unter 64-Bit
Tim Schürmann, 06.02.2012 10:36, 0 Kommentare

Der Duden Korrektor bietet eine äußerst nützliche Rechtschreib- und Grammatikkorrektur für LibreOffice und bringt in der aktuellen Version 8 e...

Aktuelle Fragen

N24 Stick (Huawei E173) und Ubuntu 11.04
Patrick Obenauer, 11.02.2012 11:54, 0 Antworten
Hallo zusammen! Ich benutze einen alten Laptop, der mit Ubuntu 11.04 flott und problemlos läuft....
Wie kann man beim Einsatz von Compiz die Fenster-Dekoration einstellen?
GoaSkin , 10.02.2012 20:12, 0 Antworten
Hallo, ich nutze Linux Mint mit dem Gnome-Derivat Mate. Da die Distribution Compiz nicht autom...
rndc reload zone - failed bad zone
Ludwig jun. B., 06.02.2012 16:08, 2 Antworten
Schönen guten Tag, ich habe folgendes Problem. Immer wenn ich folgendes Kommando ausführen bek...
Skype für 64-Bit-Prozessor u. Suse 12.1
Klaus Sigerist, 05.02.2012 11:39, 3 Antworten
Hallo Gemeinde! Ich bin nur ein einfacher Nutzer und habe Probleme mit der Installation von Skyp...
8! Anfängerfrage :) Wie finde ich in Ubuntu die Datenträger (Bild, Text)
samuel leusam, 04.02.2012 15:53, 2 Antworten
Ich habe neu Ubuntu. Wenn ich die SD Karte im Laptop einstecke, erkennt er sie und gibt ihr den N...