AA_football.jpg

© https://intern.linuxnewmedia.de/po/photo.php?photo=9726

Bodycheck

Linkchecker und Download-Helfer

23.04.2009
gURLChecker trägt seine Berufung im Namen: Das Tool testet Webseiten und Lesezeichen auf kaputte Links, mutiert bei Bedarf aber auch zu einem flotten Download-Helfer.

In der Originalschreibweise steht in gURLChecker [1] eine große URL in der Mitte, was wohl den Zweck des Tools verdeutlichen soll. Ausgestattet mit einer grafischen Oberfläche wühlt es sich wie ein Regenwurm durch die Tiefen fremder Webseiten und testet dabei die Belastbarkeit der angebotenen Links. Führen die ins leere, notiert gURLChecker diese Ausfälle penibel und informiert den Anwender über seine Funde. Dabei testet das Tool nicht nur entfernte Seiten, sondern verhilft auch den Lesezeichen im Lieblingsbrowser des Anwenders zu einer Frischzellenkur.

Nach einem Tauchgang, der sich unterschiedlich lang hinziehen kann, kehrt der Forschungsalgorithmus mit einer Liste von Dateien zurück, die er im Hauptfenster anzeigt (Abbildung 1). Kleine Symbole offenbaren dabei, wie es um die einzelnen Elemente der Webseite steht, ob die Links an den richtigen Ort führen und die Bilder noch am rechten Fleck sitzen. Links mit fehlerhafter Syntax oder solche, die Zeitüberschreitungen verursachen, meldet gURLChecker und hebt sie durch ein entsprechendes Symbol hervor. Wem die angezeigte Liste zu unübersichtlich erscheint, der sortiert sie über AnsichtStatus nach dem Linkstatus oder lässt sich über AnsichtTyp nur bestimmte Dateitypen herauspicken und anzeigen – etwa Textdateien.

Abbildung 1: Am Ende einer Suche präsentiert gURLChecker eine Liste mit dem Zustand der einzelnen Elementen auf einer durchsuchten Webseite.

gURLChecker betätigt sich aber nicht nur als Detektiv: Wenn es sein muss, legt die Software auch selbst Hand an und lädt die Inhalte einer Webseite herunter. Das kann – je nach Webseite – jedoch schnell die Festplatte zum Überlaufen bringen. Erfreulicherweise spricht das ansonsten miserabel bis gar nicht dokumentierte Tool halbwegs die deutsche Sprache, nur an einigen Ecken fehlen adäquate Übersetzungen.

Installation

Im Test haben wir den Quellcode der Version aus dem Subversion-Repository gefischt und unter Ubuntu 8.10 kompiliert. Damit das klappt, sollten Sie aber eine Reihe wichtiger Pakete installieren. Um die Software aus dem Repository zu holen, benötigen Sie subversion, die Tools zum Übersetzen beinhaltet das Paket build-essential. Dann folgen eine Reihe von Paketen, die vor allem Gnome-Software enthalten und die gURLChecker braucht, um seine Abhängigkeiten aufzulösen: gnome-common, libgnutls-dev, libgtk2.0-dev, libgtk2.0-doc, libgnomeui-dev, libglade2-dev, libxml2-dev, libgnet-dev, libtidy-dev, libcroco3-dev, libclamav-dev und gtk-doc-tools.

Anwender von OpenSuse 11 können gURLChecker sicherlich auch verwenden. Dort heißen die notwendigen Entwicklerpakete meist etwas anders und enden mit -Devel. Die Werkzeuge, um den Quellcode zu übersetzen, installieren Sie über Yast. Dazu wählen Sie im Paketmanager Schemata als Filter und setzen ein Kreuzchen bei Grundlegende Entwicklungsumgebung. Da Sie als OpenSuse-Anwender vermutlich KDE einsetzen, saugt die Distribution im Vergleich zum Gnome-lastigen Ubuntu noch einmal deutlich mehr abhängige Pakete aus dem Internet.

Im nächsten Schritt legen Sie in Ihrem Home-Verzeichnis einen neuen Ordner an und wechseln dorthin. Der Befehl svn checkout svn://labs.libre-entreprise.org/svnroot/gurlchecker/trunk gurlchecker holt die aktuellste Version von gURLChecker direkt aus dem Repository der Entwickler und legt die Dateien in dem Ordner gurlchecker ab. Dorthin wechseln Sie mit cd und geben ./autogen.sh --prefix=/usr ein. Nun prüft die Routine, ob sich alle Werkzeuge, die Sie zum Übersetzen brauchen, auf der Festplatte befinden. Im Erfolgsfall sollte am Ende einer Liste mit gefundenen Abhängigkeiten durchgehend yes stehen, andernfalls installieren Sie fehlende Pakete nach. Das Kommando make übersetzt schließlich den Quellcode und ein sudo make install installiert den Checker, den Sie unter Ubuntu im Menü Anwendungen | Internet finden.

gURLChecker in Aktion

Über Projekt | Neues Projekt starten Sie nun ein Projekt und durchforsten dabei wahlweise eine Website, eine Lokale Datei oder eine Lesezeichendatei. Im letzten Fall wird schnell klar, dass gURLChecker nur Lesezeichen im XBEL-Format [2] akzeptiert, einem offenen Format für Bookmarks, das jedoch nur Konqueror, Midori und Galeon verwenden. Im Test verwandelten wir die Bookmarks von Firefox über die Erweiterung SyncPlaces ins XBEL-Format, aber auch so akzeptierte gURLChecker sie nicht.

Doch es gibt eine einfachere Lösung für das Bookmark-Problem: Sie wählen Lokale Datei als Suchort und übergeben die Lesezeichen einfach als exportierte lokale HTML-Datei (Abbildung 2). Die Option, lokale Dateien zu untersuchen, dient natürlich auch dazu, Dateien auf der Festplatte vor dem Hochladen auf einen Webserver zu überprüfen.

Abbildung 2: Bookmarks nimmt gURLChecker nur im offenen XBEL-Format entgegen, die von Firefox behandeln Sie daher einfach als lokale Datei.

Mit gURLChecker eine Website zu durchwühlen, dürfte die beliebteste Übung der Software sein. Dabei geben Sie der Linküberprüfung zusätzlich einige Parameter mit auf den Weg (Abbildung 3). Die Option Ignore URLs arguments verhindert ungewollte Endlos-Loops, die durch bestimmte URLs entstehen. Ein Häkchen bei Seiteninhalte nicht downloaden setzen Sie nur, falls das Tool diese standardmäßig herunterlädt. Das tut es im Anfangszustand aber nicht. Beim Angeben von Nur dieses Verzeichnis mit seinen Unterverzeichnissen prüfen verzichtet gURLChecker darauf, andere Domains und hierarchiegleiche Ordner auf dem Server zu untersuchen. Über Nur lokale Links prüfen lässt das Tool Links, die auf externe Domains verweisen, links liege. Zudem gibt es die Möglichkeit, Anmeldedaten für eine Seite einzugeben, die Sie als angemeldeter Benutzer durchsuchen wollen. Kreuzen Sie Active security check an, fahndet die Software zudem nach bedenklichen (bad) Dateiendungen wie .false, .bak und .sav, hinter denen es Sicherheitslücken vermutet.

Abbildung 3: Über verschiedene Parameter steuern Sie, wie stark sich das Tool bei der Suche engagiert.

Ausgeprägtes Saugverhalten

Um neben einer Linküberprüfung auch sämtliche Dateien einer Webseite wie Bilder, Filme und Texte herunterzuladen, wechseln Sie über Bearbeiten | Einstellungen in die Konfiguration von gURLChecker. Im Reiter Filter setzen Sie zunächst im Register Bilder ein Häkchen bei Bilder laden, wechseln dann in das Register Dokumente und setzen dort ebenfalls ein Häkchen bei Inhalt von Nicht HTML-Dateien beziehen. Soll die Software bestimmte Dateitypen vom Download verschonen, setzen Sie Häkchen bei der gewünschten Dateiendung.

Fertige Dateien legt die Software zunächst im Verzeichnis ~/.gurlchecker/cache ab. Verlangen Sie beim Schließen eines Projekts, dieses zu Speichern, verschiebt das Tool die Dateien nach ~/.gurlchecker/projects, wählt aber Zahlen als Dateinamen. Dadurch ist es nicht möglich, eine heruntergeladene Seite offline zu durchforsten, weil die Links nicht mehr funktionieren.

Wo Sie schon mal in den Einstellungen sind, können Sie gleich noch an weiteren Schrauben drehen: Im Register Filter im Bereich Protokolle legen Sie den Umgang von gURLChecker mit FTP- und HTTPS-Links um. Über das Register Prüfen im Reiter Allgemein geben Sie zudem die maximale Linktiefe an, die gURLChecker bei seinen Durchsuchungen verwendet. Wechseln Sie zum Register W3C besteht zudem die Möglichkeit, Seiten auf ihre Tauglichkeit mit den W3C-Standards abzuklopfen. Dazu setzen Sie einfach ein Kreuzchen bei Activate W3C validation. Aber Vorsicht: Im Test gab die Software mitunter im Angesicht solcher Verstöße erschreckt den Geist auf.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
Kommentare

Infos zur Publikation

LU 11/2014: VIDEOS BEARBEITEN

Digitale Ausgabe: Preis € 4,95
(inkl. 19% MwSt.)

Mit der Zeitschrift LinuxUser sind Sie als Power-User, Shell-Guru oder Administrator im kleinen Unternehmen monatlich auf dem aktuelle Stand in Sachen Linux und Open Source.

Sie sind sich nicht sicher, ob die Themen Ihnen liegen? Im Probeabo erhalten Sie drei Ausgaben zum reduzierten Preis. Einzelhefte, Abonnements sowie digitale Ausgaben erwerben Sie ganz einfach in unserem Online-Shop.

NEU: DIGITALE AUSGABEN FÜR TABLET & SMARTPHONE

HINWEIS ZU PAYPAL: Die Zahlung ist auch ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!       

Tipp der Woche

Schnell Multi-Boot-Medien mit MultiCD erstellen
Schnell Multi-Boot-Medien mit MultiCD erstellen
Tim Schürmann, 24.06.2014 12:40, 0 Kommentare

Wer mehrere nützliche Live-Systeme auf eine DVD brennen möchte, kommt mit den Startmedienerstellern der Distributionen nicht besonders weit: Diese ...

Aktuelle Fragen

Artikelsuche
Erwin Ruitenberg, 09.10.2014 07:51, 1 Antworten
Ich habe seit einige Jahre ein Dugisub LinuxUser. Dann weiß ich das irgendwann ein bestimmtes Art...
Windows 8 startet nur mit externer Festplatte
Anne La, 10.09.2014 17:25, 4 Antworten
Hallo Leute, also, ich bin auf folgendes Problem gestoßen: Ich habe Ubuntu 14.04 auf meiner...
Videoüberwachung mit Zoneminder
Heinz Becker, 10.08.2014 17:57, 0 Antworten
Hallo, ich habe den ZONEMINDER erfolgreich installiert. Das Bild erscheint jedoch nicht,...
internes Wlan und USB-Wlan-Srick
Gerhard Blobner, 04.08.2014 15:20, 2 Antworten
Hallo Linux-Forum: ich bin ein neuer Linux-User (ca. 25 Jahre Windows) und bin von WIN 8 auf Mint...
Server antwortet mit falschem Namen
oin notna, 21.07.2014 19:13, 1 Antworten
Hallo liebe Community, Ich habe mit Apache einen Server aufgesetzt. Soweit, so gut. Im Heimnet...