Home / LinuxUser / 2005 / 11 / FTP-Downloads und Website-Spiegelung mit Wget

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

War doch klar...
(243 Punkte bei 15 Stimmen)
Re: War doch klar...
(179 Punkte bei 5 Stimmen)
Re: Skype für 64-Bit-Prozessor u. Suse 12.1
(161 Punkte bei 4 Stimmen)
Kubuntu verliert Finanzierung
(130 Punkte bei 4 Stimmen)
Offen fürs Geschäft
(80 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Spiegelbildlich

FTP-Downloads und Website-Spiegelung mit Wget

01.11.2005 Wget ist ein FTP-Tool, das nicht nur einzelne Dateien, sondern auf Wunsch gleich komplette Websites herunterlädt. Auch eine unzuverlässige Internet-Verbindung stört das Tool nicht: Beschränken Sie einfach Bandbreite oder Download-Menge und setzen Sie abgebrochene Übertragungen fort.

Es gibt zahlreiche grafische Download-Manager, mit denen Sie nicht nur einzelne Dateien herunterladen, sondern komplette Websites spiegeln. Auf der Kommandozeile erledigt Wget diesen Job – schnell und ohne viele Mausklicks. Wget "spricht" HTTP, HTTPS und FTP, knüpft an abgebrochene Übertragungen wieder an und bringt sogar eine Update-Funktion mit, die nur veraltete Dateien aktualisiert.

Rundumschlag

Die allgemeine Syntax des Kommandos lautet:

wget URL

Wget verrät Ihnen dabei direkt auf der Konsole, was es erledigt (Abbildung 1): Im Beispiel baut das Programm eine Verbindung zum Webserver auf (Standard-Port 80) und lädt die Datei index.html ins lokale Verzeichnis herunter; eingebettete Bilder ignoriert es dabei, und es verfolgt auch keine Links. Wer die mitunter recht langen Ausgaben im Terminal nicht sehen mag, gibt als weiteren Parameter -q ("quiet", deutsch: "ruhig") an. Da Wget jetzt aber auch eventuelle Fehlermeldungen und grundlegende Informationen unterdrückt, gehen Sie am besten mit wget -nv einen Kompromiss ein: Das Programm schreibt nicht ganz so viel ins Terminal, schweigt sich aber auch nicht vollkommen aus.

Abbildung 1: Wget bei der Arbeit: Der einfache Aufruf erfasst keine eingebetteten Bilder und verfolgt keine Links.

Um Wget mitzuteilen, dass es "lokalen" Links auf dem Server folgen und die Daten rekursiv spiegeln soll, geben Sie als zusätzlichen Parameter -r an. Es ist sinnvoll, in diesem Zusammenhang auch direkt den die Rekursionstiefe mit anzugeben: Um neben index.html alle dort eingebetteten Links (wie z. B. Bilder oder weitere HTML-Seiten) zu erwischen, gehen Sie einen Level tiefer:

wget -r -l 1 www.linux-user.de

Geben Sie als Level-Tiefe -l 2 an, folgt Wget den eingebetteten Verknüpfungen noch eine Stufe weiter: Befindet sich in index.html ein Link auf bilder.html, geht der Download-Manager nun auch Verknüpfungen in dieser Seite nach.

Auf der eigenen Festplatte sehen Sie anschließend für jede URL einen eigenen Ordner. Dieses Verhalten deaktivieren Sie auf Wunsch durch Anhängen einer Option: Geben Sie zusätzlich -nH ("no host") an, landet alles im aktuellen Verzeichnis.

Wget passt auf Wunsch die Links in den einzelnen HTML-Dateien an. Geben Sie als zusätzliche Option -k an, kümmert sich Wget um Verweise auf Bilder, Stylesheets, andere HTML-Seiten vom gleichen Server usw. (Listing 1). Verknüpfungen zu Dateien, die Wget ebenfalls heruntergeladen hat, werden über einen relativen Pfad referenziert; Dateien, die nicht mit auf die Platte gewandert sind, behalten ihre vollständigen URLs.

Listing 1

Wget-Beispielaufruf

$ wget -r -l 2 www.url.de
Geholt: 46,676 Bytes in 7 Dateien
Umwandlung von »www.url.de/index.html«… 11-0
Umwandlung von »www.url.de/about_me.html«… kein Download notwendig.
Umwandlung von »www.url.de/publications/index.php«… 3-8
Umwandlung von »www.url.de/picture_archive/index.php«… 3-49
Umwandlung von »www.url.de/linux.html«… kein Download notwendig.
5 Dateien in 0.00 Sekunden konvertiert.

Keine Panik!

Auch wenn ein Download großer Datenmengen einmal abgebrochen ist, ist das kein Grund zur Panik, und Sie müssen nicht wieder von vorne starten. Wget bringt für diese Zwecke die Option -c ("continue", deutsch: fortsetzen) mit, welche an vorherige Downloads anknüpft. Dabei spielt es keine Rolle, ob Sie die Daten mit Wget oder einem grafischen Download-Manager heruntergeladen haben – das Tool vergleicht die Fragmente mit dem Original und setzt die Arbeit fort. Wget gibt sich auch hier informativ und meldet beispielsweise:

Download der Datei schon vollständig; kein Download notwendig.

Sichern Sie immer wieder dieselben Daten, bietet sich der Einsatz der Option -N an: Dann vergleicht Wget für jede Datei die Größe und das Datum mit der lokalen Kopie:

$ wget -N ftp://ftp.debian.de/debian-cd/3.1_r0a/i386/iso-cd/debian-31r0a-i386-binary-1.iso
…
Größen stimmen nicht überein (lokal 7935840) – erneuter Download.

Hat sich nichts geändert, informiert der Download Manager z. B.:

Datei auf dem Server nicht neuer als die lokale Datei »index.html« – kein Download.

Vergessen Sie die Option einmal, ist das allerdings kein Grund zur Sorge: Normalerweise überschreibt Wget keine Dateien, sondern legt zur Sicherheit durchnummerierte Backups (index.html.1, index.html.2 usw.) an.

Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare

1468 Hits
Wertung: 80 Punkte (4 Stimmen)

Schlecht Gut

Infos zur Publikation

Infos zur Publikation

LinuxUser 03/2012

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,50 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 56,10) können Sie im LNM-Shop bestellen.

Tipp der Woche

Duden Korrektor unter 64-Bit
Duden Korrektor unter 64-Bit
Tim Schürmann, 06.02.2012 10:36, 0 Kommentare

Der Duden Korrektor bietet eine äußerst nützliche Rechtschreib- und Grammatikkorrektur für LibreOffice und bringt in der aktuellen Version 8 e...

Aktuelle Fragen

N24 Stick (Huawei E173) und Ubuntu 11.04
Patrick Obenauer, 11.02.2012 11:54, 1 Antworten
Hallo zusammen! Ich benutze einen alten Laptop, der mit Ubuntu 11.04 flott und problemlos läuft....
Wie kann man beim Einsatz von Compiz die Fenster-Dekoration einstellen?
GoaSkin , 10.02.2012 20:12, 0 Antworten
Hallo, ich nutze Linux Mint mit dem Gnome-Derivat Mate. Da die Distribution Compiz nicht autom...
rndc reload zone - failed bad zone
Ludwig jun. B., 06.02.2012 16:08, 2 Antworten
Schönen guten Tag, ich habe folgendes Problem. Immer wenn ich folgendes Kommando ausführen bek...
Skype für 64-Bit-Prozessor u. Suse 12.1
Klaus Sigerist, 05.02.2012 11:39, 3 Antworten
Hallo Gemeinde! Ich bin nur ein einfacher Nutzer und habe Probleme mit der Installation von Skyp...
8! Anfängerfrage :) Wie finde ich in Ubuntu die Datenträger (Bild, Text)
samuel leusam, 04.02.2012 15:53, 2 Antworten
Ich habe neu Ubuntu. Wenn ich die SD Karte im Laptop einstecke, erkennt er sie und gibt ihr den N...