Besucher im Blick
Auswertung von Webserver-Logdateien
Lire
Als eierlegende Wollmilchsau analysiert Lire (Abbildung 8) analysiert fast alle Logdateien, die sich auf Computern finden. Dank seines modularen Aufbaus gehören nicht nur FTP- oder CUPS-Logdateien zu seiner Leibspeise, Lire lässt sich so auch um eigene Module erweitern. Diese Flexibilität hat leider ihren Preis: Das Programm hängt von viele anderen Paketen ab und ist etwas schwieriger zu bedienen. So wertet dieser etwas längere Aufruf die Logdatei access.log aus:
lr_run lr_log2report -o html_page common < access.log > r.tar
Der Schalter -o legt das Ausgabeformat html_page fest, danach spezifiziert common das Format des Logfiles, das die Software über den Eingabeoperator < eingetrichtert bekommt. Das schreibt Lire im Tar-Format, das die Kommandozeile in die r.tar umleitet. Das entpacken Sie wiederum mit tar xf r.tar.
Wie man hier schon sieht, kommt man bei Lire um eine Lektüre der ausführlichen Dokumentation nicht herum. Wer diese Konfigurations-Hürde einmal genommen hat, wird allerdings mit einer extrem umfassenden und ebenso ausführlichen Auswertung belohnt. So erstellt Lire als einziges Programm eine Statistik, die Rückschlüsse auf Angriffe zulässt, sowie Informationen über Zugriffe von (Suchmaschinen-)Robotern. Lire gibt seine Ergebnisse in vielen Formaten aus, neben HTML-Dateien mit Grafiken zum Beispiel auch als Text oder PDF.
Fazit
Der Artikel zeigte nur eine kleine Auswahl der frei erhältlichen Weblog-Analyzer, von denen jedes seine Stärken und Schwächen hat: Analog, Lire und Webalizer sind sicherlich Allrounder und bieten die meisten Informationen an. Allen Analyzern fehlen aber noch einige Funktionen, die für die Profiklasse notwendig wären. Allen voran sind hier Informationen über Sicherheitsaspekte zu nennen. Lire ausgenommen, erzeugen die Systeme lediglich eine Aufstellung der häufigsten Fehlermeldungen. Zugriffscharakteristika von Würmern oder andere Formen von destruktiven Zugriffsversuchen werden nicht geführt.
Übersicht
| Name | AC.log | Analog | aWebVisit | Lire | Relax | Sherlog | Webalizer |
|---|---|---|---|---|---|---|---|
| Eingabeformate | Common Log File Format, Combined Log File Format | Common Log File Format, Frei definierbar | Common Log File Format | Common Log File Format, Combined Log File Format, W3C extended log Format | RefererLog, NCSA, Variationen von Combined Logs, WebSTAR, Eigene Definitionen | Combined Log Format, Common Log File Format | Combined Log Format, Common Log File Format |
| gzip-te Dateien | nein | nein | nein | ja | ja | nein | ja |
| Umsetzung IP-Adressen in Namen | nein | ja | nein | nein | ja | ja, mit zusätzlichem Modul | ja, sofern einkompiliert |
| Beliebteste Einstiegs- / Ausstiegsseiten | ja | nein | ja | ja | nein | nein | ja |
| Liste der beliebtesten Seiten | ja | ja | nein | ja | nein | ja | ja |
| Besucherpfade | nein | nein | ja | ja | nein | ja (rudimentär) | nein |
| Anzahl Aufrufe nach Stunden, Tagen, Monaten | ja | ja | nein | ja | nein | nein | ja |
| Berücksichtigung von Suchmaschinen | ja (eingeschränkt) | ja | nein | ja | ja | ja | nein |
| Statistik über die Länder | ja | ja | nein | ja | nein | nein | ja |
| Browsertypen | ja | ja | nein | ja | nein | ja | ja |
| Domains/Adressen lassen sich von der Analyse ausschließen | nein | ja | ja (nur durch Editieren des Skripts) | ja | ja | ja | ja |
| Ausgabeformate | ASCII; Tabellenform, teilweise mit ASCII-Balkendiagrammen | Text, LaTeX, HTML, für Grafiken Zusatzprogramm benötigt (ReportMagic) | HTML, für Grafiken Zusatzprogramm benötigt (fly) | Text, PDF, HTML, DocBook XML | Text, HTML; nur Tabellen | ASCII-Datei; nur Tabellenform | HTML mit Grafiken |
| Sprachen der generierten Auswertungen | Englisch | Englisch, Deutsch und viele andere | Englisch | Englisch | Englisch, Französisch, Finnisch | Englisch und Französisch | Englisch |
| Sicherheitsfunktionen | nur Übersicht der häufigsten Fehlermeldungen | nur Übersicht der häufigsten Fehlermeldungen | Auswertung der Fehlermeldungen | ja | nein | nur Übersicht der häufigsten Fehlermeldungen | nur Übersicht der häufigsten Fehlermeldungen |
| Erläuterungen in der Auswertung | nein | ja | nein | ja | nein | nein | nein |
| Bezugsquelle | http://www.ctreber.de/commercial/aclog | http://www.gekko.de/analog | http://mikespub.net/tools/aWebVisit/ | http://www.logreport.org/ | http://ktmatu.com/software/relax/ | http://sherlog.europeanservers.net/index.html | http://www.webalizer.org/ |
Glossar
Server
Ein Programm, das dauerhaft im Hintergrund läuft. In der Regel wartet es auf Anfragen von anderen Programmen (den Clients), um Informationen zurück zu liefern.
Webserver
Ein Server, der für der Internetseiten bereitstellt. Möchte ein Browser eine Internetseite abrufen, sendet er eine Anfrage an den Webserver. Dieser schaut nach, ob die Seite auf seiner Festplatte liegt und schickt sie dann an den Browser.
IP-Adresse
Die Adresse eines Computers im Internet besteht aus vier durch Punkte getrennte Zahlen zwischen 1 und 255.
DNS
Das Domain Name System besorgt die Übersetzung von Internet-Namen in IP-Adressen. DNS-Server führen dafür Datenbanken und beantworten Anfragen, die Browser ohne Zutun des Users im Hintergrund ausführen. Tippt er beispielsweise www.google.com ein, läuft eine solche Anfrage, die als Ergebnis die Adresse 216.239.41.99 zurückgibt. Zu der nimmt der Browser schließlich dann Kontakt auf.



