Besucher im Blick
Auswertung von Webserver-Logdateien
Webalizer
Die verbreitete, freie Weblog-Software Webalizer (Abbildung 6) liegt sogar einigen Distributionen bei. Webalizer bietet die bereits vorgestellten Grundfunktionen der anderen Programme, wie Archivdateien (hier als incremental processing bezeichnet) und die Auflösung von IP-Adressen in Hostnamen. Die Ausgabe beschränkt sich auf solide Basiskost: meist die obligatorischen Top-10-Listen, wie zum Beispiel die Liste der beliebtesten Seiten. Wünschenswert wäre eine etwas bessere Verfolgung der Benutzerpfade, aber die meisten Ausgaben beziehen sich nur auf Hits. Dafür wertet Webalizer die Top-Level-Domains nach Ländern aus.
Sie stellen Webalizer ein, indem Sie es mit Parametern starten oder die Konfigurationsdatei /etc/webalizer.conf editieren. Der Aufruf lautet allgemein:
webalizer -o verzeichnis access.log.01
Die Option -o verzeichnis gibt an, wo Webalizer die Ergebnisse der analysierten Logdatei access.log.01 ablegt. Es ist ratsam, vor dem ersten Aufruf die Konfigurationsdatei Schritt für Schritt durchzugehen. Die beiliegende README-Datei erklärt jeden Punkt – allerdings nur auf Englisch. DNS-Namensauflösung aktivieren Sie beim Kompilieren des Programms. Dazu rufen Sie das Skript configure mit der Kommandozeilenoption --enable-dns vor dem obligatorischen make auf, zum Beispiel:
configure --enable-dns ; make ; make install
Leider ist diese Funktion nachträglich nicht mehr zugänglich. Haben Sie die Namensauflösung eingeschaltet speichert das Programm die aufgelösten DNS-Namen in einer Datei, dem so genannten DNS-Cache. Das verringert die notwendigen DNS-Anfragen: Stößt Webalizer während der Auswertung der Logfiles auf eine IP-Adresse, schaut es zunächst im Cache nach. Nur wenn dort kein entsprechender Eintrag vorhanden ist, geht Webalizer im Internet auf die Suche. Sonst verwendet er einfach den gespeicherten Eintrag. Um die DNS-Auflösung zu nutzen, müssen Sie daher bei seinem Aufruf die Cache-Datei angeben:
webalizer -N 10 -D dns_cache.db -o verzeichnis access.log.01
Die Cache-Datei heißt hier dns_cache.db, der zuständige Parameter -D. Die Option -N 10 aktiviert die DNS-Anfragen, die Webalizer durchführt, wenn es in der Datei dns_cache.db nicht fündig wurde. In diesem Fall startet der Analyzer zehn Prozesse, die das gleichzeitig und damit insgesamt schneller erledigen.
Analog
Analog spielt in derselben Liga wie Webalizer und liefert ähnliche Informationen wie sein Konkurrent, geht aber teilweise etwas weiter. So gibt Analog Statistiken über die zugreifenden Organisationen (Firmen, Institutionen, etc.) oder das verwendete Betriebssystem aus und zeigt die Suchwörter an, die von Suchmaschinen zur eigenen Site geführt haben.
Nützlich ist das zum Beispiel, wenn der Internetauftritt Betriebssystem-abhängige Web-Inhalte anbietet, wie Flash, JavaScript oder ActiveX. Auf Grundlage der ausgegebenen Statistik können Sie dann sicherstellen, dass Ihre Site keine Besucher ausschließt.
Von Haus aus zeichnet das Programm schon Balken- und Tortendiagramme (Abbildung 7), erzeugt aber mit der Software Reportmagic [2] noch ansprechendere Ergebnisse. Standardmäßig verlangt Analog das CLF-Format. Gesteuert wird Analog über die Konfigurationsdatei analog.cfg, die sich im selben Verzeichnis wie Analog befindet. In ihr ist unter LOGFILE der Dateiname des Logfiles und unter OUTFILE der Name der Ausgabedatei anzugeben. Für mehr als ein Logfile schreiben sie einfach mehrerer solche Einträge in die Konfigurationsdatei. Ein Aufruf von ./analog startet die Auswertung.



