Home / LinuxUser / 2004 / 05 / Auswertung von Webserver-Logdateien

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

Mandriva gibt Distribution in die Hände der Community
(268 Punkte bei 24 Stimmen)
Neues vom Systemd
(161 Punkte bei 4 Stimmen)
Mandriva in Nöten
(161 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Besucher im Blick

Auswertung von Webserver-Logdateien

Lire

Als eierlegende Wollmilchsau analysiert Lire (Abbildung 8) analysiert fast alle Logdateien, die sich auf Computern finden. Dank seines modularen Aufbaus gehören nicht nur FTP- oder CUPS-Logdateien zu seiner Leibspeise, Lire lässt sich so auch um eigene Module erweitern. Diese Flexibilität hat leider ihren Preis: Das Programm hängt von viele anderen Paketen ab und ist etwas schwieriger zu bedienen. So wertet dieser etwas längere Aufruf die Logdatei access.log aus:

lr_run lr_log2report -o html_page common < access.log > r.tar

Der Schalter -o legt das Ausgabeformat html_page fest, danach spezifiziert common das Format des Logfiles, das die Software über den Eingabeoperator < eingetrichtert bekommt. Das schreibt Lire im Tar-Format, das die Kommandozeile in die r.tar umleitet. Das entpacken Sie wiederum mit tar xf r.tar.

Wie man hier schon sieht, kommt man bei Lire um eine Lektüre der ausführlichen Dokumentation nicht herum. Wer diese Konfigurations-Hürde einmal genommen hat, wird allerdings mit einer extrem umfassenden und ebenso ausführlichen Auswertung belohnt. So erstellt Lire als einziges Programm eine Statistik, die Rückschlüsse auf Angriffe zulässt, sowie Informationen über Zugriffe von (Suchmaschinen-)Robotern. Lire gibt seine Ergebnisse in vielen Formaten aus, neben HTML-Dateien mit Grafiken zum Beispiel auch als Text oder PDF.

Abbildung 8: Lire bietet die umfangreichsten Statistiken, setzt IP-Adressen aber nicht in Namen um.

Fazit

Der Artikel zeigte nur eine kleine Auswahl der frei erhältlichen Weblog-Analyzer, von denen jedes seine Stärken und Schwächen hat: Analog, Lire und Webalizer sind sicherlich Allrounder und bieten die meisten Informationen an. Allen Analyzern fehlen aber noch einige Funktionen, die für die Profiklasse notwendig wären. Allen voran sind hier Informationen über Sicherheitsaspekte zu nennen. Lire ausgenommen, erzeugen die Systeme lediglich eine Aufstellung der häufigsten Fehlermeldungen. Zugriffscharakteristika von Würmern oder andere Formen von destruktiven Zugriffsversuchen werden nicht geführt.

Übersicht

Name

AC.log

Analog

aWebVisit

Lire

Relax

Sherlog

Webalizer

Eingabeformate Common Log File Format, Combined Log File Format Common Log File Format, Frei definierbar Common Log File Format Common Log File Format, Combined Log File Format, W3C extended log Format RefererLog, NCSA, Variationen von Combined Logs, WebSTAR, Eigene Definitionen Combined Log Format, Common Log File Format Combined Log Format, Common Log File Format
gzip-te Dateien nein nein nein ja ja nein ja
Umsetzung IP-Adressen in Namen nein ja nein nein ja ja, mit zusätzlichem Modul ja, sofern einkompiliert
Beliebteste Einstiegs- / Ausstiegsseiten ja nein ja ja nein nein ja
Liste der beliebtesten Seiten ja ja nein ja nein ja ja
Besucherpfade nein nein ja ja nein ja (rudimentär) nein
Anzahl Aufrufe nach Stunden, Tagen, Monaten ja ja nein ja nein nein ja
Berücksichtigung von Suchmaschinen ja (eingeschränkt) ja nein ja ja ja nein
Statistik über die Länder ja ja nein ja nein nein ja
Browsertypen ja ja nein ja nein ja ja
Domains/Adressen lassen sich von der Analyse ausschließen nein ja ja (nur durch Editieren des Skripts) ja ja ja ja
Ausgabeformate ASCII; Tabellenform, teilweise mit ASCII-Balkendiagrammen Text, LaTeX, HTML, für Grafiken Zusatzprogramm benötigt (ReportMagic) HTML, für Grafiken Zusatzprogramm benötigt (fly) Text, PDF, HTML, DocBook XML Text, HTML; nur Tabellen ASCII-Datei; nur Tabellenform HTML mit Grafiken
Sprachen der generierten Auswertungen Englisch Englisch, Deutsch und viele andere Englisch Englisch Englisch, Französisch, Finnisch Englisch und Französisch Englisch
Sicherheitsfunktionen nur Übersicht der  häufigsten Fehlermeldungen nur Übersicht der häufigsten Fehlermeldungen Auswertung der Fehlermeldungen ja nein nur Übersicht der häufigsten Fehlermeldungen nur Übersicht der häufigsten Fehlermeldungen
Erläuterungen in der Auswertung nein ja nein ja nein nein nein
Bezugsquelle http://www.ctreber.de/commercial/aclog http://www.gekko.de/analog http://mikespub.net/tools/aWebVisit/ http://www.logreport.org/ http://ktmatu.com/software/relax/ http://sherlog.europeanservers.net/index.html http://www.webalizer.org/

Glossar

Server

Ein Programm, das dauerhaft im Hintergrund läuft. In der Regel wartet es auf Anfragen von anderen Programmen (den Clients), um Informationen zurück zu liefern.

Webserver

Ein Server, der für der Internetseiten bereitstellt. Möchte ein Browser eine Internetseite abrufen, sendet er eine Anfrage an den Webserver. Dieser schaut nach, ob die Seite auf seiner Festplatte liegt und schickt sie dann an den Browser.

IP-Adresse

Die Adresse eines Computers im Internet besteht aus vier durch Punkte getrennte Zahlen zwischen 1 und 255.

DNS

Das Domain Name System besorgt die Übersetzung von Internet-Namen in IP-Adressen. DNS-Server führen dafür Datenbanken und beantworten Anfragen, die Browser ohne Zutun des Users im Hintergrund ausführen. Tippt er beispielsweise www.google.com ein, läuft eine solche Anfrage, die als Ergebnis die Adresse 216.239.41.99 zurückgibt. Zu der nimmt der Browser schließlich dann Kontakt auf.

Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare

Hits
Wertung: 0 Punkte (24 Stimmen)

Schlecht Gut

Infos zum Autor

Tim Schürmann

Tim Schürmann

Tim Schürmann ist Diplom-Informatiker und derzeit als freier Autor unterwegs. Mehr Informationen finden Sie auf seiner Homepage unter http://www.tim-schuermann.de.


Infos zur Publikation

Infos zur Publikation

LinuxUser 06/2012

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,50 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 56,10) können Sie im LNM-Shop bestellen.

Tipp der Woche

Adobe AIR
Adobe-AIR-Programme installieren und (manuell) starten
Tim Schürmann, 14.05.2012 13:09, 0 Kommentare

Es gibt sie noch: neue Anwendungen, die Adobes Integrated Runtime voraussetzen. Aktuellstes und vermutlich auch größtes Beispiel ist das Adventure Botanicula

Aktuelle Fragen

gibt es ein Kommandozeilen Tool, um ein X11-Fenster in ein Anderes einzubetten?
GoaSkin , 21.05.2012 16:44, 0 Antworten
Das XEmbed-Protokoll ist u.A. dazu gedacht, dass man eine X11-Anwendung in eine andere wie ein Wi...
Apache2, Options -Indexes geht nicht
no no, 12.05.2012 19:01, 8 Antworten
Habe in apache2.conf folgendes stehen: Options -Indexes ...
LInux auf Dell LS H500
Andreas Endresl, 09.05.2012 08:54, 2 Antworten
Habe einen alten Dell Latitude LS H500 nur mit ext. Floppy und CD es geht nur immer eines von den...
Datenwiederherstellung unter Ubuntu 12.04 mit "Simple Backup" nach Umzug von Linux Mint
Christian Lottmann, 07.05.2012 13:33, 0 Antworten
Vor dem Umzug auf Ubuntu 12.04 habe ich unter Linux MInt mit "Simple Backup" voll (15.4.2012) und...
DKMS für den propritären NVIDIA-Treiber
Commander Data, 26.04.2012 22:02, 2 Antworten
Hallo an die Gemeinde. Ich habe hier ein interessantes Stück openSuSE gefunden. http://forums.op...