Home / LinuxUser / 2003 / 07 / Unerwünschte Mail automatisch filtern

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

Mandriva gibt Distribution in die Hände der Community
(268 Punkte bei 24 Stimmen)
Neues vom Systemd
(161 Punkte bei 4 Stimmen)
Mandriva in Nöten
(161 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Gelbe Tonne für Mail-Abfall

Unerwünschte Mail automatisch filtern

Der wahre Absender

Bessere Trefferquoten und weniger Falschmeldungen versprechen Methoden, die den wahren Absender einer E-Mail herauszufinden versuchen. Zwar fälscht der Spammer die meisten oder alle Header der Werbe-Mail, doch durchläuft sie auf dem Weg von ihm in Ihre eigene Mailbox mehrere bekannte Mail-Server. Jeder davon fügt mindestens einen weiteren Header hinzu, über den der Spammer keine Kontrolle mehr hat. Sie hingegen wissen, welche zusätzlichen Header normalerweise ergänzt werden. Mit dieser Information lässt sich herausfinden, von welcher IP-Adresse eine beliebige Mail kommt.

Bei der Absender-IP einer Spam-Mail handelt es sich entweder um einen Computer des Spammers selbst oder um einen von ihm missbrauchten Rechner, typischerweise um ein unsicheres (und gehacktes) Windows-System oder einen unzureichend abgesicherten Mail-Server.

Mehrere Organisationen rund um die Welt widmen sich der Aufgabe, derart problematische IP-Adressen zu dokumentieren. Diese "Black Lists" (schwarzen Listen) publizieren sie in einer leicht und automatisch abfragbaren Form. Manche Black Lists enthalten ausschließlich unsichere Mailserver. Andere führen nur IP-Adressen an, die unmittelbar Spammern gehören. Manche listen IP-Adressen, von denen angeblich jetzt gerade im Augenblick Spam versandt wird – nicht verifiziert, nicht zuverlässig, aber aktuell. Durch Kombination verschiedener Black Lists stimmt man seine Spam-Abwehr individuell ab.

Eine detaillierte Beschreibung der Installation würde diesen Übersichtsartikel sprengen. Ein Beispiel für eine Konfigurationsdatei finden Sie z. B. unter [5]. Mit etwas weniger Bastelei geht es, wenn Sie das beliebte Anti-Spam-Tool SpamAssassin [6,7] installieren. Achtung: Beide Ansätze funktionieren nur, wenn Sie Ihre Mail auf die klassische Weise holen (Abbildung 2). Soll Ihr Mail-Programm die E-Mail direkt vom Provider abrufen, muss es die Black Lists selbstständig abfragen – und das kann momentan noch keiner der verbreiteten MUAs.

Statistische Spam-Filter

Eine sehr interessante Entwicklung auf dem Anti-Spam-Markt sind die so genannten Bayes'schen Filter. Dabei handelt es sich um einfache Statistiken.

Sie beginnen die Arbeit an solch einem Filter, indem Sie ein paar Mails explizit und manuell als "Spam" oder "Nicht-Spam" bezeichnen. Das Filterprogramm berechnet für jedes enthaltene Wort dieser Mails eine Wahrscheinlichkeit, mit der es zu einer Spam-Mail gehört. Beispielsweise besitzt ein Allerweltswort wie "habe" wohl keine besonders hohe Aussagekraft hinsichtlich der Frage "Spam oder nicht?" Ein Wort wie "kaufen" könnte da schon interessanter sein.

Kommt nun eine neue Mail an, wird für jedes enthaltene Wort geprüft, ob es eher für oder gegen Spam spricht. Die Ergebnisse rechnet das Filterprogramm zusammen und teilt Ihnen seine Vermutung mit. Hat es Recht – gut! Irrt es sich einmal, teilen Sie ihm das mit. Der Filter bezieht die Wörter aus der neu klassifizierten Mail direkt in seinen Wortvorrat mit ein und berücksichtigt sie für zukünftige Nachrichten. Je länger Sie den Filter verwenden, desto besser wird er.

Aktuelle Mozilla-Versionen enthalten im Mail-Client einen eingebauten Bayes'schen Filter. Aktivieren Sie ihn in einem "Mail & Newsgroups"-Fenster unter Tools / Junk Mail Controls bzw. Tools / Junk Mail - Filterung... (Abbildung 3). Nun wartet zunächst eine Aufgabe auf Sie: Jede angekommene Spam-Mail muss mit dem Mülleimer-Button in der Werkzeugleiste (oder dem Menüpunkt Tools / Mark Selected Messages as Junk bzw. Tools / Gewählte Nachrichten als Junk markieren) als solche ausgezeichnet werden. Sie erhält dann ein Papierkorb-Symbol.

Abbildung 3: Statistische Filter in Mozilla

Doch schon bald beginnt der Filter, das gleiche zu tun: Neu ankommende Mails erhalten in vielen Fällen ein Mülleimer-Symbol bzw. werden in den angegebenen Ordner wegsortiert (Abbildung 4). Wichtig ist nur, dass Sie Mozilla etwaige Fehler mitteilen, indem Sie zum Beispiel fälschlich als Spam gekennzeichnete Nachrichten über Gewählte Nachrichten als Junk-frei markieren oder den Mülleimer-Button von ihrem Makel reinwaschen. Nur so kann das System lernen.

Abbildung 4: Nach einer Lernphase klassifiziert Mozilla Mails automatisch

Statistische Filter funktionieren erstaunlich gut. Für mehrsprachige Anwender halten sie jedoch einen großen Stolperstrick bereit: Sie neigen dazu, Sprachen zu unterscheiden. Der typische Deutsche wird sehr viele deutschsprachige Privat-Mails erhalten, hingegen nur wenig englische. Umgekehrt achten nur wenige Spammer auf die Muttersprache ihrer Opfer – die meiste E-Mail-Werbung ist daher in Englisch geschrieben. Es besteht die Gefahr, dass ein statistischer Spam-Filter englische Mails als Spam einordnet, deutsche als Nicht-Spam.

Statistische Filter sollten aus diesem Grund niemals die Erlaubnis erhalten, Mails zu löschen. Für sie wie für alle anderen gilt: Sehen Sie die als Spam markierten Mails grundsätzlich noch einmal durch, bevor Sie sie ins Nirwana schicken. Erst wenn Sie nach mehreren Wochen oder Monaten mit der Arbeit des Filters zufrieden sind und keine echten Mails verloren haben, lassen Sie den Spam sofort löschen. Dann haben Sie einen wichtigen Etappensieg im Kampf gegen das elektronische Ungeziefer gewonnen.

Glossar

heuristisch

(von griechisch heurískein = finden, entdecken) Verfahren zur Problemlösung auf Grund von Erfahrungswerten, Faustregeln oder Algorithmen.

Header

Der Kopf einer Mail besteht aus Zeilen mit für den Transport und die Verwaltung wichtigen Informationen. Anschließend folgt der Mail-Body mit dem eigentlichen Inhalt der Nachricht. Viele grafische MUAs verbergen die meisten Mail-Header (mit Ausnahme des Subject, des Absenders ("From-Header") und des Sende-Datums ("Date-Header") vor den Augen des Benutzers.

Infos

[1] Andrea Müller, Patricia Jung: "Einfach nur ein Mail-Programm", LinuxUser 03/2003, S. 24 ff.

[2] Andrea Müller: "Mail und mehr", LinuxUser 03/2003, S. 34 ff.

[3] Mozilla: http://www.mozilla.org/

[4] Opera: http://www.opera.com/

[5] Black Lists mit procmail nutzen: http://www.ordb.org/faq/#usage_procmail

[6] SpamAssassin: http://www.spamassassin.org/

[7] Heike Jurzik: "Nie wieder Spam", LinuxUser 07/2002, S. 55 ff.

[8] Eine frühe Beschreibung statistischer Spam-Filter: http://www.paulgraham.com/spam.html

Der Autor

Marc André Selig arbeitet als wissenschaftlicher Angestellter an der Universität Trier und als Arzt im Praktikum am Kreiskrankenhaus Schramberg. Die von ihm betreuten E-Mail-Server werden mit Spam nur so bombardiert, so dass ihn das Thema häufiger beschäftigt.

Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare

Hits
Wertung: 0 Punkte (1 Stimme)

Schlecht Gut

Infos zur Publikation

Infos zur Publikation

LinuxUser 06/2012

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,50 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 56,10) können Sie im LNM-Shop bestellen.

Tipp der Woche

Adobe AIR
Adobe-AIR-Programme installieren und (manuell) starten
Tim Schürmann, 14.05.2012 13:09, 0 Kommentare

Es gibt sie noch: neue Anwendungen, die Adobes Integrated Runtime voraussetzen. Aktuellstes und vermutlich auch größtes Beispiel ist das Adventure Botanicula

Aktuelle Fragen

gibt es ein Kommandozeilen Tool, um ein X11-Fenster in ein Anderes einzubetten?
GoaSkin , 21.05.2012 16:44, 0 Antworten
Das XEmbed-Protokoll ist u.A. dazu gedacht, dass man eine X11-Anwendung in eine andere wie ein Wi...
Apache2, Options -Indexes geht nicht
no no, 12.05.2012 19:01, 8 Antworten
Habe in apache2.conf folgendes stehen: Options -Indexes ...
LInux auf Dell LS H500
Andreas Endresl, 09.05.2012 08:54, 2 Antworten
Habe einen alten Dell Latitude LS H500 nur mit ext. Floppy und CD es geht nur immer eines von den...
Datenwiederherstellung unter Ubuntu 12.04 mit "Simple Backup" nach Umzug von Linux Mint
Christian Lottmann, 07.05.2012 13:33, 0 Antworten
Vor dem Umzug auf Ubuntu 12.04 habe ich unter Linux MInt mit "Simple Backup" voll (15.4.2012) und...
DKMS für den propritären NVIDIA-Treiber
Commander Data, 26.04.2012 22:02, 2 Antworten
Hallo an die Gemeinde. Ich habe hier ein interessantes Stück openSuSE gefunden. http://forums.op...