Gelbe Tonne für Mail-Abfall
Unerwünschte Mail automatisch filtern
Wonach filtern?
Spam-Filter unterscheiden sich nicht nur nach ihrem Einsatzort, sondern auch nach ihrer Vorgehensweise. Woher weiß der Computer überhaupt, ob eine bestimmte Mail Werbung ist oder nicht? Für diese Unterscheidung existieren derzeit drei wichtige, grundverschiedene Algorithmen.
Reine Textfilter löschen Mails, die bestimmte Textelemente enthalten. Sie sind leicht verständlich, einfach und schnell, aber sehr anfällig gegen Täuschungsmanöver – und sie neigen dazu, unschuldige Mails mit herauszufiltern.
Filter, die den wahren Absender einer Mail heraussuchen, sind relativ aufwändig und langsam, dazu schwierig zu implementieren, dafür aber äußerst leistungsfähig. Sie eignen sich ideal für den Einsatz auf Servern oder in einem klassischen Mail Delivery Agent.
Statistische Filter benötigen relativ hohen Rechenaufwand und interaktive Kontrolle, weshalb sie vom Frontend Unterstützung benötigen. Dafür passen sie sich automatisch an den individuellen Geschmack an. Aktuelle Mozilla-Versionen [3] enthalten solche statistischen Spam-Filter.
Textfilter
Erste und einfachste Methode zur Spam-Erkennung sind einfache Textfilter. Wenn eine Mail ein bestimmtes Textmuster enthält, verwirft der Filter sie. Dabei kann er sowohl die Header der Mail prüfen als auch den eigentlichen Text.
Textfilter lassen sich sehr einfach implementieren, und zwar an jeder Stelle eines Mail-Systems (siehe Abbildung 2). Allerdings weisen sie eine Reihe in ihrer Herangehensweise begründete Probleme auf: Beispielsweise neigen unbedarfte Anwender dazu, einfach den Absender einer Spam-Mail auf eine schwarze Liste zu setzen. Doch Vorsicht! Die Absender, ja die meisten Header-Zeilen von Spam, sind in der Regel gefälscht. Der Spammer wäre ja dumm, wenn er seine wahre Identität preisgäbe und es den unwilligen Opfern so leicht machte.
Auch das Filtern nach Textelementen im Textkörper der Mail ist eine Operation voller Fallstricke. Wenn Sie Mails mit Dollarzeichen löschen, treffen Sie damit zwar viel Spam. Aber auch Freunde können Ihnen keine Mail mit einem Dollarzeichen mehr schicken, keine Programmtexte, keine Nachrichten …
Ein paar Textfilter sind harmlos und erschlagen trotzdem recht viel Spam. Kaum ein Europäer liest beispielsweise Mails in asiatischen Zeichensätzen. Beispiele für solche Regeln zeigt der Kasten 1. Sie können sie direkt in den Filtermechanismus Ihres bevorzugten E-Mail-Programms eingeben.
Das neue Mail-Programm M2 aus Opera 7.11 [4] enthält übrigens eine ganze Reihe fein abgestimmter Filterregeln, die viele Spam-Mails automatisch erkennen.
Kasten 1: Sichere Anzeichen für eine Werbemail
- Der Header Content-type: enthält die in der westlichen Welt unüblichen Zeichensatzdefinitionen big5, euc-kr, gb2312 oder iso-2022.
- In der From:- oder der To:-Zeile fehlt der Klammeraffe @.
- Das Subject: enthält mehrere Leerzeichen oder Tabstopps in Folge bzw. mehrere Tilden (nicht unbedingt in Folge).
- Subject: enthält Kodierungen von Zeichen nicht-westlicher Alphabete (=?big5, =?euc-kr, =?gb2312 oder =?iso-2022).
- Die Subject:-Zeile enthält den String ADV, der sich auf kalifornische Anti-Spam-Gesetze bezieht.
- Subject: enthält mehrere Zeichen oberhalb des ASCII-Codes 127 in Folge.
- Die Mail enthält einen der beiden folgenden Header:
X-Library: Indy X-Spam-Status: Yes
- Die Nachricht enthält eine der folgenden X-Mailer:-Header-Zeilen:
X-Mailer: Bulk Email X-Mailer: Easy Mass Mailer X-Mailer: E-Master X-Mailer: jpfree group mail X-Mailer: mailer signature X-Mailer: MailWorkZ X-Mailer: SuperMail X-Mailer: V[0-9],[0-9],[0-9],[0-9] X-Mailer: Vallen e-Mailer X-Mailer: VUvacation X-Mailer: X-Mailer



