Homepages spamsicher gestalten

Privatadresse

Die meisten E-Mail-Adressen finden Versender unerwünschter Werbung auf Homepages im WWW. Wie man seine Adresse so veröffentlicht, dass sie für automatische Sammelprogramme unsichtbar bleibt, erklärt dieser Artikel.

Spam ist eine Plage, der man nicht einfach Herr wird: Spamfilter trennen zwar anhand mehr oder minder geeigneter Heuristiken die Spreu vom Weizen, aber vergleichbar mit der Situation bei Computer-Viren sind die Spammer oft einen Schritt voraus und entwickeln immer neue Methoden, um die Filter zu überlisten.

Ursachenforschung

Nicht zuletzt übereifrige Administratoren helfen selbst, ihre eigenen Abwehrmaßnahmen auszuhebeln, indem sie dem Spammer aussortierte Mails inklusive Begründung, weshalb der Filter sie für Spam hält, zurücksenden. So oder so – Spammer finden immer wieder Wege durch die gängigen Spamfilter. Sie bieten also allenfalls eine Teillösung.

Andere Bemühungen zielen darauf, Spam schon im Ansatz zu stoppen; zum Beispiel die Forderung nach authentifiziertem SMTP als Standard. Damit müsste sich jeder Mail-Versender beispielsweise durch seine IP-Adresse oder ein Passwort beim Server identifizieren – einige Anbieter verwenden dieses Verfahren bereits.

Die Hauptquelle, aus denen Spammer ihr Zieladressen beziehen, bilden laut einer Studie des "Center for Democracy and Technology" (CDT) öffentliche Web-Seiten [1]. Im Rahmen ihrer Forschungsarbeit verbreitete das CDT eigens dafür angelegte E-Mail-Adressen gezielt auf Homepages, in Newsgroups und in verschiedenen Web-Diensten. 97,3% der 8842 daraufhin erhaltenen, als unerwünschte E-Mail-Werbung eingestuften Nachrichten richteten sich an die auf Web-Seiten veröffentlichten Mail-Adressen (Abbildung 1).

Abbildung 1: Der Großteil der Spammer findet Zieladressen im WWW.

Demnach lohnt es sich, beim Gestalten von Web-Seiten darauf zu achten, dass die darauf enthaltenen Mail-Adressen für Spammer nicht verwertbar sind. Laut der genannten Studie ist eine Verschleierung auch im Nachhinein sinnvoll, da die Zahl der Spam-Mails nach dem Entfernen der Adresse abnahm (Abbildung 2).

Abbildung 2: Auch Nachträgliches Entfernen der E-Mail-Adresse von einer Homepage hilft.

Automatische Adressensammler

Das Vorgehen der meisten Spammer ist denkbar primitiv: Auf einer beliebigen Web-Seite angefangen, speichern sie alle Links der Form mailto:, also die Verweise auf Mailadressen. Andere Links verfolgen sie weiter und verfahren mit den dort gefundenen Seiten ebenso.

Auf diese Art finden Spammer irgendwann jede Seite, auf die nur ein Link zeigt; mit demselben Verfahren wie erwünschte Suchmaschinen durchforsten sie das gesamte Web. Ein Programm zu schreiben, das dies automatisch erledigt – so genannte "Spider" (Spinne) oder "Harvester" (Erntemaschine) – ist nicht schwierig. Die gespeicherten Mailadressen befreit der Spammer anschließend von Mehrfacheinträgen und fertig ist eine Sammlung potentieller Spamopfer.

Diese Funktionalität lässt sich in einfacher Ausführung schon mit den Linux-Werkzeugen wget, sed, tr, sort und uniq nachbilden und erreicht auch in dieser Form erstaunliche Ergebnisse.

Dabei ist wget für das Durchwandern der Webseiten zuständig, sed durchsucht die gelesenen Seiten nach E-Mail-Adressen. tr verpasst den Ergebnissen eine einheitliche Groß- und Kleinschreibung, sort sortiert die gefundenen Mailadressen alphabetisch und uniq eliminiert alle doppelten Vorkommen.

Ein Testlauf mit der Homepage des Autors als Ausgangspunkt lieferte innerhalb von nur acht Minuten bereits über neunzig unterschiedliche E-Mail-Adressen. Wählt man eine Startseite mit mehr Links und ignoriert entgegen der Konvention die Datei robots.txt [3], erreicht man weitaus mehr Ergebnisse in derselben Zeit. Zudem ließe sich die Suche nach Mail-Adressen auf dort genannte, aber nicht verlinkte Bereiche ausdehnen.

Als Abwehr gegen Adressensammler überhaupt keine E-Mail-Adressen mehr anzugeben, ist für viele Homepage-Betreiber keine akzeptable Lösung; schließlich soll eine Web-Seite durchaus die Möglichkeit zur Kommunikation bieten. In Deutschland verpflichtet außerdem §6 des Teledienstegesetzes (TDG) [4] gewerbliche Anbieter zur Angabe einer "Adresse der elektronischen Post"; auch wenn Juristen darüber streiten, ob dies eine E-Mail-Adresse sein muss, oder ob beispielsweise Fax-Nummern oder Instant-Messenger-Kontakte ebenso gelten.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Für Räuber unsichtbar
    Spammer durchforsten das Netz laufend nach E-Mail-Adressen. Sind sie fündig geworden, wird das Lesen der elektronischen Post zur Qual. Tarnverfahren verbergen die Adressen vor den Suchrobotern – nicht jedoch vor den Seitenbesuchern.
  • Plasma-Entwickler suchen bestes JavaScript-Miniprogramm
    Wer immer schon einmal mit dem Gedanken gespielt hat, ein KDE-Miniprogramm zu programmieren, kann jetzt ein Nokia N900 gewinnen. Die Javascript Jam Session läuft noch bis Ende Monat.
  • Linux-Magazin testet Spamfilter
  • Lästiges Insekt
    Online-Werbedienste, Marktforscher und Spammer haben das Internet längst als lohnende Einnahmequelle für sich entdeckt. Freie Software schiebt dem Datenklau einen wirkungsvollen Riegel vor.
  • Sicherheitsfallen im Internet
    "Linux ist sicher": Mit diesem Satz halten sich viele Anwender des freien Betriebssystems Sorgen um die Sicherheit vom Hals. Doch wer im Internet die Vorsicht vergisst, tappt leicht in gefährliche Fallen – auch unter Linux.
Kommentare

Infos zur Publikation

LU 04/2017: SPEZIAL-DISTRIBUTIONEN

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Aktuelle Fragen

WLAN lässt sich nicht einrichten
Werner Hahn, 21.03.2017 14:16, 0 Antworten
Dell Latitude E6510, Ubuntu 16.4, Kabelbox von Telecolumbus. Nach Anklicken des Doppelpfeiles (o...
"Mit Gwenview importieren" funktioniert seit openSuse 42.2 nicht mehr
Wimpy *, 20.03.2017 13:34, 2 Antworten
Bisher konnte ich von Digitalkamera oder SD-Karte oder USB-Stick Fotos mit Gwenview importieren....
Ich habe eine awk Aufgabe und bekomme es nicht so Recht hin
Dennis Hamacher, 10.03.2017 18:27, 1 Antworten
Ich hoffe Ihr könnt mir dabei helfen oder mir zeigen wie der Befehl richtig geschrieben wird. Ich...
Unter Linux Open Suse Leap 42.1 einen Windows Boot/ ISO USB Stick erstellen...
Tim Koetsier, 07.03.2017 15:26, 1 Antworten
Hallo, weiß jemand wie ich oben genanntes Vorhaben in die Tat umsetzen kann ? Wäre echt dankba...
Druckertreiber installieren OpenSuse42.1
Tim Koetsier, 07.03.2017 15:22, 1 Antworten
hallo, kann mir BITTE jemand helfen ich verzweifel so langsam. Habe einen Super Toner von Canon...