Botnetze und Spam Crawler per htaccess aussperren

Bot Netzwerke und Spam-Crawler

Jeder der Webseiten administriert und seine Besuche analysiert (z.B. Google Analytics, Piwik oder andere Hilfsmittel), wird mit Sicherheit schon Besuch von diversen Crawler von Spam- und Bot- Seiten gehabt haben.
Da diese Seiten oder Netzwerke mit Sicherheit nichts Gutes im Schilde führen und die Besuche dieser Seiten auch die Statistiken der jeweiligen Seite verfälschen, möchte ich mit diesem Tutorial zeigen, wie man diese Netzwerke wieder vor die Tür setzen kann.
Mein besonderer Freund bezüglich Spam-Crawler ist die Domain semalt.com. Diese Seite bietet SEO – Optimierung aus der Ukraine an. Für diesen Dienst ist auch zwingend eine Kreditkarte nötig (wer dabei Böses denkt).
Anhand dieser Domain werde ich in diesem Tutorial zeigen, wie Sie Mithilfe der .htaccess Datei im root-Verzeichnis Ihrer Webseite, diese Domains wieder vor die Tür setzen.

Voraussetzung für den Einsatz einer .htaccess – Datei

Am einfachsten die Spam-Crawler vor die Türe zusetzen, ist die Verwendung einer .htaccess Datei die im Hauptverzeichnis Ihrer Webseite gespeichert wird. Damit Sie diese Datei auf Ihren Webserver einsetzen können, ist es wichtig dass der Apache-Server das Modul mod_rewrite unterstützt, da sonst von Ihrer Webseite nur noch eine weiße Seite im Browser zurückbleibt (bitte Unterstützung des Moduls bei Ihrem Provider erfragen).

Spam-Crawler per .htaccess – Datei vor die Türe setzen

Um die Domain semalt.com von ihrer Webseite auszuschließen geben Sie folgende Anweisung in Ihre .htaccess – Datei ein:

RewriteEngine on RewriteCond %{HTTP_REFERER} semalt\.com [NC] RewriteRule .* — [F]

Diese Anweisung können Sie zum Beispiel auch auf andere Domain ausweiten. Eine kleine ‚Liste‘ von Spam-Seiten und die dazugehörigen Anweisungen um diese Seiten auszuschließen finden Sie hier:

UPDATE

Aus gegebenen Anlass habe ich die Liste der Seiten aktualisiert.

RewriteEngine on
RewriteCond %{HTTP_REFERER} ^https://.*youtubedownload\.org/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*simple-share-buttons\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*softomix\.ru/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*zazagames\.org/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*youtubedownload\.org/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*vapmedia\.org/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*soundfrost\.org/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*joingames\.org/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*videofrost\.net/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*softomix\.net/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*feedouble\.net/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*backgroundpictures\.net/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*joinandplay\.me/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*videofrost\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*srecorder\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*softomix\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*openmediasoft\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*openfrost\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*myprintscreen\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*musicprojectfoundation\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*feedouble\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*fbfreegifts\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*extener\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*embedle\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*savetubevideo\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*kambasoft\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} buttons\-for\-website\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*7makemoneyonline.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*semalt\.com/ [NC]
RewriteCond %{HTTP_REFERER} ^https://.*free-share-button\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*buy-cheap-online\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*best-seo-offer\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*Get-Free-Traffic-Now\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*buttons-for-your-website\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^https://.*torture\.ml/ [NC]
RewriteRule ^(.*)$ – [F,L]

Fazit

Wie oben gezeigt, lassen sich diese Crawler leicht per .htaccess ausschliessen. Doch leider vermehren sich diese Bot-Schleudern und Spam-Crawler schneller, als einem lieb ist. Daher sollten Sie bei der Analyse ihrer Website-Daten die Augen offen halten und die .htaccess-Datei gegebenfalls anpassen.

Jede Unterstützung ist Willkommen…

Patreon Spendenbild_250_114_transparent

 

Gerne würde ich euch noch mehr kostenfreie und vor allem werbefreie Inhalte hier sowie auf anderen Kanälen bereitstellen, doch ist der Aufwand für die Erstellung dieser Inhalte schon sehr zeitintensiv und vor allem langsam auch sehr kostenintensiv geworden (Kosten für Hosting, Equipment, Software und Arbeitszeit) und daher wird euch hier auf diesem Blog momentan noch Werbung angezeigt.

Daher möchte ich euch darum bitten, mich vielleicht durch eine kleine Spende zu Unterstützen.

Vielen Dank und lieben Gruß

Marcel

Hi mein Name ist Marcel und ich bin der Herausgeber von diesem Blog ‚SecureBits‘. Ich selbst bin schon ewig mit der IT verbunden und interessiere mich hauptsächlich für die Themen IT-Sicherheit, Programmierung und Gesellschaft und betreibe diesen Blog aus Leidenschaft. Gerne setze ich mich mit meinen Beiträgen für eine sichere IT-Landschaft ein, um so das Recht auf Privatsphäre auch mit kleinen Mitteln zu schützen. Freue mich immer über Kommentare von euch und wenn es mir möglich ist, helfe ich gerne und kostenlos (im privaten Bereich, ansonsten bitte mir eine Anfrage schicken) weiter. Meine Idee ist es, Interessierten der Informationstechnik, einfache Schritt- für Schritt-Anleitungen hier im Blog sowie auf meine noch jungen YouTube-Kanal zur Verfügung zu stellen, damit ihr diese Anleitungen für eure Projekte nutzen könnt. Viel Spaß beim Lesen. Gruß Marcel