Mit Apache der „Bing Bildersuche“ Paroli bieten

Apache portraits webserver suchmaschine robots.txt piwik osbn open source microsoft linux firefox bing bildersuche apache .htaccess Microsofts Suchmaschine Bing hat natürlich auch eine Bildersuche. Das Problem dabei ist nur, dass ich als Blogger dadurch fast keine zusätzlichen Besucher erhalte, während Bing meine Bandbreite absaugt und mit meinen Inhalten Besucher auf der Bing-Seite hält.

Die Analyse mit dem Open-Source-Tool Piwik zeigt, dass die Bing Bildersuche fast gar keine (zählbaren) Besucher auf die Seite spült, obwohl die Logfiles klar zeigen, dass regelmäßig Bilder durch die Bing Bildersuche aufgerufen werden (wir reden hier von Logeinträgen im -hochgerechnet- fünfstelligen Bereich pro Jahr).

Wird ein Bild in der Bing Bildersuche gefunden, wird es zunächst in der Vorschau angezeigt:

boesevoegel1 webserver suchmaschine robots.txt piwik osbn open source microsoft linux firefox bing bildersuche apache .htaccess

Bei einem weiteren Klick wird das Bild in vergrößerter Form angezeigt (vorausgesetzt, man hat Skripte nicht z.B. mit NoScript für Firefox blockiert, denn dann funktioniert diese Bing-Suche nur bis zum „Vorschaubild“).

boesevoegel2 741x375 webserver suchmaschine robots.txt piwik osbn open source microsoft linux firefox bing bildersuche apache .htaccess

Unten rechts sieht man, dass theoretisch die Möglichkeit bestünde, das Bild auf dem Blog im Kontext aufzurufen (was einen Besucher mehr bedeuten würde). Fakt ist aber, dass im Jahr 2013 gerade mal 25 Besucher durch die Bing Bildersuche auf das Blog gekommen sind.

Klickt der Nutzer nun das Bild in der größeren Vorschau nochmals an, wird alleine das Bild in voller Größe ohne Kontextbezug angezeigt:

Bildschirmfoto 10.01.2014 060742 741x518 webserver suchmaschine robots.txt piwik osbn open source microsoft linux firefox bing bildersuche apache .htaccess

Die Chance für das Blog, sich im Gesamtbild einem neuen Besucher präsentieren zu können, sind damit annähernd null.

Cui bono?

Nun, wenn mir die Bing Bildersuche keinen neuen Besucher bringt und lediglich meine Bandbreite zu ihrem (bereits milliardenschweren) Nutzen wegsaugt, was habe ich dann davon?

Ein riesiger Konzern stellt hier also meine Inhalte nach eigenem Belieben dar, kümmert sich einen feuchten Kehricht um den Seitenanbieter, lässt mich auch noch mit meiner Bandbreite dafür „bezahlen“ und macht sogar noch ein Geschäft durch das Schürfen von Daten und durch Werbung damit:

bing cookie confirmation 741x60 webserver suchmaschine robots.txt piwik osbn open source microsoft linux firefox bing bildersuche apache .htaccess

Ya basta!

Doch jetzt wird mit Hilfe des Open-Source-Webservers Apache zurückgetrickst:

Möglichkeit 1 wäre es, dass Apache mit Hilfe der robots.txt dem Bingbot das Indexieren von Bildern verbietet (geht natürlich auch mit anderen Webservern):

User-agent: bingbot
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$

Doch es kann Wochen dauern, bis der Effekt greift und dazu muss man sich auch noch darauf verlassen, dass sich der Bingbot an die Regeln hält.

Möglichkeit 2 nutzt einen Eintrag in der Datei .htaccess und leitet alle von Bing referierten Bild-Anfragen auf eine beliebige Bilddatei oder gar Seite um:

# BING IMAGE SUCHE
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{HTTP_REFERER} ^http://(www\.)?bing\. [NC]
RewriteRule \.(gif|jpg|swf|flv|png|jpeg)$ http://netz10.de [R=301,L]
</IfModule>

In diesem Beispiel leite ich jede von Bing referenzierte Bildanfrage auf die Hauptseite von netz10.de um. (die kleineren Versionen hat Bing offenbar lokal gespeichert – von „Vorschaubildern“ kann hier übrigens keine Rede sein; hier greift die Umleitung nicht).

Funktioniert natürlich nur, wenn das Bild nicht im Cache ist. Und der Nutzer auch schön brav seinen Referer preisgibt.

[UPDATE: Sehen wir uns die Methode mal in der Praxis an – also ran an die Logfiles: Hier sind zwei Einträge:]

84.***.**.*** - - [10/Jan/2014:19:21:12 +0100] "GET /wp-content/uploads/2011/03/PIC_0002.jpg HTTP/1.1" 301 186 "http://www.bing.com/images/search?q=www.grauharig.com&pc=conduit&ptag=AECAB198A4E8B4587B4F&form=CONMHP&conlogo=CT3210127" "Mozilla/5.0 (Windows NT 5.1; rv:26.0) Gecko/20100101 Firefox/26.0"


84.***.**.*** - - [10/Jan/2014:19:21:12 +0100] "GET / HTTP/1.1" 200 8433 "http://www.bing.com/images/search?q=www.grauharig.com&pc=conduit&ptag=AECAB198A4E8B4587B4F&form=CONMHP&conlogo=CT3210127" "Mozilla/5.0 (Windows NT 5.1; rv:26.0) Gecko/20100101 Firefox/26.0"

Der Bing-Nutzer generiert 2 Einträge in der access.log. Der erste zeigt den Versuch, die beabsichtigte Datei aufzurufen. Am HTML-Code 301 erkennt man, dass diese Anfrage umgeleitet wird. In der zweiten Zeile zeigt „GET /“, dass schlicht die Hauptseite aufgerufen wird; und zwar erfolgreich (HTML-Code 200).

Vielleicht kehrt ja so der eine oder andere Besucher wieder, der das Blog interessant findet. Wenn nicht, dann bleibt beim Nutzer der Bing Bildersuche wenigstens der Eindruck hängen, dass die Bing Bildersuche ein großer Mist ist.

Denn schließlich hat er auf ein Bild geklickt und wird er auf eine für ihn zusammenhanglose Seite weitergeleitet.

Wer das mal (mit dem Taubenbild) testen will, gibt mal (Stand: Januar 2014) in der Bing Bildersuche „Tod in Nuernberg“ ein und klickt sich mal durch…

Siehe auch: http://www.tagseoblog.de/neue-bing-bildersuche-klaut-ungefragt-bilder

Comments

  1. Cooler Tipp,

    elegant wäre auch die Möglichkeit, den Nutzer auf eine Seite zu leiten auf der das Bild tatsächlich eingebunden ist. Wahrscheinlich mit etwas größerem Aufwand verbunden, aber sicher irgendwie machbar.

    Gruß,
    Valentin

Comments are closed