Ce n’est pas nouveau mais, c’est la première fois qu’on m’attaque de cette manière...

un "bad bot"


Mais, qu’est-ce que c’est?

C’est un spammer qui réagit comme un référenceur (google, yahoo, majestic-12) mais qui ne l’est pas, donc, il visite toutes vos pages, et puis, il fait ce qu’il veut avec le contenu... mais, vu que c’est un spammer il a un mauvais comportement... par exemple, il ne suit pas les "disalow" de votre "robot.txt"

Celui qui m’a attaqué est un spammer qui fait semblant d’être Majestic. Majestic est un tout nouveau référenceur qui a comme but de détruire le monopole de Google, biensûr, ça ne fait pas que des heureux... Ce "bad bot" essaie de détruire la jeune réputation de Majestic.

Comment le reconnaître?

Avec la version: le bad bot s’appelle MJ12bot v1.0.8 alors que le vrai Majestic est déjà rendu à la version v1.2

Comment s’en débarrasser?

Une des multiples possibilités est d’ajouter ceci à votre .htaccess

SetEnvIfNoCase User-Agent "^MJ12bot(.*)1\.0\.8" bad_bot

<LIMIT GET PUT>
Order Allow,Deny
Allow from all
Deny from env=bad_bot
</LIMIT>

(link) plus d’information sur la page de Majestic
(link) le code ci-dessus vient d’ici