Pour l’économie de bande passante j’avais deja bloqué msnbot qui était le plus gourmand, et référençait le moins. Aujourd’hui j’ai du bloqué les plus gros consommateurs d’images en lien direct, que sont chez spaces.msn.com et profile.myspace.com.
Ce sont généralement des utilisateurs qui font des pages de mauvais goût, en accumulant des images trouvées de ci, de là, par google image ou dans des forums, je suppose. comme un talentueux designer (personne n’oserait en douter ;) ) qui a été au top de mes stats.
Pour cela il suffit d’ajouter les règles en fonction du referer, bon, j’ai été un peu sauvage et ai bloqué tous les referer de ces pages, on ne pourra donc plus suivre non plus les liens vers les pages, mais ces sites sont plutôt, à priori des espaces de stockages, qui sont donc par conséquence très mal utilisés, donc voici les deux lignes permettant de détecter les référents en question:
L’idéal serait sans doute un test logique du genre si (Referer= msn.com + URL : *.{jpg|gif|png|avi|mov|ogm}$ )=>bloquage
SetEnvIfNoCase Referer "spaces.msn.com" bad_ref
SetEnvIfNoCase Referer "myspace.com" bad_ref
Et l’interdiction qui est ajoutée :
Deny from env=bad_ref
Mon fichier .htacess donne maintenant cela :
# Évite la surconsommation inutile de bande passante de msnbot
SetEnvIfNoCase User-Agent "^msnbot" bad_bot
# Evite les images en référence direct depuis les sites msn.com et myspace.com
SetEnvIfNoCase Referer "spaces.msn.com" bad_ref
SetEnvIfNoCase Referer "profile.myspace.com" bad_ref
<limit GET POST>
Order Allow,Deny
Allow from all
Deny from env=bad_bot
Deny from env=bad_ref
