Protection contre le referer spam

mardi 31 mai 2005

Depuis quelques semaines, le referer spam a fait son apparition sur notre serveur web. Nous avons compté 1074 attaques pour la journée du lundi 30 mai.

Le referer spam, que l’on pourrait traduire par spam par site référent, est une nouvelle technique qu’utilisent des gens peu scrupuleux pour faire visiter leur site et de là vendre leurs produits ou services [1]. Le principe est le suivant :

  • grâce à des ordinateurs piratés dont ils ont pris le contrôle par virus interposé, ces personnes visitent certaines pages de votre site web en faisant croire qu’ils suivent un lien à partir de leur site web à eux ;
  • les outils statistiques de votre site web (dans SPiP ou dans les rapports analog et webalizer) vous indiquent cela en faisant pointer un lien dans la page de statistiques vers le site web en question ;
  • ces liens se révèlent surtout utiles pour le pirate lorsque les statistiques de visite sont rendues publiques sur votre site, augmentant grâce à cela non seulement le nombre de visite vers leur site web, mais aussi le classement de leur site dans des moteurs de recherche, par exemple Google [2].

Comme les statistiques de SPiP et les rapports analog et webalizer de vos sites ne sont pas rendu publics, l’avantage pour les attaquants est faible. Il n’en reste pas moins que vos statistiques deviennent petit à petit illisibles et encombrées de fausses visites.

Pour pallier à cela, nous avons mis en place un tri des requêtes [3] vers vos sites web en essayant au mieux d’éliminer les spam de ce type. Ils ne seront normalement plus repris dans vos statistiques.

Cependant, nos filtres peuvent avoir des trous ou être trop stricts, donc si vous voyez des referers qui ne vous semblent pas corrects ou que certains de vos visiteurs vous disent que l’accès leur est refusé sur votre site [4], n’hésitez pas à nous le signaler !

Notes

[1Sur notre serveur ce sont Les Bulgares qui ont fait leur apparition.

[2Google utilise le nombre de liens pointant vers une page pour calculer le score de cette page lors d’une recherche, au plus il y a de liens, au mieux la page est classée.

[3Le filtre que nous utilisons est dérivé d’une technique présentée par Spam Huntress, Ann Elisabeth, la chasseuse de spam ! Merci à elle de partager les infos.

[4Dans ce cas, ils trouveront la page Accès refusé, erreur 403 de notre site.