Le spam dans les commentaires

De nombreux CMS, blogs ou forums sont régulièrement spammés par des annonces publicitaires totalement inapropriées. Pour combattre ce genre de spam la méthode la plus employée est le captcha basé sur une sorte de "test de Turing".

Grâce à une image contenant des lettres (captcha) difficiles à décrypter par un logiciel de reconnaissance optique de caractères (OCR), on évite le remplissage automatique des formulaires d'envoi de commentaires par des robots.

Hélas ces logiciels OCR sont de plus en plus performants et même les captchas les plus sophistiqués sont vulnérables.

A cela s'ajoute le problème des pages mises en cache dans google par exemple, ce serait trop complexe d'expliquer les détails, en gros une page en cache sur google devient une sorte de page satellite contenant un "formulaire gelé" qui peut être réactivé à l'identique avec les mêmes informations (cookies, sessions ?) et donc être automatiquement exploité par des robots pour poster de multiples commentaires sans code captcha à décrypter.

Je me suis penché sur le problème du spam dans les "commentaires" du logz.
1) J'ai bricolé un captcha plus sophistiqué : couleurs, police de caractère type manuscrite, fond/premier plan brouillé.
2) On compte le nombre de posts, si il y a plus de 10 posts à la suite, le programme impose une pause d'une demi heure.
3) Le texte alternatif contient le code brouillé.
4) Si le spammeur désactive les cookies et les sessions il est automatiquement renvoyé vers une page d'erreur.
5) Si vous avez désactivé l'affichage du lien vers les commentaires et que les visiteurs y accèdent quant même via des pages mises en cache ils seront automatiquement renvoyés vers une page d'erreur.

Sans être infaillible, je constate que pour l'instant je n'ai plus de posts indésirables.