« Les moteurs de recherches les plus utilisés
Filtrer le SPAM (épisode 2) »


Filtrer le SPAM (épisode 1)

Les courriers électroniques non sollicités qui cherchent à nous vendre du Viagra ou qui nous proposent de faire fortune au casino sont de plus en plus nombreux.

Nous avons toujours conseillé d’aborder le problème du SPAM avec philosophie, en nous appuyant sur le constat que nos boites aux lettres électroniques avaient finalement le même sort que nos boîtes aux lettres « réelles » alimentées un peu par le facteur et beaucoup par les distributeurs de prospectus (du journal gratuit au marabout qui donne les prochains résultats du PMU).

Après les boites aux lettres, les marabous s’attaquent à nos boites mails

Mais depuis quelques mois forcés sommes nous de constater que les SPAM ont pris des proportions qui ne rendent plus la comparaison postale efficace au moment de tenter de relativiser les nuisances des courriers électroniques non sollicités.

Pour persévérer dans l’analogie, la situation était devenue telle qu’on se retrouve chaque matin dans la situation de l’individu moyen qui découvrirait le soir en rentrant à son domicile, que sa boîte aux lettres est pleine de prospectus, à tel point que tous les distributeurs (facteur compris) ont déposé au surplus 2 sacs postaux complémentaires, en lui laissant le soin de trouver les 4 courriers importants dans les 672 plis ainsi abandonnés.

Il nous fallait donc revoir la façon d’aborder cette problématique, et mettre en place une stratégie optimum pour ce problème de SPAM, tandis que nous avions prototypé régulièrement des solutions qui s’étaient avérées non satisfaisantes à cause de dommages collatéraux fort gênants pour les utilisateurs : des courriers ponctuellement considérés comme des SPAM alors que ce n’en était pas.

Alors que nous avons arbitré notre stratégie de filtrage de SPAM et que nous sommes en train de la généraliser à tous nos serveurs après une période de test sur nos propres adresses emails, il nous paraissait important de vous expliquer le cheminement de la phase de « constat » à la phase de mise en place d’une solution.

Afin de poser une stratégie, il fallait donc en tout premier lieu voir qui envoyait du SPAM et comment, ce qui permettrait de faire le tri dans les systèmes de filtrage.

Il y a trois grandes familles de SPAM :

1- La publicité opportune, qui correspond à la publicité adressée qu’on reçoit dans nos boîtes aux lettres traditionnelles. La Redoute nous envoie les lettres parce qu’on est clients pour faire une annonce qui ne nous intéresse souvent pas, mais parfois si. Ce type de SPAM (qui n’en est presque pas un, in fine) dispose quasi toujours d’un lien de désabonnement valide et fonctionnel. Il représente grosso modo 10 à 20% du trafic polluant, suivant le profil de l’utilisateur et sa propension à s’inscrire spontanément à des newsletters et/ou participer à des concours.
2- Le SPAM sporadique, souvent en français, mais pas toujours, qui résulte d’une récupération de notre adresse email on ne sait où (lire « récupérer de manière licite ou non »), et qui fait que le spammeur en question va nous écrire une seule fois, ou une fois de temps en temps. Le lien de désabonnement est parfois efficace mais pas toujours. La publicité est envoyée avec une adresse de réponse souvent valide, ou du moins le nom du vendeur dans l’intitulé d’expédition. Là encore, cette famille représente 10 à 20% du trafic polluant comme pour la précédente.
3- Le SPAM de flibustiers, celui qui va nous proposer du Viagra ou de jouer au casino, plusieurs fois par jour, chaque jour de la semaine, en usant de tout les stratagèmes pour déjouer les éventuels filtres de SPAM qui se baseraient sur la sémantique du message. C’est le plus agaçant, le plus polluant, et il représente la majorité du trafic polluant : environ 70% des SPAM sur les « compte emails témoins » que nous avons analysés

Ce constat étant posé, quels peuvent être les moyens pour diminuer l’effet parasites de ces courriers indésirables

1- La « publicité opportune » peut être considérablement réduite en s’efforçant d’utiliser les liens de désabonnements systématiquement pendant quelques semaines. Le propriétaire du compte mail a donc la main dans ce cas …
2- Le SPAM sporadique avec son lien de désabonnement qui si il prête à caution a le mérite d’exister peut se traiter de trois façons à utiliser séparément ou mieux conjointement : utilisation du lien de désabonnement d’une part, l’ajout d’un filtre sur l’expéditeur ou un ajout en liste d’indésirables si votre gestionnaire de courrier (Le logiciel Thunderbird fait çà très bien par exemple)
3- Le SPAM de flibustiers laisse lui l’utilisateur impuissant tant la forme du message, l’expéditeur, le contenu du message varient à chaque envoi (ce qui est indispensable au spammeur pour contourner les filtres). Le SPAM de flibustiers ne vient jamais des mêmes adresses, ni des mêmes serveurs. Il utilise d’ailleurs souvent des ordinateurs d’utilisateurs lambda qui se transforme en relais de SPAM a l’occasion d’une contamination par un virus (dont c’est d’ailleurs souvent la fonction première : transformer des ordinateurs d’imprudents en machine à spammer).

On le comprend, gérer le troisième groupe et combattre les flibustiers, c’est s’attaquer à la plus grande proportion des courriers indésirables, à la plus nuisible, mais aussi à la plus difficile à filtrer de manière sémantique, puisque les promoteurs de ces SPAM redoublent d’efforts pour passer au travers des mailles du filet, et c’est même l’essentiel de leur occupation, tout en étant la clé de leur business.

Dans notre prochain billet, nous ferons le point sur les principales techniques de filtrages du SPAM et leurs inconvénients, tout en le remettant en perspective avec la priorité ci-dessus définie : faire la chasse aux flibustiers.

Laisser une réponse

Commentaire