sept
8

113 milliards d’interrogations

Posté par Gaëlle DELAVAQUERIE dans Actualités, Référencement & Moteurs

Ce n’est heureusement pas le nombre d’interrogations écrites prévues dans les établissements scolaires français alors que la rentrée des classes vient avoir lieu, mais du nombre de requêtes effectuées par les internautes sur les moteurs de recherches au mois de juillet 2009 tout moteurs de recherches confondus et  à l’échelle mondiale.

Pas de surprise c’est Google qui tient le haut du pavé avec 67% de part de marché, Yahoo est à presque 8%, la médaille de bronze est plus surprenante (mais pas tant que cela finalement) puisque c’est Baidu avec 7% qui prend monte sur la troisième marche grâce à son statut de leader chinois de la recherche. A presque 3 (petits) pourcents, Microsoft avec son ex-MSN Search/Ex-Live.com et nouveau Bing.com

comScore nous apprend que les internautes ont effectué 113 milliards de requêtes sur les moteurs de recherche dans le monde pendant le mois de juillet 2009. Google se taille la plus grosse part avec 67% de part de marché mondiale, suivi par Yahoo (7,8%) et Baidu (7%).


Pas de commentaire disponible

sept
6

Google dépose … sa page d’accueil

Posté par Gaëlle DELAVAQUERIE dans Actualités, Référencement & Moteurs

brevet-google C’est un étonnant brevet qu’à déposé Google en 2004 et dont le bureau d’enregistrement américain vient d’accepter la forme et le fond : un brevet sur la page d’accueil du célèbre moteur qui n’est assurément pas une expression du génie des promoteurs de l’outil de recherche leader du marché. S’il y a assurément du génie à piquer chez Google, ca n’était assurément pas dans la page simplicissime page blanche qu’on l’attendait. Est-ce pour cela que BING illustre sa page de recherche de jolies photos ? pour ne pas être accusé d’usurper la « création » de Google ?


Pas de commentaire disponible

juil
31

Créer un site communautaire

Posté par Pierre DELAVAQUERIE dans Actualités, Blog-Newsletter, Commerce électronique, Publicité en ligne, Référencement & Moteurs

Votre Saint MaurVoilà de nombreux mois que le terme de Web 2.0 est mis à toutes les sauces. Si nous ne proposerons pas ici une énième définition décrivant notre vision ce qu’est le Web 2.0 par le menu, nous dirons juste qu’il s’agit à notre sens essentiellement d’un terme générique qui a pour but d’étiqueter une époque. Les historiens avaient posé les concepts d’Age de Pierre ou d’Age de Bronze pour classifier des époques de l’évolution, en s’appuyant sur le mode de fabrication des outils. Mais in fine, tout ce qui peut concerner ces époques, du mode de vie à la religion, de la faune à la flore se trouvait estampillé.

Les similitudes pour  « Web 2.0 » nous semble assez flagrante puisqu’il s’agissait au départ de décrire une nouvelle orientation quant aux technologies utilisées pour concevoir et éditer des services en ligne (l’avènement d’AJAX, l’apport des flux XML et de leur émanation bien connue des lecteurs et éditeurs de contenu : le RSS …).

S’en est suivie une appropriation du terme pour qualifier l’évolution éditoriale inhérente à l’époque. On a donc assez vite accolé au Web 2.0, entre autre, l’avènement de certains types de sites : vidéos en ligne comme YouTube ou DailyMotion, annuaire relationnel dit « réseaux sociaux »comme FaceBook ou Copainsdavant, site de partages d’informations comme Digger, d’expressions comme MySpace ou dans un genre voisin Agoravox … Le point commun entre ces sites ? Ils sont participatifs et donc communautaires, ce sont les utilisateurs qui constituent le contenu.

Les concepts de ces sites essentiellement voués au loisir ont dans certains cas eu rapidement des déclinaisons professionnelles, notamment en ce qui concerne les réseaux sociaux qui dans leur version business permettent de fluidifier les relations d’affaires, de trouver le chaînon manquant pour établir de le contact avec une cible, ou du moins pour obtenir des « ficelles » facilitatrices pour entrer en affaire.

Dans le panel de concept de sites communautaires grand public, les sites multifonctions comme MySpace nous semblent être de ceux qui peuvent être le plus facilement adaptés à un secteur d’activité.

Etre à l’initiative d’un support communautaire orienté sur son secteur d’activité remet au goût du jour le concept de « Guilde » (« association regroupant des membres ayant un intérêt culturel ou commercial commun » pour mémoire),

Le promoteur pourra en tirer bien des profits :
-    Mener une opération d’intérêt général qui y-a-t-il de meilleur pour l’image,
-    Disposer d’un support éditorial à soi tout en le faisant enrichir d’un point de vue rédactionnel par d’autres, permet de communiquer sur ses propres actions dans un cadre privilégié (puisqu’à soi),
-    Créer une audience récurrente voir captive. Une bonne communauté est consultée quotidiennement par ses aficionados,
-    Etre aux premières loges pour jauger les tendances, pour étudier l’opinion, pour questionner, pour sonder …
-    Optimiser sa visibilité sur les moteurs de recherche

Ce dernier point est l’un des principaux attraits. En matière de bon référencement (c’est-à-dire de bon positionnement) sur les moteurs de recherche, les contenus rédactionnels ont un poids de plus en plus important. Chaque « production » de l’utilisateur de site communautaire crée une page de plus, et chaque page de plus offre une nouvelle porte d’entrée sur les moteurs de recherche, avec des variations sémantiques toujours intéressantes. Pour un même produit, pour une même prestation, pour une même problématique, la terminologie de l’ingénieur, diffère de celle du commercial, qui n’est jamais totalement la même que celle de l’utilisateur final. L’ingénieur parlera d’un « périphérique d’impression », le commercial d’une « Jet d’encre », l’utilisateur « d’une imprimante ». Dans cet exemple, on mesure facilement l’intérêt de faire bavarder entre eux les trois profils sur le sujet (par exemple) de l’édition d’étiquettes puisqu’il permettra par exemple de ressortir la page contenant la discussion sur les moteurs de recherche comme Google quand un utilisateur formule la recherche « imprimante jet d’encre pour impression d’étiquettes ».

Si monter une communauté est une initiative dont on ne récolte les fruits qu’à moyen terme, elle peut donc constituer une véritable opportunité qui peut avoir, qui plus est, des développements bénéfiques inattendus. En effet, puisque l’outil ainsi proposé est communautaire, ce qu’en fera la communauté après se l’être approprié pourra surprendre. L’intelligence collective fait parfois des merveilles.

Afin de permettre la création d’un site communautaire professionnel ou grand public au plus grand nombre, nous avons construit une solution autour d’un noyau open source. Pour moins de 2000 euros HT (prix de base), il vous est possible de disposer d’une solution communautaire clé en main (Voir Votre Saint Maur, notre communauté de démonstration basée sur les affinités géographiques). L’offre étant modulaire, il vous sera possible d’agrémenter votre espace communautaire par des modules plus perfectionnés au fur et à mesure de la montée en puissance de votre communauté.

N’hésitez donc à nous faire part de votre projet de site communautaire, nous vous assisterons tant dans votre pré-étude que dans sa concrétisation si le potentiel d’une communauté dans  secteur que vous ciblez est avéré.


Pas de commentaire disponible

mai
17

Google dépasse Yahoo aux Etats-Unis

Posté par Gaëlle DELAVAQUERIE dans Actualités, Référencement & Moteurs

Le nombre de visiteurs uniques par mois est l’un des éléments statistiques des plus significatifs quand il s’agit d’évaluer les parts de marché de sites web concurrents. Et c’est en étudiant l’évolution récente de cet indicateur statistique régulièrement que Comscore a pu mettre à jour un évènement d’importance : Yahoo qui était historiquement leader sur cette statistiques depuis plus d’une décénie sur le marché américain vient de se faire dépasser par Google. Les produits Google affichant 141,1 millions de visiteurs ayant consultés au moins une fois un des services du groupe dans le mois, contre 140,6 millions pour Google.

Voilà qui n’arrangera pas les affaires de Yahoo déjà fortement chahuté en bourse depuis que ses dirigeants ont décliné l’offre d’achat de Microsoft …


Pas de commentaire disponible

avr
18

Filtrer le SPAM (épisode 3)

Posté par Pierre DELAVAQUERIE dans Actualités

Comme nous l’évoquions au mois de Janvier 2008 dans nos deux premiers épisodes, nous faisions de l’éradication massive du SPAM l’une de nos bonnes résolutions de la Nouvelle Année qui venait de commencer, tellement les courriers non sollicités avaient dépassés fin 2007 les limites du supportable pour ceux d’entre vous qui nous confient la gestion de votre courrier électronique et dont l’adresse e-mail est très exposée (car publiée ça et là) et/ou très ancienne (voir Episode 1).

Si nous avons eu de nombreux retours positifs quant aux effets bénéfiques nos conseils de janvier (voir Episode 2), l’hyper-activité des spammeurs a eu tôt fait de contre-balancer en tout ou partie le gain de tranquillité qui résultait de nos actions : si nos initiatives ont diminué significativement le SPAM, le volume de SPAM global d’un point de vue planétaire s’est donc encore accru.

Nous évoquions en début d’année notre scepticisme à l’égard des applicatifs anti-spam installés sur les serveurs pour filtrer le SPAM parce qu’ils ont tendance à considérer parfois de « bons courriers » comme des missives indésirables. Et finalement comme les mesures mises en place à l’époque permettaient de ramener la quantité de SPAM à trier à une valeur raisonnable, il n’y avait pas lieu d’explorer davantage cette piste.

Mais comme on l’a vu, le SPAM progresse encore, et filtrer quelques SPAMs de plus par une analyse sémantique devient maintenant une aide non négligeable pour chacun quand il dépouille son courrier.

Comme il est hors de question de mettre à la poubelle des courriers entrants étant donné les « ratés » d’analyse que nous évoquions dès alors, c’est vers une solution intermédiaire que nous nous sommes tournés, en complément de nos mesures de janvier, pour détecter quelques SPAMs de plus.

Pour la rendre acceptable et sans risque de perte de courrier, l’analyse sémantique a été activé sur nos serveurs, mais sans son option destructive. Les messages suspectés comme pouvant être potentiellement des SPAMs par le système de détection vous sont donc maintenant envoyés après que la mention « ***SPAM*** » ait été ajoutée dans le sujet du message suspect.

Cela vous permet d’identifier visuellement plus facilement les quelques spams étant passés à travers nos autres systèmes de filtrage, et éventuellement de créer un filtre sur votre gestionnaire de courrier préféré pour stocker les messages qui contiennent « ***SPAM*** » dans l’intitulé de sujet au sein d’un dossier de quarantaine, pour revue a posteriori afin de sauver un éventuel « faux positif « .


Pas de commentaire disponible

mar
28

CA de la publicité en ligne en 2007

Posté par Gaëlle DELAVAQUERIE dans Actualités, Publicité en ligne

France Pub, filiale du groupe Hersant et l’Interactive Advertising Bureau ont mis leur force en commun pour évaluer le marché de la publicité sur internet en 2007. Il résulte de cette étude que la publicité sur internet aurait representé en France un chiffre d’affaire de 740 millions d’euros pour une petite moitié (311 m€) rien que pour les liens sponsorisés.

L’etude complète est riche d’informations : à consulter ici 


Pas de commentaire disponible

fév
23

Ankelia Nature – Reportage de la CCI de Troyes

Posté par Gaëlle DELAVAQUERIE dans Actualités, Commerce électronique

Cette semaine, notre cliente Sonia REDON est à l’honneur dans la vidéo de la semaine de la CCI de Troyes et de l’Aube pour sa création de boutique de produits naturels de puériculture et de maternage en septembre 2007.

L’équipe de PIC est intervenue dans ce projet comme conceptrice et maître d’oeuvre de la mise en ligne du site Internet de la boutique Ankelia Nature. Notre équipe assure le suivi technique et l’intégration de nouvelles fonctionnalités selon les besoins de la cliente.


Pas de commentaire disponible

jan
18

Filtrer le SPAM (épisode 2)

Posté par Pierre DELAVAQUERIE dans Actualités

Après avoir dressé un état des lieux sur la nature des spams reçus sur un échantillon de boîtes mails « témoins », intéressons-nous aux différentes solutions qui peuvent être mises en œuvre pour régler le problème.

LE FILTRE SUR LA MACHINE DU DESTINATAIRE

Alors que les premières nuisances faisaient leur apparition il y a quelques années, la solution qui s’est imposée d’elle-même (et qui était finalement davantage une contrainte, une obligation plus qu’une « solution »), c’est le tri au niveau du poste de l’utilisateur final, c’est-à-dire du destinataire propriétaire de la boîte-email. Cette tache étant fastidieuse, les éditeurs de logiciels se sont intéressés au problème et ont proposé différentes solutions logicielles à installer sur le PC de bureau, et qui s’efforceraient de faciliter le travail de purge par différentes méthodes mais principalement par une analyse sémantique du contenu de chaque mail entrant afin de déterminer s’il correspond à des critères de SPAM. Le gestionnaire de courrier Thunderbird (ersatz Open Source de l’illustre Outlook) propose depuis quelques années maintenant ce type de solution de filtrage totalement intégrée au logiciel. Le principe est que l’utilisateur va trier les premiers jours l’ensemble de son courrier et classer le SPAM dans un dossier « indésirables ». Au fur à mesure de ce tri, le logiciel « apprend » ce que l’utilisateur considère comme du SPAM. Plus l’utilisateur trie des spams passés entre les mailles du filet, plus le logiciel apprend, et plus il devient pertinent. Au bout de quelques semaines, l’essentiel des SPAMS est traité en automatique grâce à l’apprentissage. Et l’utilisateur peut aller jeter un œil de temps à autre dans le dossier « indésirables » pour vérifier qu’il n’y a pas eu de filtrage « excessif », à savoir des courriers qui aient été considérés par erreur comme des SPAMS (on parle de faux positifs).

Ce type de filtrage a des avantages et des inconvénients :

Avantages :
- Il tient compte des comportements et de la nature du courrier reçu par le destinataire, afin de constituer un filtre « sur mesure »
- Le dossier « indésirables » permet d’aller visiter le résultat du filtre et de rattraper une mise à l’écart abusive d’un courrier

Inconvénients :
- Il implique une période d’apprentissage
- Il est nécessaire d’aller vérifier un dossier « indésirables » régulièrement, ce qui revient in fine à passer en revue tout les spams reçus. Et passer en revue tous les spams reçus n’était-ce pas ce qu’on faisait à la genèse quand il n’y avait pas de solutions de filtrage ? Corollairement on oublie parfois d’aller faire ce « tour de vérification » pendant quelques jours, jusqu’à ce qu’un correspondant nous alerte qu’il n’a pas eu de réponse à son mail … et qu’on le retrouve finalement parmi les centaines de mails triés dans les indésirables.
- Un expéditeur dont le message a été filtré n’est pas prévenu, et peut attendre une réponse qui n’arrivera jamais tandis que son message est malencontreusement parti à la trappe.

LES FILTRES AU NIVEAU DU SERVEUR

Il y a plusieurs philosophies de filtrage côté serveur qui existent. Le filtrage côté serveur à un handicap, c’est qu’au sein d’une même entité, il va s’appliquer à tous (même s’il peut y avoir quelques variables d’ajustements). On citera les principales méthodes suivantes :

• Le filtre par analyse sémantique

On décortique le contenu du message, on « note » les différentes caractéristiques, chaque élément faisant penser à du SPAM rajoute des points, et au delà d’un certain nombre de points, le message est considéré comme un spam. Dès lors, une des trois stratégies est définie lors de la mise en place de la solution de filtrage : soit il est mis sur le serveur dans un dossier indésirable que chaque utilisateur va devoir venir visiter pour faire la chasse au faux positifs (comme pour Thunderbird et le filtrage sur le poste de l’utilisateur), soit il est transmis mais avec un label « [SPAM] » dans le sujet (qui permettra à l’utilisateur de mettre en place une règle de filtrage), soit il est détruit.

Avantage :
- L’utilisateur a toujours accès aux SPAMs reçus pour parer à une erreur de filtrage (fréquentes d’après nos tests sur ce type de solutions)

Inconvénients :
- Même principe que le filtrage sur poste avec Thunderbird, sauf que le filtre n’apprend pas et ne se personnalise pas en fonction de critère comportemental de son utilisateur
- Beaucoup trop de « faux positifs » à notre avis
- Implique de re-trier les SPAMs reçus « au cas où » (et donc une fois encore d’y passer beaucoup de temps).
- Pfizer, le fabricant du Viagra, ou les supermarchés Casino ne seront probablement jamais de vos clients, car ils risquent bien de finir à la trappe en déclenchant les filtres …

• Le filtre par vérification que l’expéditeur est « humain »

Le principe de ce filtre fait reposer l’essentiel du travail de filtrage sur les épaules de celui qui écrit. Lors de la première expédition d’un message à votre attention, la missive est mise en quarantaine et votre correspondant reçoit un message automatique, qui lui demande de se rendre sur une page web spécifique et de recopier un cryptogramme visuel, afin de prouver qu’il est humain et réellement motivé pour vous écrire. Nous appelons cela malicieusement une « convocation à l’examen ». Une fois l’examen de passage réussi, l’expéditeur est ajouté à une liste de personnes accréditées à vous écrire. S’il n’y a pas de confirmation, le message est stocké dans une corbeille à SPAM (avec plusieurs centaines d’autres, évidemment)

Avantage :
- Le système est (trop) fiable, et ne vous écriront que ceux qui sont humains et motivés

Inconvénients :
- Particulièrement trivial à notre sens à l’égard des correspondants. Pourrait se tenir si dans les relations professionnelles nous n’avions tous que des fournisseurs (corvéables) et pas de clients (exigeants). Le monde n’étant pas ainsi fait , mettre en œuvre des solutions de filtre qui vont imposer un examen à vos clients pour avoir le droit de vous écrire nous parait rédhibitoire.
- Les utilisateurs modérés de l’email vous écriront le lundi matin, reviendront lire leur mail l’après midi pour avoir la réponse qu’ils attendent tant de vous, et n’auront comme feed-back que la convocation à l’examen de passage sus évoqué. Irritant !
- Les utilisateurs débutants ne comprendront pas forcément le principe de votre filtre de mails et mettront l’invitation à l’examen à la poubelle.
- Certains filtres anti-spams sémantiques considèrent la convocation à l’examen comme un spam. Il se peut que celui qui cherchait à vous écrire « passe a coté ».
- Ce type de filtre peut créer des situations complexes entre deux expéditeurs utilisant ce type de filtre. L’utilisateur A écrit à B. B utilise ce type de filtre. Le serveur de B envoie donc la convocation à l’examen. Or A utilise aussi le filtre le serveur de A reçoit donc un mail du serveur B et lui envoie à son tour une convocation à son propre examen. Et voilà comment deux utilisateurs pourront se louper, et comment des convocations à l’examen « anti spam » resteront mises en quarantaine jusqu’à ce que l’un des deux prennent le temps d’aller voir son dossier de quarantaine.
- Vous ne recevrez plus les mailings et les communiqués, y compris ce qui vous intéressent si vous ne traitez pas manuellement votre dossier corbeille et si vous n’autorisez pas les serveurs de routages à vous écrire.

• Le filtre de bannissement des ordinateurs spammeurs

A l’échelle internationale des organismes tiennent à jour des listes des ordinateurs dont la vocation essentielle (voire unique) est de spammer. Ces listes sont appelés des listes RBL Quand une opération de spams démarre à partir d’une adresse IP (numéro unique, équivalent du « numéro de sécurité sociale » pour les ordinateurs connectés à Internet), l’adresse est ajoutée dans les heures qui suivent sur la liste noire.

La technique de filtrage consiste à ce qu’à chaque e-mail présenté par un expéditeur à votre serveur de mail (PIC en l’espèce) ce dernier interroge les listes noires, afin de déterminer si l’expéditeur est « fiché » ou pas. Si le serveur expéditeur est en liste noire (on dit « blacklisté »), le message entrant n’est pas accepté, et l’expéditeur est informé du refus de prendre en charge son mail (il n’est donc pas laissé dans l’ignorance).

Ce type de filtre est le moyen idéal de contrer les spams des « flibustiers » (voir notre Filtrer le spam – épisode 1) qui utilisent des ordinateurs lambda pour envoyer des spams en les détournant par le biais d’un virus.

Avantages :
- Vous n’avez aucun temps à passer à trier les mails ainsi filtrés puisqu’ils ne remontent pas jusqu’à vous, le filtrage est automatique
- Les listes RBL sont très bien gérées, et ne filtrent que des adresses IP impliquées dans des SPAMs de « flibustiers »
- L’utilisateur qui est filtré est prévenu que son message n’a pas été transmis
- La mise à jour / confrontation est faite en temps réel.

Inconvénients :
- Les machines récemment « converties » à l’envoi de SPAM ne sont référencées qu’après quelques heures, il y a donc quelques spams qui parviennent à passer à travers les mailles du filet
- De ne filtrer que les SPAMs de « flibustiers » est autant une qualité qu’un défaut : cela laisse passer tous les envois en nombre « gris » (ce que nous appelions les « Spams sporadiques » dans notre état des lieux de l’épisode 1) et ne filtrera pas la « publicité opportune »


NOS ACTIONS ET PRECONISATIONS

• Nos objectifs (devant obligatoirement être conciliés entre eux) :

- Filtrer le maximum de spams
- Minimiser le travail du propriétaire de l’adresse mail en lui évitant de consacrer trop de temps à passer en revue des résultats de filtrage
- Ecarter les solutions qui génèrent trop de « faux positifs » Ne pas faire reposer le filtrage sur les épaules de l’expéditeur

Pour remplir ces objectifs, ont été écartés :

- Les filtrages sémantiques sur les serveurs avec notation (trop de « faux positifs »)
- Les filtrages qui impliquent une démarche rébarbative à l’expéditeur (qui est parfois un acheteur) notamment par « convocation à examen » et cryptogramme

• Nos actions

Pendant plusieurs semaines, sur notre serveur de mail de nos boîtes « @pic.fr » nous avons mis en place un filtrage par RBL qui nous a permis de diviser par 5 à 6 le nombre de spams de « flibustiers » (à titre d’exemple, une adresse qui recueillait une centaine de SPAMs pour Viagra, Cialis, Casino par jour n’en reçoit plus que 10 à 15).

AVANT :
(explications détaillées dans notre épisode 1)

« Publicité opportune » : 15
« SPAM sporadique » : 15
« SPAM Flibustiers » : 100

Total : 130

APRES :
« Publicité opportune » : 15
« SPAM sporadique » : 15
« SPAM Flibustiers » : 15

Total : 45

Après plusieurs semaines de tests, nous n’avons eu aucun écho de « faux positifs » sur cette méthode de filtrage, elle a donc été généralisée à tous nos serveurs.

• Nos prescriptions

Nous incitons les utilisateurs à installer un outil de filtrage de SPAM avec apprentissage sur leur machine de bureau. Il permet de filtrer aisément les spams sporadiques (sur un critère de domaine expéditeur) et les publicités dont le lien de désinscription serait moins opérationnel qu’on serait en droit de l’espérer. Ce type de filtrage est très efficace et finalement très peu contraingrant dans le cadre d’un ultime écrémage.

Nous conseillons l’utilisation du gestionnaire de courrier Thunderbird, gratuit, opensource, qui a été développé par la même Fondation qui a en charge le développement du navigateur Firefox.

Il aura également une certaine efficacité sur les quelques spams flibustiers qui peuvent passer à travers les mailles du filet de notre filtrage RBL.

CONCLUSION :

Les choix et prescriptions permettent donc de limiter considérablement le temps nécessaire aux destinataires pour trier les spams, en leur épargnant d’avoir à récupérer ceux qui en sont assurément. Ils peuvent dès lors promptement effectuer le tri d’affinage et d’apprendre à leur logiciel de filtrage à reconnaître les spams selon leurs critères personnels.

Après quelques semaines, et avec quelques désabonnements et quelques classements en indésirables, notre boite mail de référence aux 130 spams devrait pouvoir ne plus recevoir que :

Publicité opportune » : 1
SPAM sporadique » : 3
SPAM Flibustiers » : 10

Total : 14

Et ceci avec donc très peu de spams à passer en revue pour vérification.


Pas de commentaire disponible

jan
17

Filtrer le SPAM (épisode 1)

Posté par Pierre DELAVAQUERIE dans Actualités

Les courriers électroniques non sollicités qui cherchent à nous vendre du Viagra ou qui nous proposent de faire fortune au casino sont de plus en plus nombreux.

Nous avons toujours conseillé d’aborder le problème du SPAM avec philosophie, en nous appuyant sur le constat que nos boites aux lettres électroniques avaient finalement le même sort que nos boîtes aux lettres « réelles » alimentées un peu par le facteur et beaucoup par les distributeurs de prospectus (du journal gratuit au marabout qui donne les prochains résultats du PMU).

Après les boites aux lettres, les marabous s’attaquent à nos boites mails

Mais depuis quelques mois forcés sommes nous de constater que les SPAM ont pris des proportions qui ne rendent plus la comparaison postale efficace au moment de tenter de relativiser les nuisances des courriers électroniques non sollicités.

Pour persévérer dans l’analogie, la situation était devenue telle qu’on se retrouve chaque matin dans la situation de l’individu moyen qui découvrirait le soir en rentrant à son domicile, que sa boîte aux lettres est pleine de prospectus, à tel point que tous les distributeurs (facteur compris) ont déposé au surplus 2 sacs postaux complémentaires, en lui laissant le soin de trouver les 4 courriers importants dans les 672 plis ainsi abandonnés.

Il nous fallait donc revoir la façon d’aborder cette problématique, et mettre en place une stratégie optimum pour ce problème de SPAM, tandis que nous avions prototypé régulièrement des solutions qui s’étaient avérées non satisfaisantes à cause de dommages collatéraux fort gênants pour les utilisateurs : des courriers ponctuellement considérés comme des SPAM alors que ce n’en était pas.

Alors que nous avons arbitré notre stratégie de filtrage de SPAM et que nous sommes en train de la généraliser à tous nos serveurs après une période de test sur nos propres adresses emails, il nous paraissait important de vous expliquer le cheminement de la phase de « constat » à la phase de mise en place d’une solution.

Afin de poser une stratégie, il fallait donc en tout premier lieu voir qui envoyait du SPAM et comment, ce qui permettrait de faire le tri dans les systèmes de filtrage.

Il y a trois grandes familles de SPAM :

1- La publicité opportune, qui correspond à la publicité adressée qu’on reçoit dans nos boîtes aux lettres traditionnelles. La Redoute nous envoie les lettres parce qu’on est clients pour faire une annonce qui ne nous intéresse souvent pas, mais parfois si. Ce type de SPAM (qui n’en est presque pas un, in fine) dispose quasi toujours d’un lien de désabonnement valide et fonctionnel. Il représente grosso modo 10 à 20% du trafic polluant, suivant le profil de l’utilisateur et sa propension à s’inscrire spontanément à des newsletters et/ou participer à des concours.
2- Le SPAM sporadique, souvent en français, mais pas toujours, qui résulte d’une récupération de notre adresse email on ne sait où (lire « récupérer de manière licite ou non »), et qui fait que le spammeur en question va nous écrire une seule fois, ou une fois de temps en temps. Le lien de désabonnement est parfois efficace mais pas toujours. La publicité est envoyée avec une adresse de réponse souvent valide, ou du moins le nom du vendeur dans l’intitulé d’expédition. Là encore, cette famille représente 10 à 20% du trafic polluant comme pour la précédente.
3- Le SPAM de flibustiers, celui qui va nous proposer du Viagra ou de jouer au casino, plusieurs fois par jour, chaque jour de la semaine, en usant de tout les stratagèmes pour déjouer les éventuels filtres de SPAM qui se baseraient sur la sémantique du message. C’est le plus agaçant, le plus polluant, et il représente la majorité du trafic polluant : environ 70% des SPAM sur les « compte emails témoins » que nous avons analysés

Ce constat étant posé, quels peuvent être les moyens pour diminuer l’effet parasites de ces courriers indésirables

1- La « publicité opportune » peut être considérablement réduite en s’efforçant d’utiliser les liens de désabonnements systématiquement pendant quelques semaines. Le propriétaire du compte mail a donc la main dans ce cas …
2- Le SPAM sporadique avec son lien de désabonnement qui si il prête à caution a le mérite d’exister peut se traiter de trois façons à utiliser séparément ou mieux conjointement : utilisation du lien de désabonnement d’une part, l’ajout d’un filtre sur l’expéditeur ou un ajout en liste d’indésirables si votre gestionnaire de courrier (Le logiciel Thunderbird fait çà très bien par exemple)
3- Le SPAM de flibustiers laisse lui l’utilisateur impuissant tant la forme du message, l’expéditeur, le contenu du message varient à chaque envoi (ce qui est indispensable au spammeur pour contourner les filtres). Le SPAM de flibustiers ne vient jamais des mêmes adresses, ni des mêmes serveurs. Il utilise d’ailleurs souvent des ordinateurs d’utilisateurs lambda qui se transforme en relais de SPAM a l’occasion d’une contamination par un virus (dont c’est d’ailleurs souvent la fonction première : transformer des ordinateurs d’imprudents en machine à spammer).

On le comprend, gérer le troisième groupe et combattre les flibustiers, c’est s’attaquer à la plus grande proportion des courriers indésirables, à la plus nuisible, mais aussi à la plus difficile à filtrer de manière sémantique, puisque les promoteurs de ces SPAM redoublent d’efforts pour passer au travers des mailles du filet, et c’est même l’essentiel de leur occupation, tout en étant la clé de leur business.

Dans notre prochain billet, nous ferons le point sur les principales techniques de filtrages du SPAM et leurs inconvénients, tout en le remettant en perspective avec la priorité ci-dessus définie : faire la chasse aux flibustiers.


Pas de commentaire disponible

jan
15

Les moteurs de recherches les plus utilisés

Posté par Pierre DELAVAQUERIE dans Actualités, Référencement & Moteurs

Il y a quelques semaines alors nous annoncions que Google passait le cap des 90% de parts de marché, en nous appuyant sur les statistiques XITI qui ont l’excellent mérite de s’appuyer sur un échantillon de sites très importants (plus de 87000 !) pour appuyer leurs études de marché.

Xiti vient de rendre public les statistiques de décembre 2007 :

Google continue à progresser à 90,83%.

Suivent Yahoo (2,92%), Live/Msn : 2,53% et Orange Wanadoo à 1,57%.

L’etude complete est disponible sur Xiti Monitor.


Pas de commentaire disponible