Zouheir GUEDRI * (Data&Data) : « le big data et l’intelligence artificielle industrialisent la lutte anti-contrefaçon sur Internet »

Écrit par © Filactu le . Rubrique: Interviews

ZG-DD-2016Comment en êtes-vous venu à considérer la lutte anti-contrefaçon comme une application potentielle du big data et de l’intelligence artificielle ?

 

Zouheir GUEDRI : En 2014, nous avons été sollicités par un grand groupe de luxe français pour étudier l’organisation du marché gris en Chine. Il faut savoir que le prix d’un produit de luxe peut varier jusqu’à 60 % entre l’Europe et l’Asie. La moyenne courante est une différence de prix de l’ordre de 40 %. Ce qui incite certains vendeurs à jouer sur cette différence de prix pour générer un business très lucratif à partir de vrais produits. Le problème est que cette pratique, vieille comme le monde, déstabilise fortement les réseaux de vente officiels des marques.

Il s’agissait donc d’identifier, l’organisation de ces vendeurs non-agréés, leurs canaux de vente sur Internet, leur mode d’approvisionnement, les quantités, les prix… 

 

La surprise a été qu’en faisant cette étude, à partir de nos outils d’investigation sur le Web, nous avons trouvé 10 à 15 fois plus de contrefaçons que de vrais produits détournés. Ce qui a fortement intéressé notre client.

 

Justement pouvez-vous décrire la spécificité de vos outils d’investigation ?

 

Zouheir GUEDRI : Tout d’abord, il faut considérer que le big data n’est pas seulement une nouvelle technologie. C’est une nouvelle génération d’outils qui va bouleverser et changer les métiers, et ceci grâce à l’évolution spectaculaire des capacités de traitement des ordinateurs et du Cloud. Il y a encore deux ou trois ans notre offre actuelle n’était pas économiquement envisageable compte tenu des limites des capacités de traitement.

 

Ensuite, le big data — c’est-à-dire la capacité de traiter de gros volumes de données — ne serait rien sans la possibilité d’en faire une analyse rapide grâce à des algorithmes intelligents. Bien entendu, dans le cadre de la lutte anti-contrefaçon, la capacité de la machine à reconnaître le vrai du faux passe par un apprentissage qui est spécifique du secteur d’activité à explorer.

 

Data&Data est actuellement la seule entreprise à pouvoir analyser en temps réel les annonces de produits contrefaisants des marques de luxe (maroquinerie, joaillerie horlogerie) et des produits cosmétiques vendus sur Internet à la fois sur les réseaux sociaux, les sites Web d’e-commerce, les places de marché et les applications mobiles dans une quinzaine de langues.

 

Comment procédez-vous concrètement ?

 

Zouheir GUEDRI : Je précise que nous ne demandons rien à nos clients au préalable, ni photos, ni catalogue, ni informations particulières. C’est un point important pour des services anti-contrefaçon ou juridiques déjà saturés, mais dont Data&Data va fortement accroître la productivité en industrialisant les investigations et la riposte. Ils pourront ainsi se concentrer sur les cas les plus nuisibles. En particulier, les réseaux de contrefacteurs qui réunissent entre 1 000 et 2 000 vendeurs et qui utilisent des robots pour démultiplier leurs annonces. 

 

Pour obtenir des résultats significatifs avec l’intelligence artificielle. Il faut commencer par éduquer le système en lui soumettant un très grand nombre d’exemples. Ainsi, pour une grande marque de luxe, il faut analyser entre 300 et 500 millions de photos captées sur Internet et les réseaux sociaux avant que le système ne soit capable de reconnaître le vrai du faux à plus de 95 %.

 

Nous avons présenté notre premier produit d’extraction/analyse, « Brand Watchdogs », au printemps 2015 aux marques de luxe. Elles ont été très impressionnées à la fois par le volume des résultats obtenu, de l’ordre de 30 fois supérieur aux technologies et services classiques/concurrents et par la pertinence de nos résultats.

 

Cela tient à la performance de l’algorithme intelligent qui effectue une analyse en 3D : à la fois sémantique — en déjouant notamment les détournements de marque comme Carter ou Prado — une analyse sur les photos et enfin sur les prix de vente.

 

Il faut savoir que la majorité des annonces ne cite pas de nom de marque, ni le nom du produit. Il n’y a donc pas de mot-clef. C’est notamment le cas lorsque l’annonce est rédigée avec des idéogrammes chinois, comme sur Alibaba ou l’application mobile « WeChat » du Groupe chinois Tencent qui réunit 650 millions d’utilisateurs. Il faut donc établir des corrélations à partir d’autres éléments, les photos et les « empreintes digitales » du vendeur.

 

Compte tenu des volumes traités, les résultats des analyses sont-ils facilement exploitables par le client ?

 

Zouheir GUEDRI : Il est évident que les clients attendent de Data&Data un service qui améliore la productivité des services concernés et non l’inverse. Nous offrons pour cela différents outils permettant une riposte graduée.

 

Le premier niveau est d’effectuer trois signalements automatiques des contrefaçons détectées pour une marque donnée : 

  • le vendeur reçoit par mail un avertissement, l’invitant à retirer son annonce. L’effet dissuasif est souvent immédiat en particulier sur les vendeurs occasionnels ;
  • une notification est envoyée à la plateforme d’hébergement, qui doit, en principe, procéder au retrait des annonces illicites ;
  • enfin, un signalement est envoyé à la douane dans les pays qui disposent d’un portail de signalement.

 

Le second niveau consiste à exploiter la carte mondiale de la localisation des contrefaçons sur Internet. Des points de couleurs apparaissent montrant immédiatement les zones les plus actives. Certaines zones telles que les Philippines et le Mexique concentrent une forte activité, car ces pays hébergent des réseaux sophistiqués et bien organisés qui utilisent des robots pour démultiplier leurs annonces.

 

01-newScreen

 

Vue holistique des canaux des distribution des produits de contrefaçon et de leurs évolutions 

 

Par exemple, c’est ainsi que pour une seule grande marque de luxe, nous sommes en mesure de dire que sur Facebook, au moment où je vous parle, 6 700 profils de vendeurs de contrefaçon sont actifs. Et que sur pour l’ensemble de l’Internet, 18 000 sites vendent des contrefaçons de cette marque. En cliquant sur les points on accède immédiatement à la page du site qui propose les contrefaçons ainsi qu’un minimum d’informations sur le vendeur. Un classement permet aussi d’établir la liste des 10 vendeurs les plus nocifs.

 

 

02-newScreenFeed

 

Une plateforme de suivi en temps réel des nouvelles sources de contrefaçon

 

Le troisième niveau consiste à exploiter les outils de visualisation. On peut ainsi faire un mapping des sites qui ont des liens forts entre eux : notamment les sites dont les noms de domaine ont été déposés par une même personne, avec le même numéro de téléphone et qui sont hébergés sur les mêmes serveurs. Il apparaît ainsi des réseaux criminels de vendeurs qui réunissent des milliers de sites ou d’annonces frauduleuses. Ces informations représentent un gain de temps considérable pour les services juridiques des marques qui peuvent se concentrer sur les cas les plus nuisibles.

 

Au-delà du luxe et des cosmétiques, quels sont vos projets de développement sur d’autres secteurs d’activité ?

 

Zouheir GUEDRI : Le travail le plus important consiste à développer pour chaque secteur d’activité les algorithmes intelligents. Mais une fois que ce travail a été effectué, il est facile ensuite de le décliner pour différentes marques ou d’en moduler les performances selon les moyens (informatiques et financiers) dont on dispose. C’est ainsi que d’ici à la fin de l’année, Data&Data proposera, aux petites et moyennes marques de luxe, une version light plus abordable de ses outils.

 

Ensuite, nous préparons pour 2017 des algorithmes intelligents qui seront dédiés au secteur des vins et spiritueux.

 

Le coût d’accès à ces technologies est-il important ? De quoi dépend-il ?

 

Zouheir GUEDRI : La structure du coût global est assez simple. Elle ne dépend que de deux facteurs : 

  • le nombre de familles de produits à surveiller ;
  • le niveau de service souhaité : uniquement l’accès à la plateforme de détection et de reporting ou alors la détection complétée par des services de riposte.

Le budget minimal commence à 60 000 euros par an, moins que l’investissement dans un juriste expérimenté ! <

 

Propos recueillis par Philippe Collier

 

 

* La start-up Data&Data a été créée, fin 2012, par Zouheir Guédri, ancien directeur de l’activité de conseils en big data et analytics du Groupe PwC