Innovation Shopping Flux : Algorithme Sémantique de Catégorisation

Publié le 11 mars 2014 par Olivier

C’est officiel, c’est en production et c’est sûrement l’aboutissement d’un des plus grands challenges relevé par l’équipe R&D Shopping Flux : après plus d’une année entière de développement, Shopping Flux lance son algorithme sémantique de catégories.

« Pourquoi autant d’investissements R&D uniquement sur de la catégorisation ? »

Parce que les marchands maîtrisant les flux savent que, plus que laborieux, la nécessité du matching des catégories de leur Ecommerce avec les milliers de catégories des dizaines de Places de Marché et Comparateurs de Prix est un travail long et répétitif.

Or, si un produit est diffusé dans une mauvaise catégorie d’un Comparateur de Prix, au mieux, il n’est pas cliqué, au pire, il obtient un mauvais taux de rentabilité.

Sur les Places de Marché, le produit peut ne jamais se vendre, uniquement parce qu’il n’est pas classé au bon endroit.

Donc à chaque ouverture d’une Place de Marché ou d’un Comparateur de Prix, le Ecommerçant se doit de faire un matching catégories manuellement à chaque fois.

Avoir ses produits référencés dans les bonnes catégories est donc indispensable pour les marchands. Hélas, chaque Comparateur et chaque Place de Marché possède ses propres noms de catégories, chacun avec une capillarité différente.

« Comment fonctionne cet algorithme ? »

C’est un même algorithme qui travaille en entrée de votre flux source et en sortie de vos différents flux.

1. Il va dans un premier temps lire les noms de vos catégories.

2. Ensuite, pour chaque catégorie, il va tenter dans un premier temps de les matcher de manière exacte avec chaque réseau de diffusion que vous ouvrirez via votre Shopping Flux (par exemple : « Poussettes » avec « Poussettes bébé » chez LeGuide.com). On parle ici d’une simple syntaxe.

3. Pour toutes vos catégories n’ayant pas matchées parfaitement, l’algorithme va repartir au point 1 vers le point 2, mais cette fois-ci en y incluant une donnée supplémentaire : les synonymes. Ce sont plus de 1 million de synonymes répertoriés dans notre base de donnée.

4. Sauf que, ajouter des synonymes à de la syntaxe ne permet pas d’atteindre des résultats aussi satisfaisants que le matching exacte, vu au point 1. Pourquoi ? Parce qu’il manque le contexte.

Comment faire choisir à un logiciel que « transport bébé » doit matcher avec « poussette » ou « porte bébé » ?

Plus complexe :  prenez le mot « casquette adulte baseball« . Comment le logiciel peut-il savoir s’il faut le faire matcher avec « casquette enfant baseball« , ou avec « casquette adulte basketball » ? Dans les 2 cas, il y a 2 mots qui matchent exactement, mais 2 d’entre eux sont pourtant différents.

Comment aider le logiciel à faire le bon choix si l’on s’arrête à la simple syntaxe ?

Un autre cas encore plus complexe. Regardez cet exemple : comment faire comprendre au logiciel que « transport bébé« , ne doit pas matcher avec « sac de transport« , mais plutôt avec « poussette« , alors que si l’on s’en tenait à la syntaxe, il y aurait bien plus de probabilités de faire matcher « transport bébé » avec « sac de transport » qu’avec « poussettes« , dont aucun mot n’est en commun.

C’est là qu’intervient la sémantique.

La sémantique est à la syntaxe ce que le filtre est à la lumière.

Comme nous venons de le démontrer, l’algorithme de catégorisation automatique ne pouvait se contenter d’être un matching sur la syntaxe, même avec 1 million de synonymes. C’est donc à ce moment-là que notre équipe R&D s’est lancée dans la compréhension de ce que se devait d’être un algorithme de catégorisation sémantique.

Il fallait contextualiser les mots, les remettre dans leur environnement, pour ne plus se fier à la seule syntaxe.

Nous avons longtemps pensé qu’il fallait ajouter des données à notre algorithme. Sans jamais arriver à de bons résultats. On avait beau ajouter des synonymes, regrouper les mots composés entre eux, on a même tenté les antonymes. En vain.

En fait, il ne nous fallait pas ajouter des données, il nous fallait en retirer.

Nous avions besoin de … filtres.

Reprenons le chemin de notre algorithme.

Nous avons vu qu’il est passé par les étapes 1, 2 et 3, mais qu’arrivé à l’étape 4, parce que la syntaxe pure avec des synonymes ne peut pas fonctionner, il a ressorti des matching non probants (cf les exemples).

Donc, c’est une fois arrivé en 4, qu’arrive une cinquième étape : la sémantiques et ses filtres.

5. A date, l’algorithme possède 2 614 filtres. Tous créés à la main, un par un, par nos équipes.

Des exemples de filtres ?

Par exemple, un filtre qui ne bloque qu’un spectre de lumière, pour expliquer que, dans le contexte « casquette adulte baseball« , il faut bloquer le spectre « adulte« , mais que dans le contexte « déguisement adulte« , le même spectre « adulte » doit, cette fois-ci, pouvoir passer.

Un autre filtre qui, lui, laisse passer toute la lumière, pour ne rien contextualiser (ce qui, au final, nous fait revenir à la syntaxe).

Un autre filtre qui, lui, au contraire, ne laisserait passer aucun spectre de lumière, et qui indiquerait ainsi que « transport » dans le contexte « puériculture » doit matcher avec « poussettes » et non pas avec « sac de transport« .

2 614 filtres, plus d’un 1 de R&D, un investissement de l’équipe intense, beaucoup de challenges, d’espoirs, de tests et de remise en cause. Et une première mondiale pour un Gestionnaire de Flux.

Des filtres créés un par un. Pour apporter de l’intelligence, du pragmatisme, de la contextualisation, de l’automatisme, de la logique, bref, de la sémantique, à vos flux.

« Je suis déjà client Shopping Flux. Est-ce que cela va m’aider à vendre plus ? »

Oui.

A chaque fois que vous ajouterez de nouvelles catégories dans votre logiciel Ecommerce, Shopping Flux le détectera, lancera l’algorithme sémantique de catégorisation et diffusera vos produits (sauf bien sûr, ceux qui répondraient à une de vos règles de « Retrait Automatique »), sur les Comparateurs de Prix et Places de Marché de vos choix.

Il en sera de même pour toutes vos prochaines ouvertures de réseaux de diffusion : rien à faire, juste à vérifier.

Un email vous est envoyé à chaque fois que l’algorithme de catégorisation a procédé à des matchings sur votre Shopping Flux, afin que vous puissiez y apporter une vérification manuelle.

Pour bénéficier de cet automatisme, il vous suffit simplement de vérifier que vous avez bien activé la fonctionnalité « Ajout automatique des nouveaux produits » (que vous trouverez dans l’onglet « Outils »)

A vous les ventes supplémentaires sur les Comparateurs de Prix et Places de Marché sans rien faire. Dormez sur vos deux oreilles.

Notez que toutes les catégorisations que vous avez déjà effectuées ne seront pas impactées. L’algorithme n’agira que si la catégorisation n’a pas été faite par vos soins.

« Je ne suis pas encore client Shopping Flux. Quel est l’impact pour moi ? »

Avant, quand vous ouvriez un compte Shopping Flux, il fallait renseigner la catégorisation mère, et Shopping Flux s’occupait de matcher avec l’ensemble des catégories de vos réseaux. C’est ce que nous appelions la Catégorisation Automatique, et qui était déjà très appréciée par nos clients.

Maintenant, nous allons encore plus loin, puisque votre licence Shopping Flux vous sera livrée avec la fonctionnalité « Catégorisation Sémantique » déjà en place.

Donc, l’algorithme lira vos catégories, et à chaque fois que vous ouvrirez une nouvelle Place de Marché ou un Comparateur de Prix, l’algorithme se mettra en action pour faire à votre place le matching.

Simple, efficace, automatique et générateur de revenus.

Vous pouvez faire une demande de test de 1 mois sans engagement sur notre site, en cliquant sur ce lien.

« Y aura-t-il encore des améliorations apportées à cet algorithme ? »

Bien sûr.

Il fonctionne déjà très bien aujourd’hui, les résultats sont assez surprenants.

Mais tout algorithme, surtout sémantique, se doit d’être amélioré. Notamment en ajoutant des synonymes et bien sûr ces fameux « filtres ».

Et puis, nous avons un second challenge avec cet algorithme sémantique : l’appliquer avec succès sur les Browse Nodes Amazon.

Les meilleurs vendeurs Amazon le savent : avoir bien paramétré ses Browse Nodes (voir en avec plusieurs par produits) est une des clefs pour gagner la fameuse « BuyBox ».

Si demain nous arrivons à faire tourner cet algorithme sémantique sur les Browse Nodes Amazon, nos clients devraient pouvoir surclasser leur concurrents sur cette Place de Marché de façon assez mécanique.

Bien sûr, nous vous tiendrons ici au courant.

Notre équipe reste à votre disposition pour vous faire tester notre logiciel ou vous fournir plus d’informations sur notre algorithme sémantique (contact@shopping flux.com ou 01 80 87 60 95)

Bonnes ventes à tous.

L’équipe Shopping Flux

Le Gestionnaire de Flux Nouvelle Génération

Post Footer automatically generated by Add Post Footer Plugin for wordpress.