Magazine Culture

La recherche sémantique pilotée par la catalogue : partie 2

Par Frédéric Denel

Suite de http://www.compario.net/post/La-recherche-semantique-pilotee-par-la-catalogue--partie-1.aspx 

Il est capital de disposer d’un outil de gestion du catalogue moderne et souple pour piloter les offres

De prime abord, on pourrait penser que les technologies des moteurs de recherche sont parfaitement adaptées à cette demande de souplesse. En effet, rien n’est plus souple qu’un moteur de recherche en terme d’usage : quelques mots clef et le résultat s’affiche immédiatement.
De plus, historiquement, la recherche par facettes a été popularisée avant tout par les moteurs de recherche du E-Commerce.
On utilise donc de plus en plus les moteurs de recherche pour générer des pages de navigation, et en parallèle certains éditeurs enrichissent leur moteur de recherche de fonctions de manipulation du catalogue (adjonction de caractéristiques dédiées à la navigation par facette, merchandising de la liste de réponse  ...).

Plusieurs questions se posent alors naturellement :
La technologie des moteurs de recherche est elle adaptée à la génération de pages de navigation sur le site ?
C’est d’abord une affaire de compromis. En effet, la technologie des moteurs de recherche est extrêmement souple à mettre en oeuvre. Elle semble de prime abord adaptée. Néanmoins, il ne faut pas oublier un point crucial. La recherche par mot clef, base algorithmique des moteurs de recherche, est conçue pour retrouver très rapidement un ou plusieurs termes au sein d’index qui sont optimisés dans cette optique. Si on fait abstraction des mots clefs, la recherche est beaucoup plus consommatrice en ressources machine.
Réaliser une plate-forme de navigation à partir des technologies de recherche par mot clef est donc beaucoup plus coûteux qu’à partir de bases de données. L’avantage revient naturellement aux moteurs de recherche quand il s’agit de naviguer dans des réponses à partir de mots clefs.
Il est donc plus efficace et logique d’utiliser les bases de données pour la navigation, et un moteur de recherche pour la recherche par mot clef. De nombreux exemples d’implémentations illustrent parfaitement cette problématique.
Le rôle du moteur de recherche est-il d’enrichir le catalogue pour son seul usage ?
Certains éditeurs d’outils de recherche considèrent que le moteur de recherche doit disposer de fonctions d’enrichissement du catalogue.
Cette approche nous semble inutile, et dangereuse car la recherche par mots clés représente souvent moins de la moitié des demandes de recherche des internautes.
Là où un moteur SQL peut servir plusieurs dizaines de requêtes simultanées, un serveur de recherche se limitera en moyenne à un volume 5 fois moins important.
Traiter de façon spécifique le catalogue uniquement pour la recherche revient à oublier plus de la moitié des internautes, donc diviser la productivité de son personnel par deux également.
Il apparait beaucoup plus logique de réaliser l’enrichissement du catalogue de façon homogène, au sein d’un outil qui sera utilisé tant pour la navigation que pour la recherche par mot clef.
On gagne alors sur deux tableaux : à partir d’un catalogue riche, la navigation sera très ouverte et très simple, que l’on passe par la navigation traditionnelle, la navigation guidée ou bien la recherche par mot clef.
Le merchandising doit-il être spécifique au moteur de recherche ou bien doit-il plutôt reprendre automatiquement les règles décidées pour la boutique dans son ensemble ?
Pourquoi réaliser spécifiquement pour les résultats du moteur de recherche des opérations de merchandising quand elles doivent aussi être définies pour la navigation ?
Notre point de vue est simple : c’est une perte de productivité. Le moteur de recherche doit s’appuyer sur le merchandising pour afficher ses résultats, tout en ne perdant pas de vue que l’internaute attend d’un moteur de
recherche qu’il soit avant tout pertinent. Quelqu’un qui recherche une “baignoire” s’attend à trouver des baignoires avant les produits de nettoyage pour baignoire, sinon, on peut considérer qu’il aurait sans doute cherché des produits de nettoyage.

La recherche sémantique pilotée par la catalogue : partie 2

Le bon choix est donc de s’appuyer sur le merchandising pour organiser les listes de réponses. Il est alors possible de :
• signaler les produits qui bénéficient d’un traitement particulier au sein de la liste de réponse,
• s’appuyer sur le merchandising pour trier les produits proposés par le moteur de recherche (à pertinence égale, montrer celui en promo en premier, ou bien celui qui transforme le mieux, ...)
• créer des espaces spécifiques dans la liste de réponse pour traiter particulièrement certains produits.
Chaque cas étant particulier, l’architecture technique doit permettre une grande créativité pour s’adapter à ces nombreuses possibilités.
La possibilité d’enrichir le catalogue librement est primordiale, c’est sans doute le plus important à retenir, mais le moteur de recherche n’est pas l’outil le mieux adapté pour cette tâche.

La recherche sémantique pilotée par la catalogue : partie 2

L’étude des requêtes provenant de la navigation ou du moteur de recherche sur les sites montre deux usages distincts :
• la moitié des recherches environ repose sur des recherches qu’on peut apparenter à des recherche de type “famille”, c’est à dire soit des termes génériques, des familles de produits, des marques, ... Ces recherche devraient idéalement pointer vers des pages de navigation du site. On pense ici aux requêtes “canapé”, “tee shirt”, “lecteur DVD”, “baignoires”, ... Ces requêtes sont très génériques et elles vont avoir tendance à renvoyer de nombreux résultats.
• l’autre moitié sera plus pointue, il s’agit d’une recherche d’un produit, d’une référence. Ici l’enjeu ne sera pas tant de montrer le merchandising, mais vraiment de trouver le bon produit.
Les deux cas étant très différents, il faut les traiter distinctement : dans le premier cas le système de recherche du site doit être capable de montrer les rayons, familles, ... créés pour inviter l’internaute à se rendre directement sur les pages de navigation du site. Une recherche “disque dur” proposera par exemple un lien vers les familles de navigation (disques durs internes, disques durs externes, ...) en plus des réponses candidates. Dans le second cas, le moteur doit renvoyer directement vers le bon produit ou le produit le plus proche.
La puissance des moteurs de recherche permet de générer une réponse même dans les cas les plus improbables et sur des catalogues de très grande taille en incluant de multiples facettes mais il n’est pas adapté pour gérer la totalité de la navigation du site et encore moins pour la gestion de catalogue et d’arborescence virtuelle.

La recherche sémantique pilotée par la catalogue : partie 2

Pour finir, le merchandising devrait être lui aussi être réalisé au sein du catalogue, afin d’être réutilisé par le moteur de recherche
En résumé, un moteur de recherche doit s’appuyer sur les outils de gestion de cataloguepour en tirer une productivité maximale ainsi qu’une amélioration notoire des résultats de recherche. 


Retour à La Une de Logo Paperblog

A propos de l’auteur


Frédéric Denel 1 partage Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte