Le marché du web analytics en France et plus largement en Europe est en développement. De nouvelles sociétés se sont lancées dans le domaine du conseil et accompagnent de plus en plus d’entreprises, qu’elles soient pure player ou non. Le travail d’évangélisation commence donc à porter ses fruits et de plus en plus de sociétés sont désormais conscientes de la valeur ajoutée que peut leur apporter le web analytics et cela quelque soit le ou les modèle(s) économique(s) de leur site Internet. Il ne leur reste plus qu’à franchir le pas. Chez nos voisins américains, le marché du web analytics est déjà mature. Le cabinet d’étude Forrester prévoit d’ailleurs que la valeur du marché atteindra les 1 milliard de dollars uniquement pour les Etats-Unis en 2014. C’est dire le potentiel et le chemin qu’il reste à parcourir en France et en Europe.
Face à cet engouement, je pense que le moment est venu de prendre du recul et de retracer les grandes étapes de l’évolution de la discipline depuis la création du marché par la société Webtrends en 1993 jusqu’à aujourd’hui. Cela nous aidera à mieux comprendre ce qui se passe actuellement et à anticiper ce qu’il se passera cette année.
Cet article comprend des passages techniques expliquant le fonctionnement de base des outils. J’ai veillé à ce que ces passages restent simples et compréhensibles pour tous.
Il est composé de six parties auxquelles vous pouvez… accéder directement grâce aux liens suivant :
- Définition du web analytics
- Le web analytics, à quoi ça sert ?
- Retour sur les principales avancées de la discipline de 1993 à nos jours
- Focus sur l’année 1993 et le début de l’analyse web grâce à la récolte des données via les fichiers logs
- Schéma simplifié du fonctionnement de la récolte des données via l’analyse des fichiers logs
- Extrait d’un fichier log
- L’année 1997 et l’arrivée de la méthode de récolte des données via les marqueurs javascript
- Schéma simplifié du fonctionnement de la récolte des données via les marqueurs javascript
- Frise chronologique de l’évolution des principales solutions de web analytics de 1993 à nos jours
- Analyse de cette évolution
Définition du web analytics
Le web analytics c’est la mesure, l’analyse et le reporting du comportement des internautes dans le but de comprendre et d’optimiser l’utilisation de votre site internet.
Le web analytics, à quoi ça sert ?
Le web analytics a pour objectif d’augmenter la rentabilité de votre site internet.
Depuis des années, l’acquisition de trafic est le domaine du e-marketing le plus populaire au détriment des domaines de la conversion et de la fidélisation. Trop d’entreprises oublient que leur site internet ne vit pas grâce à l’acquisition de trafic mais bien grâce à sa monétisation et donc aux visiteurs que le site réussi à convertir en client. Ce taux de conversion est de 55% dans les magasins physiques, c’est-à-dire que plus d’une personne sur deux qui entre dans un magasin achète. Ce taux tombe à 1,8% sur Internet pour les sites e-commerce, c’est très peu et cela laisse une grande marge d’amélioration.
Concrètement, le web analytics se résume à la récolte, l’analyse et à la mise en place de recommandations basées sur les données recueillies par un outil de mesure d’audience.
Retour historique sur les principales avancées de la discipline de 1993 à aujourd’hui
La récolte des données par les outils de mesure d’audience peut se faire via deux méthodes :
- L’analyse des logs (ou fichier journal) des serveurs web
- L’utilisation des marqueurs JavaScript
Voici un schéma retraçant les principales étapes de l’évolution du web analytics :
Vous trouverez cette frise ainsi que celle située à la fin de l’article dans ce fichier pdf.
1993 : début de l’analyse web, trois ans après la création du protocole http et d’Internet
L’analyse web (traduction de web analytics) est née grâce au protocole http qui a la particularité d’enregistrer chaque échange entre le visiteur et le site internet dans un fichier log ou fichier journal. C’est grâce à ces données que l’analyse du comportement des internautes a pu débuter.
Un protocole est un ensemble de règles définies pour un type de communication. Si on veut trouver un comparable dans la vie courante, le protocole utilisé pour parler avec une autre personne pourrait être le langage. Il y aurait alors un protocole français, anglais ou encore français canadien (sans vouloir vous vexer cher amis d’outre atlantique, certaines de vos expressions nécessitent une explication
Le protocole http est le protocole que nous utilisons tous les jours pour afficher les pages web des sites internet que nous visitons. Nous l’utilisons inconsciemment en le renseignant dans la barre d’adresse de notre navigateur web (ou fureteur en canadien), lorsque nous souhaitons visiter un site :
Emplacement du protocole HTTP et du WWW dans une adresse Internet classique
Vous connaissez surement d’autres protocoles comme le protocole https qui est une version sécurisée du protocole http ou encore le protocole ftp par exemple.
Le protocole http a été inventé en 1990 par Tim Berners-Lee avec les adresses Web et le langage HTML pour créer le World Wide Web (qui est la signification de l’acronyme www visible dans la majorité des adresses web également).
Voici un schéma simplifié représentant le fonctionnement de la récolte des données via l’analyse des fichiers logs :
Vous trouverez ce schéma ainsi que celui concernant les marqueurs javascript dans ce fichier pdf.
Voici un extrait de fichier log ou fichier journal :
Extrait d'un fichier log ou fichier journal
Le premier travail des outils de mesure d’audience fonctionnant à partir de l’analyse des logs est d’attribuer chacune des demandes (chaque ligne du fichier log correspond à une demande de la part du navigateur web) au bon visiteur. Cela permet ensuite de reconstituer les visites de chacun d’eux.
Ces demandes sont aussi appelées des hits. L’analyse des logs était une solution adaptée au début du web (de 1990 à 1996) où les pages étaient des pages statiques composées quasi-exclusivement de texte et de liens. Un appel ou un hit était donc équivalent à une page. Les pages se sont aujourd’hui beaucoup enrichies avec l’arrivée d’images, de vidéos, d’animations, de feuilles de style sans parler de technologies comme l’Ajax ou le Flex. Etant donné que chaque hit correspond à l’appel d’un élément de la page, le nombre de hits pour une page mesure donc dorénavant plus sa complexité que sa réelle popularité.
Le nombre de hit est aujourd’hui une donnée utile uniquement pour la DSI (Direction des Systèmes d’Information) afin de mesurer le taux de charge des serveurs web.
La récolte des données s’est trouvée faussée également avec l’apparition des moteurs de recherche et de leur robot, des serveurs proxys permettant de surfer anonymement, de l’attribution d’adresses IP dynamiques par les fournisseurs d’accès à Internet et des techniques de mise en cache des contenus. Toutes ces nouveautés ont rendu inadéquat l’utilisation des fichiers logs pour analyser le comportement des internautes. Les données contenues dans les fichiers logs étaient en effet biaisées et l’identification du visiteur unique quasi-impossible. Il y a aussi le fait que les services marketing se sont vite appropriés le web du fait de sa valeur ajoutée. L’analyse des fichiers logs étaient donc pour ces services une méthode trop technique pour être facilement utilisée.
La mesure d’audience par l’analyse des logs était donc devenue inadaptée… Les éditeurs de solution de web analyse ont dû faire évoluer leur méthode de récolte des données avec l’évolution d’Internet.
1997 : première utilisation de la méthode de récolte des données par marqueurs (tags en anglais)
La méthode qui a été retenue est celle de l’utilisation des marqueurs javascript. C’est la méthode la plus répandue aujourd’hui. La méthode de récolte des données via l’analyse des logs est toujours utilisée mais de manière très minime. A noter aussi que certains outils de mesure d’audience utilisent une méthode hybride qui combine l’utilisation des fichiers logs et des marqueurs javascript.
Fonctionnement des marqueurs ou tags
Un marqueur javascript doit être inséré soigneusement sur toutes les pages du site Internet. Le marqueur est exécuté au chargement de la page, il récolte les informations de la visite en cours et les envoie à un serveur distant ou local suivant l’outil de mesure d’audience utilisé. L’outil reçoit les informations de la visite, les associe à la bonne visite et les stocke enfin en base de données.
Voici un schéma simplifié représentant le fonctionnement de la récolte des données via les marqueurs javascript :
Vous trouverez ce schéma ainsi que celui concernant les fichiers logs dans ce fichier pdf.
Les marqueurs javascript ont résolu les problèmes inhérents aux fichiers logs et permettent aujourd’hui de quasiment tout mesurer, des transactions e-commerce jusqu’au nombre de clics effectués sur n’importe quel élément de la page.
Seul le nombre de visiteurs uniques reste et restera à mon avis toujours approximatif.
Frise chronologique de l’évolution des principales solutions de web analytics de 1993 à nos jours
Voici une frise chronologique retraçant l’évolution du marché des éditeurs de solution de web analytics jusqu’à aujourd’hui :
Vous trouverez cette frise ainsi que celle située au début de l’article dans ce fichier pdf.
On remarque que le marché a évolué modérément jusqu’en mars 2005. A cette date, Google a fait son entrée et a donné le rythme en rachetant Urchin software en mars 2005 et en sortant Google Analytics en novembre 2005, soit seulement 8 mois plus tard. La seule notoriété de la marque Google constitue un avantage énorme pour l’adoption de leur solution Google Analytics qui est de plus gratuite et dont les fonctionnalités évoluent très rapidement. C’est clairement un chantier prioritaire pour la firme de Mountain View. Google grignote petit à petit les parts de marché détenues par les outils de mesure d’audience historiques. Cela malgré le fait que ces outils proposent des fonctionnalités avancées et des caractéristiques dont ne dispose pas l’outil de Google comme la propriété des données, la garantie de service etc. Pour l’instant, les sociétés matures en terme de web analytics utilisent les outils payants pour répondre pleinement à leur besoin et les sociétés débutantes dans le domaine se tournent plutôt, en premier, vers des outils gratuits. La solution de Google a été un énorme coup d’accélérateur pour l’industrie et les outils de mesure d’audience payants doivent redoubler d’effort pour maintenir l’avance qu’ils ont sur Google Analytics. A noter aussi l’arrivée de Yahoo! Web Analytics qui est une solution gratuite elle aussi. Yahoo! Web Analytics offre une alternative de taille à Google Analytics étant donné qu’elle est plus évoluée sur certains points. Cette solution peut donc être utilisée par des sociétés matures en terme de web analytics en offrant l’avantage d’être gratuite… Elle reste cependant encore méconnue en Europe, je tacherai de vous la faire découvrir grâce à ce blog dans de prochains articles.
Comme vous pouvez le constater, le marché évolue très vite. Quand on sait que sur Internet l’un des principaux facteurs clés de succès est la rapidité d’exécution, il faut s’attendre à de nouvelles annonces très rapidement et régulièrement !
A vous la parole !
Des questions ? Que pensez-vous de cet article ? Quelles sont vos prévisions pour cette année 2010 ? Selon vous, comment va évoluer la cohabitation entre les outils gratuits et payants ? Êtes-vous intéressé par Yahoo! Web Analytics ? …
J’attends vos commentaires avec impatience ! N’oubliez pas que mon objectif principal est d’avoir vos avis afin que l’on échange tous ensemble, merci d’avance.