Magazine Internet

Référencement avec Google

Publié le 31 mars 2009 par Ekevin

Le guide officiel du référencement de Google est sortie en novembre 2008 (Google’s Search Engine Optimization Starter Guide). Comme le titre anglais et l’introduction l’indique, ce guide s’adresse surtout aux webmasters pour que votre site soit bien crawlé et indexé par Google.

Même si le document ne fait que 22 pages, nous regretterons l’absence d’un sommaire. Cependant, je vous détaillerais les principales rubriques du document ainsi que les principaux points de ces derniers pour vous aider à bien démarrer votre référencement.

Optimiser son site pour le référencement implique de faire des modifications sur son site, même si vous connaissez certaines astuces, certains procédés expliqués ici pourront vous être utiles. Que vous essayer de référencer Wordpress, Joomla, un autre CMS ou site réalisé par vous-même, ces astuces vous seront très utiles.

Les modifications indiquées par Google peuvent en général s’appliquer sur d’autres sites, et de fait améliorer votre référencement non seulement sur Google, mais sur les autres moteurs de recherches comme Yahoo, AOL, Altavista et bien d’autres.

Dans ce qui va suivre nous évoquerons les balises meta et leur impact sur le moteur de recherche (titre, description), la réécriture d’url avec le fichier htaccess ou comment avoir des liens parlants, le plan du site, le contenu de vos pages (texte, ancres, lien interne au document, titres, images), le fichier robots.txt, le nofollow et nous terminerons sur des pistes pour faire la promotion de votre site, surveiller ses statistiques.

Ce document se divise en plusieurs points et regroupent les principales parties du document de Google. Ce qui va suivre n’est pas une traduction au mot près mais un résumé synthétique et subjectif.

Il est conseillé mais pas nécessaire d’avoir quelques notions de HTML pour ce qui va suivre.

Les balises meta

Les balises meta font partie intégrante de votre site, elles peuvent avoir plusieurs rôles. Généralement, si vous avez déjà effectué des recherches sur la toile ou pire si vous avez acheté un livre sur le référencement très sommaire, vous avez pu lire que les balises meta sont une étape importante dans le référencement de votre site.

Ceci n’est ni vrai, ni faux à vrai dire. Les conseils donnés en général sont trop poussés. Nous passons trop de temps à comprendre comment les remplir plutôt que de connaître leur impact sur le référencement.
À vrai dire, seulement deux balises sont vraiment importantes : title et description.

La balise title indique le titre de votre page, celle-ci doit être unique pour chaque page. Imaginons simplement un livre contenant un sommaire avec des titres uniques, ce serait très déstabilisant pour le lecteur !

Un titre se doit alors d’être unique mais aussi pertinent. À ce sujet il n’y a pas vraiment de formule magique pour choisir son titre, mais en général, nous essayons de mettre environ 10 mots. Ces 10 mots viennent du fait que sur les moteurs de recherches, nous ne trouvons que rarement des titres qui tiennent sur deux lignes.

Le titre mis en place, apparaît sous plusieurs formes quand vous surfez sur le net. Premièrement il apparaît en haut de la fenêtre de votre navigateur, et deuxièmement, quand vous faites une recherche c’est cette balise qui donnera le titre de votre page. Vous pouvez faire un test en tapant sous Google “pasunclou référencement”, vous verrez alors plusieurs titres dont celui de cette page.

Il en est presque de même pour la balise description. Les moteurs de recherches peuvent ou pas l’utiliser lors d’une recherche, tout dépend des mots que le visiteur à entré dans le moteur de recherche et du site web que vous avez mis en place. En tout cas, vous ne pouvez pas passer chaque jour 10 minutes à essayer de faire un résumé si vous publier beaucoup de ressources sur votre site.

Si vous décidez de l’utiliser vous devez faire un résumé reprenant les mots importants de votre contenu, et faire en sorte que cette description soit unique pour chaque page.

Attention n’essayez pas d’inclure des mots dans votre titre ou votre description pour attirer des visiteurs si votre contenu n’a rien à voir avec ces mots ! Ceci ne ferait que vous discriminer !

Des liens parlants

Avoir des balises meta et un contenu cohérent et organisé n’implique pas forcément d’avoir des URL parlantes. Les URL doivent être faciles à retenir pour un humain. Il va de soi que l’adresse suivante n’est pas très convaincante dans un moteur de recherche ou aux yeux d’un visiteur :

http://example.com/?send=request&blablabla

Vos adresses doivent être les plus précises possible, en reprenant si possible la catégorie dans laquelle s’insère votre page ainsi que son titre. Cette adresse sera reprise dans les moteurs de recherches, et une adresse contenant des mots clefs cohérant l’emportera sur une adresse avec des identifiants de sessions.

http://example.com/blog/ceci-est-mon-article/

Deux méthodes pour réaliser ceci, d’une vous pouvez organiser le contenu de votre site à la main ou utiliser la réécriture d’URL avec .htaccess.
Votre contenu doit avoir une structure logique, en voici un exemple (nous supposons que vous ayez un blog et des articles sur une association) :

/
/blog/
       /cat1/
       /cat2/
       /cat3/
/association/
       /cat1/
       /cat2/
...

De ce fait il sera possible d’avoir des informations en tapant http://example.com/blog/cat1 pour connaître ce qui se cache sur votre blog dans la catégorie 1.
Cette disposition théorique est très importante et rejoins de près la partie suivante concernant le plan du site.

Le fichier .htaccess permet de réécrire dynamiquement vos URL. Lorsque vous utilisez un CMS ou un framework, les URL doivent être réécrites. En général, il existe des snippets sur les pages respectives de ses solutions pour ne pas plonger dans les règles d’écriture de ce fameux fichier. À noter, qu’il faut activer le module de votre serveur pour bénéficier de cette option.

Plus de lecture :
Activer la réécriture d’URL sous Apache2 avec mod_rewrite
Créer facilement votre .htaccess
Exemple de mise en place du fichier htaccess avec Wordpress et Joomla

Le plan du site

Une fois que l’organisation de votre site correspond à ce que vous voulez exprimer, il faut utiliser quelques outils pour indiquer aux lecteurs comme aux robots ce que vos documents numériques contiennent.

Le fil d’Ariane, permet d’un coup d’oeil de savoir où nous sommes sur le site. En reprenant l’exemple du blog ci-dessus, supposons que par l’intermédiaire d’un moteur de recherche j’arrive sur la page suivante : http://example.com/blog/cat1
Je possède alors des indications sans avoir regarder le contenu que je suis dans la partie blog du site et plus précisement dans la catégorie 1. Le fil d’Ariane ajoutera un support visuel pour indiquer au visiteur où je suis. Pour notre exemple il indiquera :

blog > categorie 1

Ainsi si nous voulons remonter l’arborescence, il nous suffit de cliquer sur blog.

Avoir un sitemap vous permettra également d’indiquer aux moteurs de recherches les pages de votre site internet. Le sitemap indiquera au moteur quelles sont les nouvelles pages à explorer. Pour en créer un il existe beaucoup de ressources en ligne le faisant automatiquement. Si vous possédez un CMS il suffit de rechercher dans la liste des plugins un module permettant de le créer dynamiquement.

Attention à vos erreurs 404. Une telle erreur indique que la page indiquée n’existe pas ou plus. Une redirection à l’aide du fichier .htaccess est alors nécessaire pour rediriger les robots et les visiteurs. Vous pouvez également créer une page d’erreur 404 personnalisée indiquant en lien les ressources pouvant intéresser le lecteur.

Un contenu de qualité

Par contenu de qualité il faut bien comprendre ce que j’entends par qualité. Un contenu de qualité n’est pas forcément un contenu à caractère scientifique. Bien au contraire, la qualité est un ensemble de règle répondant à une demande. Si je produits un document pour un public particulier, la qualité sera le fait de se rapprocher le plus de ce public.
La qualité n’est donc pas quelque chose répondant à de hauts standards mais répondant à une demande particulière.

De fait, la qualité dans votre blog se verra par le choix des titres dans votre document, aussi bien sémantiquement qu’au niveau du code. Il existe des balises pour organiser ses titres (h1, h2, h3…). Ces titres agissent de manière descendante. Ainsi h1 sera le “gros titre”, h2 sera un sous-titre de ce dernier… et ainsi de suite.
Ces titres, comme le titre de vos pages (balise title) devront respecter le contenu de votre page et se rapprocher le plus possible de ce que vous exposez.
De la même façon votre texte devra contenir des mots clefs spéciaux et suivre le ton que vous voulez donner à la page. Si vous parlez de jambon en boîte (spam), alors le titre du paragraphe et le titre de votre page devront être en rapport.

E’egalement, n’ h’esitez pas à respecter les standards du W3C (validateur html et css) sans en faire une fin en soi non plus, en mettant des attributs alt à vos images, en n’utilisant pas les hacks CSS… Plus d’informations en validant votre page.

De toute manière gardez en tête que vous vous exprimez à des humains et non à des moteurs de recherches. Si ce dont vous parlez peut intéresser du monde, alors il y aura des chances que votre contenu soit repris sur un autre site.
Après tout c’est aux moteurs de recherches de faire l’effort de voir ce qu’il y a comme contenu et non à vous de faire voir aux moteurs de recherches ce qu’ils peuvent montrer.

Ajoutons pour finir cette partie, que les liens représentent également un signe parlant pour les moteurs de recherches comme pour les visiteurs. Reprenons notre article sur le spam et lions quelques liens internes et externes. Les liens internes reprendront des articles antérieurs de votre site sur les Monty Python (par exemple) afin de montrer ce fameux sketch ou encore pour montrer cette fameuse reproduction de la carte du sketch. Des liens externes pointeront vers le site officiel, ainsi que vers d’autres sites de fans.
Le visiteur tombant sur cette référence n’en sera alors que ravi de pouvoir prolonger la lecture sur le sujet recherché. Le moteur de recherche, lui pourra mieux catégoriser et analyser votre page en disposant de plus de ressources.

Comment profiter des avantages du fichier robots.txt

Le fichier robots.txt indique aux robots crawlant votre site quel contenu il a accès et quel contenu il n’a pas accès. Ce fichier se place à la racine de votre site et doit pouvoir se consulter selon le modèle suivant : http://example.com/robots.txt

Ce fichier indiquera quel contenu doit être référencé par le moteur de recherche et quel contenu ne doit pas l’être. Par exemple, si vous disposez d’une zone administration pour gérer votre site, il peut être utile de ne pas l’indexer sur les moteurs de recherches.

Voyons tout de suite un exemple du fichier robots.txt

User-agent: *
Disallow: /images/
Disallow: /admin/

User-agent: * indique que précisons une régle pour tous les robots. À la place de l’astérisque vous pouvez préciser un moteur de recherche spécifique. Ainsi vous pouvez définir votre stratégie de référencement pour chaque moteur de recherche.

Nous indiquons ici que les robots ne doivent pas référencer le répertoire images ainsi que le répertoire admin par la directive Disallow. Attention cependant, ne confondez pas le fichier robots.txt avec une méthode pour sécuriser vos données. Vous préférerez une méthode d’identification pour restreindre l’accès à des contenus sensible.

Vous pouvez générer automatiquement votre fichier grâce à l’interface pour les Webmasters de Google ou encore grâce au site McAnerin.

La directive nofollow

Vous ne le savez peut-être pas, mais il y a quelques années quand les sites s’ouvraient aux commentaires il était difficile de faire face aux spams. Pour celà les développeurs ont ajouté le paramètre rel=”nofollow” indiquant aux moteurs de recherches de ne pas suivre ou transmettre la réputation de votre site vers celui indiqué. Aujourd’hui les CMS et autres outils permettant aux utilisateurs du Web de s’exprimer sur votre site prennent en charge la gestion du spam. Ainsi, seule une infime partie des spams passent sur votre site. Le nofollow devient donc non nécessaire. Il est utilisé par les référenceurs à des fins pratiques.

Plus de lecture sur le site ilonet

Promouvoir son site

Beaucoup de gens possédant un site vous le diront. Il ne sert à rien de parler de sujet que vous ne connaissez pas. Premièrement, c’est une réelle perte de temps et deuxièmement, vous risquez de perdre votre crédibilité.

Si vous avez un commerce et que vous avez décidé de franchir le pas en achetant une solution e-commerce ou que vous écriviez sur votre passion, les moteurs de recherches sauront repérer le contenu dans vos pages.

Pour débuter il faut pouvoir permettre à ses visiteurs de pouvoir suivre ce qu’il se passe sur votre site, en proposant un Flux RSS, une newsletter…

Enfin n’hésitez pas aussi de faire le lien entre votre site et votre habitation. Il peut-être intéressant de diffuser son site autour de soi.

Ne cherchez pas à référencer votre site sur 10000 annuaires, ciblez vos besoins en fonction de la catégorie dans laquelle s’inscrit votre site.

Une des tendances fonctionnant assez bien est d’utiliser ce que nous appelons les médias sociaux pour faire parler de votre site. Il en existe pour tous les goûts n’hésitez pas à lire les comparatifs sur le Web.

Enfin surveiller votre site et utilisez les données accumulées à votre avantage, ce que nous verrons brièvement dans la dernière partie.

Surveiller son site

Il existe une multitude d’outils pour surveiller son site. Pour commencer il vous faut un outil capable de collecter des données, comme d’où viennent les visiteurs de votre site, quels sites ont un lien sur votre page, qu’elles sont les pages les plus consultées, les mots clefs recherchés sur les moteurs de recherche, etc…

Citons à titre d’exemple les outils Google pour le Webmaster, permettant de surveiller son PageRank, son fichier robots.txt, ses pages 404… Google Analytics collectant toutes les informations sur vos visiteurs ou son alternative Open Source souvent évoqué sur ce blog : Piwik. Les sites d’audits automatiques comme popuri ou d’autres cités sur ce blog.

Enfin n’oubliez pas que l’avis d’un spécialiste ne sera jamais remplacé par tous ces outils, n’hésitez pas à poser vos questions sur les très bon forums informatique francophone.


Retour à La Une de Logo Paperblog

A propos de l’auteur


Ekevin 5 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte