parlons un peu de référencement

Publié le 01 juin 2007 par Méven Cadare
Enfin un nouveau billet! T'en as mis du temps!
Je sais, je sais... Mais écrire ce billet m'a pris
du temps donc j'éspère qu'il vous plaira et vous
apprendra quelques trucs.     Le référencement comment que ça marche et comment qu'on fait pour qu'un site (ou blog) soit bien référencé ? z'allez voir c'que vous allez voir!

Les bases du référencement


C'est quoi le référencement ?

le référencement est l'ordre d'indexation des pages web sur un moteur de recherche.

Comment qu'ils font les moteurs de recherche pour trouver et classer les sites?

Les moteurs de recherches possèdent des robots (des applications) qui parcourent le web et "scannent" les pages des sites. C'est là qu'interviennent les critères de référencement. Ils correspondent tout simplement aux éléments sur lesquels s'arrêtent les robots et qui permettent au moteur de recherche de réaliser son classement avec pertinence.


Vite! Dis nous! c'est quoi les critères de référencement les plus importants ?
Hola pas si vite ! Du calme! réfléchissons un peu d'abord...
Aujourd'hui les 3 principaux moteurs de recherche sont Google, Yahoo et msn search. Google est de loin le moteur de recherche le plus utilisé (82% des recherches). Il est donc logique de concentrer ses efforts sur Google puis sur Yahoo (msn search et les autres moteurs de rcherches utilisent des critères différents généralement).
Bon y'en a marre de réfléchir! Dis nous ce que tu sais et que ça saute !
D'accord! D'accord! Mais procédons logiquement. Une page web c'est un peu comme un livre: avant de commencer à le lire on regarde d'abord le titre, la couverture et le résumé. toutes ces informations sont contenues entre les balises <head></head> de votre page.
Premier critère: le titre de votre page. Attention il ne s'agit pas du titre entre balise <h1></h1> (qui a aussi de l'importance mais ça on verra après...) mais bien du texte qui apparaît dans la barre de titre de votre navigateur et dans votre barre des tâches !
comment rendre un titre pertinent? Il faut savoir q'un titre peut contenir jusqu'à 100 caractères et qu'il est conseillé de choisir un titre de plus de 50 caractères.
Exemple:
<head>
<title>Miwi's blog: le blog le plus cool de l'univers rien que pour vous !</title>
</head>
Second critère: la description de votre page. Elle est placée dans une balise meta. ne paniquez pas il n'y a rien de plus simple il suffit de placer une balise avec le tag meta un attribut name="description" et un attribut content avec le contenu de votre description. Ici aussi il faut savoir que la descrption de votre page est efficace entre 150 et 200 caractères.
Exemple :
<head>
<title>Miwi's blog: le blog le plus cool de l'univers rien que pour vous !</title>
<meta name="description" content="de l'actu, de la musique, des creations, du fun, du web et plein d'autres choses! Qu'est ce que vous attendez? venez vite !" />
</head>
Quelques mots clés pour préciser le sujet Les mots clés sont des mots en relation avec le contenu de votre page on peut aussi les appeler "tags" (si! si! comme pour les articles de blog). Pour les définir on se sert également d'une balise meta mais avec un attribut name="keywords". Il suffit juste ensuite de mettre les mots à la suite séparés par des espaces dans l'attribut content. Pour que cette balise soit optimale, c'est simple plus il y a de mots clés (pertinents) plus elle fonctionne (elle peut contenir jusqu'à 1000 caractères! ).
Exemple:
<head>
<title>Miwi's blog: le blog le plus cool de l'univers rien que pour vous !</title>
<meta name="description" content="de l'actu, de la musique, des creations, du fun, du web et plein d'autres choses! Qu'est ce que vous attendez? venez vite !" />
<meta name="keywords" content="miwi blog actu musique fun video creation web" />
</head>
Quelques autres balises meta

Allez maintenant que vous voyez comment ça fonctionne et que je vous ai donné les principales je vous mets un exemple avec un joli bouquet de meta!
Exemple:
<head>
<title>Miwi's blog: le blog le plus cool de l'univers rien que pour vous !</title>
<meta name="description" content="de l'actu, de la musique, des creations, du fun, du web et plein d'autres choses! Qu'est ce que vous attendez? venez vite !" />
<meta name="keywords" content="miwi blog actu musique fun video creation web" />
<meta name="author" content="miwi" />
<meta name="identifier-url" content="http://www.miwispace.com" />
<meta name="Date-Creation-yyyymmdd" content="20070408" />
<meta name="reply-to" content="meven35@gmail.com" />
<meta name="robots" content="all" />
</head>
Voilà pour la couverture de notre livre !

EDIT: Selon SiM07 (qui s'y connait beaucoup mieux que moi en référencement) les balises meta et title ont perdu beaucoup de leur intérêt auprès de Google. En effet le moteur de recherche au logo multicolore se baserait plus sur ce qui vient après...

Mais le robot il lit pas à l'intérieur? Bien sur que si ! c'est même ce à quoi il accorde le plus d'importance! Sinon ce système manquerait d'efficacité ! Une fois notre balise <head> parcourue, notre petit robot va "scanner" le contenu de votre page. Une fois de plus il faut faire attention. Le contenu d'une page doit être optimisé pour notre petit robot sinon il passera son chemin!
Olala ! Il me gonfle celui là ! C'est pas faux... mais il est quand même là pour nous aider ! Surtout que vous allez voir, il suffit de petits riens pour que le passage du robot soit beaucoup plus efficace ! Ce sont justes quelques bonnes habitudes à prendre...
Du contenu dans le contenu... Là, il y en a qui commencent à lâcher prise et qui se disent: j'comprends plus rien ! Au secours ! Mais non c'est juste pour signifier que le terme contenu porte bien son nom. Les robots sont sensibles au nombre de caractères que comporte le texte de votre page. Ainsi le contenu textuel de votre page doit dépassé 300 caractères pour être mieux pris en compte.
Les images c'est bien mais avec un attribut alt c'est mieux !

Et oui! Tout le monde sait que les images mettent une page en valeur plus que toute autre chose. Mais malheureusement, notre robot ne peut les voir que si on place une balise alt à chaque image de notre page. Cet attribut n'est pas à négliger car si une image illustre votre page, sa balise alt illustre souvent son contenu ! L'attribut alt n'est pas à confondre avec l'attribut title d'une image. l'attribut alt s'ffiche à l'écran à la place de l'image quand celle-ci n'est pas présente à l'adresse spécifiée. L'attribut title quant à lui s'affiche à l'écran quand vous passez votre pointeur sur l'image sans cliquer dessus. Ces deux attributs sont d'autant plus nécessaire qu'ils facilitent la visite de votre site aux personnes malvoyantes ou nonvoyantes.

EDIT: notez que l'attribut alt des images permet leur intégration dans Google images. Il s'agit d'une source non négligeable de visites comme l'explique SiM07 dans son article. =>l'article sur la balise alt des images<=
Exemple:
<img src="http://www.miwispace.com/?post/2007/05/25/lechemindemonimage/monimage.jpg" titre="une description de mon image" alt="une description de mon image" />

Faites moi des beaux titres ! Une page avec un contenu intéressant est plus claire lorsqu'elle est bien organisée. En effet organiser son contenu à l'aide de balises de titre <h1>,<h2>,<h3>... améliore votre référencement tout simplement parce que les robots y sont sensibles.
les liens: internes, externes, entrants, sortants, ils ont tous de l'importance. Les liens, le principe même du web, comment imaginer ne pas leur accorder de l'importance?
la route des robots (une petite métaphore comme on les aime) Comme je l'ai écrit dans la définition succinte du référencement (en haut du billet), les robots n'analysent pas un site mais une page web et ses liens. Si on peut croire que c'est juste du chipotage sur la manière de le dire, c'est en fait très important pour comprendre le processus de référencement.
En effet, chaque lien représente un bout de chemin pour le robot. Imaginez un rond point qui raccorde des routes à sens unique. Chaque route peut soit partir de celui ci soit y arriver. Chaque route relie deux rond points entre eux. Maintenant, imaginez une ville qui comporte un certain nombre de rond points (et les routes qui vont avec). Puis enfin d'énormes autoroutes qui partent d'une énorme ville et qui relient les villes en série (une par une dans un ordre bien précis).
Voilà, le décor est planté.
Mais qu'est ce qu'il nous raconte ?! Ca y'est il est devenu complètement taré! Pourquoi il nous parle de rond points?
Mais non! c'est juste pour que vous compreniez mieux l'importance des liens dans le référencement et la notion de PageRank...
Vous allez voir:
Chaque rond points est une page web et chaque route à sens unique est un lien. Le lien est unidirectionnel et relie deux pages entre elles. Prenons un rond point bien précis. Chaque route qui arrive à ce rond point représente un lien entrant. Ceux qui en partent représentent les liens sortant.
Jusque là tout va bien!
Prenez ensuite la ville, elle représente votre site en entier avec toutes ses pages. Les routes qui relient ses rond points entre eux représentent les liens internes. celles qui partent des rond points de cette ville et qui arrivent aux rond points d'autres villes représentent les liens externes.
Pour finir une autoroute, ne représente pas un lien mais l'ordre d'indexation des pages pour un mot clé donné. Les sorties vers les différentes villes (vers un rond point de ces villes en fait) représentent les liens du moteur de recherche vers les différents sites (vers une page de ces site en fait!). L'énorme ville est, vous l'aurez compris, le moteur de recherche.
Maintenant que vous avez le schéma en tête on va balancer les robots. Les robots circulent dans les villes de rond point en rond point. A chaque rond point, ils admirent la superbe composition florale qu'il y a au milieu, s'il est bien entretenu et si les panneaux sont présent. En bref, ils font un bilan du rond point. Puis ensuite ils comptent les routes entrantes et sortantes et mettent une note. Une fois toutes ces vérifications éxécutées, il va aller vérifier tout les rond points qui sont au bout des routes sortant du rond point où il se trouve. Voilà le cheminement du robot.
Vous êtes maintenant en mesure de comprendre que plus une page comporte de liens entrant plus elle est visitée par les robots et que mieux le plus le contenu de la page est pertinent et organisé meilleur est son référencement! Vous pouvez aussi voir qu'une page sans aucun lien entrant (orpheline) n'a que très peu de chance de se voir un jour visitée par un robot...
C'est tout? Il regarde juste le rond point et ses liens sortant qui vont à des pages dans les villes reliées au moteur de recherche? Fastoche!
C'est à peu près ça, mais il y a autre chose encore. le moteur de recherche va plus loin. Il va classer les pages de celle qu'il juge la plus pertinente à celle qu'il trouve moins adaptée au mot clé (c'est l'ordre dans lequel les autoroutes relie les rond points). Et pour cela, il va utiliser un algorithme légèrement complexe qui est le Pagerank.
Google PageRank. Définition:

Il s'agit d'un algorithme utilisé par Google pour classer les différentes pages web en fonction d'un mot clé. Attention , il s'agit d'un outil parmi d'autes et avoir un bon PageRank n'est pas la seule chose à faire pour être bien référencé! (même si ça aide). Vous allez comprendre. Le PageRank d'une page est sous la forme d'une "note" comprise entre 0 et 10. Cet algorithme est basé sur deux principes simples. Le premier est que plus une page à de liens entrants, plus elle est importante et par conséquent mieux elle sera référencée.

C'est ça ton truc compliqué? c'est trop simple! J'obtient 10 liens entrants et hop j'ai un PR10!

Et bien non c'est beaucoup plus compliqué que ça! (heureusement sinon ça n'aurait plus aucun intérêt!). Voilà donc le second principe. Si une page à haut PageRank fait un lien vers une autre page, celle-ci doit être importante. Et c'est comme ça qu'on arrive à l'algorithme.

L'algorithme: explication simplifiée du PageRank.

Nous y voilà. Pour mettre en oeuvre les deux principes énoncés si dessus, Google à eu une idée simple attribuer un potentiel de PR à chaque page qui serait la somme du potentiel obtenu des liens entrants de cette page. Et ce potentiel se transforme en PR par la suite. On estime que le potentiel de PR d'une page vaut son PR-1 log x (x entre 5 et 8). Par exemple une page avec un PR1 a un potentiel compris entre 0 et 5. une page qui a un PR5 a un potentiel compris entre 1024 et 3125 !

Mais comment on fait pour avoir du potentiel de PR ?

en fait chaque page "distribue" (entre guillemet car elle ne perd par son potentiel) à peu près 85% de son potentiel de PR entre tout les liens sortant qu'elle réalise. C'est à dire que si elle fait 5 liens sortant, une page va distribuer 1/5 des 85% de son potentiel de PR à chaque page. Pour mieux comprendre toute cette histoire, on va reprendre nos rond points.

Imaginez que 100 voitures arrivent par différentes routes sur rond point. la somme des voitures représente son potentiel de PR (son PR serait de 3 vu que 2log5<100<3log5 ). maintenant on imagine qu'il y a 10 rues à sens unique qui partent de ce rond point. Le rond point va donc distribuer 85 voitures à ces autres rond points soit à peu près 8 voitures à chacun.

Ahhh OK! Finalement c'est pas si compliqué!  

Voila maintenant vous presque tout compris! Il ne me reste plus qu'à vous présenter un outil en plus pour améliorer votre référencement: les sitemaps.

Google sitemaps

C'est quoi ce truc encore?

Il s'agit d'un outil utilisé par les moteurs de recherche (Google, Yahoo...) pour mieux indexer ses pages. il se présente sous la forme d'un fichier (xml ou php) qu'on place à la racine de son site. Grâce à ce fichier, le moteur de recherche sait à quelle fréquence optimale il doit visiter les pages de votre site. Un sitemap, comme son nom l'indique, est aussi une "carte" ou un "plan" de votre site. Il permet donc aux robots de mieux circuler dans votre site.

Mais qu'est ce qu'on met dans le fichier?

oula par contre je n'ai pas beaucoup d'information sur ce sujet. Pour ma part j'utilise une extension Dotclear qui est appelée  "Sitemaps" (bizzarement). Sachez toutefois qu'il existe des applications en ligne qui crée votre fichier sitemaps à votre place juste en entrant l'url de votre site.

pour les dotcleariens, veuillez suivre ce lien: Sitemaps.Il s'agit de l'extension "Sitemaps" pour dotclear 2.

Astuce

Allez une petite astuce avant de vous quitter !

La plupart des moteurs de recherche permettent de proposer votre site à l'indexation. De cette manière ils envoient leur robot consulter vos pages. C'est utile si vous n'avez pas beaucoup de liens vers votre site car le premier passage des robots se fait parfois attendre...

EDIT: Plus qu'une astuce, c'est un grand facteur de bon référencement que SiM07 m'a donné. Faîtes en sorte que votre page principale (index) soit placé le plus possible A LA RACINE de votre site. Cela joue un rôle important dans le référencement.


Aller plus loin...

Voila, j'éspère vous aura éclairé sur le référencement. Je pense que je vais écrire d'autres article de ce type (un toutes les deux semaines car ça prend du temps et je n'en ai pas forcément...). Le prochain devrait être le tutoriel GIMP (avec quelque adaptations pour photoshop) sur l'effet popart (andy warhol) que j'ai promis.

Sur ce à vos claviers !

EDIT: Merci à SiM07 d'avoir lu et critiqué ce billet. Cela me permet de l'améliorer et de raconter moin de conneries 8D.