Charset et encodage : ISO-8859-1 ou UTF-8 ?

Publié le 20 mai 2009 par Methylbro

Récemment on a pu me faire diverses critiques provenant du fait que j’utilise le jeu de caractères UTF-8. Ajoutez à cela le constat que j’ai déjà fait à de nombreuses reprises en observant mes stagiaires et/ou mes collègues de bureaux j’en ai déduit une chose : les gens ignorent tout sur les différents encodage des caractères !

Dans ce billet ; je ne vais pas faire un historique précis sur les différents encodage ou leurs histoires car bien d’autres articles en parlent déjà bien mieux que moi. Je vais juste revenir rapidement sur ce que sont ces si mystérieux « charset » et sur les raison qui font que je préfère l’emploi d’UTF-8.

Le premier point qu’il faut bien saisir ; c’est ce qu’est réellement un jeu de caractères, ce fameux charset. Comme vous le savez, en informatique le dénominateur commun de toute valeur à exprimer c’est le bit (0 ou 1). Bits que par la suite on associe par paquet de 8 pour pouvoir exprimer des valeurs plus complexe, c’est ce que l’on appelle des... Lire Charset et encodage : ISO-8859-1 ou UTF-8 ?