Unicode : 30 minutes d’UTF-8

Par Ebouquin

Lors de la conversion d’un ebook, mal formaté, il n’est pas improbable que votre convertisseur favoris retourne une erreur de codage. La cause est souvent un mauvais respect du codage en UTF-8. Qu’est-ce que l’UTF-8? Il s’agit d’un format de codage de caractères où chaque caractère ou graphème est représenté dans un répertoire universel. Ainsi, l’unicode (l’autre nom de l’UTF-8) permet une compatibilité avec toutes les langues et alphabets (notamment les langues asiatiques et le cyrillique. Le nombre de caractères supporté est assez impressionnant.

C’est aussi l’occasion de rappeler qu’aujourd’hui encore certains readers tels que le Kindle ne sont pas entièrement compatible avec le standard UTF-8. C’est un détail qui gêne rarement l’utilisateur européen mais pose des problèmes aux amateurs de russe ou de langues asiatiques. Du coup, il est nécessaire de passer par l’installation de hacks pour un support complet de ce format sur le Kindle 3. Allez Amazon, encore un petit effort…