Allo le monde !

Sauter Menu de l'activité

Texte encrassé

Voici ce que donne le décodage en UTF-8 d'un texte codé en ISO-8859-1.

Mauvais décodage

Que se passe-t-il ? Tous les caractères accentués sont remplacés par le symbole �.

Explication ! Rappelez-vous que les caractères accentués sont codés sur deux octets en UTF-8. Dès lors, les caractères accentués de la table ISO Latin-1 ne correspondent plus à rien en UTF-8 (car seuls les caractères non accentués sont codés sur un octet). Dans ce cas, Unicode UTF-8 attribue donc ce caractère qui est, en quelque sorte, le caractère inconnu.

Désormais, si le navigateur affiche une page Web contenant de tels caractères ou des groupes de caractères comme é, vous savez quoi faire .


Retour au livre