Encodage des caractères

DonRep 17

Résumé du cours

L’encodage des caractères en machine a évolué en même temps que le développement de l’informatique:

  • années 50: chaque marque utilise un encodage différent.
  • années 60: L’ASCII (American Standard Code for Information Interchange) permet d’uniformiser les échanges. Cependant, on ne peut représenter que 128 caractères (7 bits).
  • années 90:* La norme ISO 8859 code les caractères sur 8 bits. Elle est composée de 16 tables correspondant chacune à un type de caractères régionaux.
  • années 90 (première version): La norme unicode (ISO 10646) permet de coder tous les caractères. La taille en mémoire de chaque caractère varie entre 1 et 4 octets.
À retenir

Les normes ISO 8859 et ISO 10646 sont rétro-compatibles avec la représentation ASCII. Cela signifie que les 128 caractères de la table ASCII ont la même représentation en mémoire dans les autres normes.