Ceci est une ancienne révision du document !
Par son mode de fonctionnement, un ordinateur ne permet que de stocker des représentations binaires. Il n'y a donc pas de façon “naturelle” de représenter un caractère comme 'A', un guillemet ou un point-virgule. Un jeu de caractère est une table permettant d'établir un transcodage entre une valeur binaire et un symbole, un caractère. C'est donc un choix, une convention et plusieurs jeux de caractères existent comme US-ASCII, CP1252, ISO 8859-1 (Latin-1), ISO 8859-15 (Latin-9), UTF-8 etc.
Pour représenter un caractère à l’écran il faut donc:
Les éditeurs de textes permettent de définir quel jeu de caractères (charset) doit être utilisé pour l'édition et l'enregistrement d'un fichier texte.
Plusieurs outils peuvent être utilisés: uchardet, file, enca
toDo: iconv