Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
sysadmin:linux:encodage-des-caracteres [2020/11/14 12:33] – yoann | sysadmin:linux:encodage-des-caracteres [2023/11/29 11:09] (Version actuelle) – yoann | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | {{tag> | + | {{tag> |
====== Encodage des caractères | ====== Encodage des caractères | ||
- | Un jeu de caractère est une table permettant d' | + | Par son mode de fonctionnement, |
Pour représenter un caractère à l’écran il faut donc: | Pour représenter un caractère à l’écran il faut donc: | ||
Ligne 15: | Ligne 15: | ||
Plusieurs outils peuvent être utilisés: uchardet, file, enca | Plusieurs outils peuvent être utilisés: uchardet, file, enca | ||
+ | |||
+ | <code bash> | ||
+ | # Détermine le type mime et l' | ||
+ | file --mime smp2.csv | ||
+ | smp2.csv: application/ | ||
+ | |||
+ | # Pour n' | ||
+ | file --brief --mime-encoding smp2.csv | ||
+ | us-ascii | ||
+ | |||
+ | # Déterminer l' | ||
+ | chardet smp2.csv | ||
+ | smp2.csv: ascii with confidence 1.0 | ||
+ | |||
+ | </ | ||
===== Conversion ===== | ===== Conversion ===== | ||
- | toDo: iconv | + | Depuis la ligne de commande via **iconv**: |
+ | <code bash> | ||
+ | # Créer un | ||
+ | iconv --from-code=US-ASCII --to-code=UTF-8 --output=smp3.csv smp2.csv | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | Certains jeux de caractères sont plus étendus que d' | ||
+ | </ | ||
+ | |||
+ | Les éditeurs de textes permettent de définir quel encodage utiliser lors de l' | ||
===== Références ===== | ===== Références ===== | ||
* https:// | * https:// | ||
+ | * https:// |