Ci-dessous, les différences entre deux révisions de la page.
Prochaine révision | Révision précédente | ||
sysadmin:linux:encodage-des-caracteres [2020/06/30 16:30] – créée yoann | sysadmin:linux:encodage-des-caracteres [2023/11/29 11:09] (Version actuelle) – yoann | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | {{tag> | + | {{tag> |
====== Encodage des caractères | ====== Encodage des caractères | ||
- | Un jeu de caractère est une table permettant d' | + | Par son mode de fonctionnement, |
- | Les éditeurs de textes permettent de définir quel jeu de caractères (charset) doit être utilisé pour l' | + | Pour représenter un caractère à l’écran il faut donc: |
+ | - décoder le flux d' | ||
+ | - Afficher un symbole, c'est à dire dessiner le glyphe correspondant au symbole c'est le rôle de la police de caractères. | ||
+ | |||
+ | Les éditeurs de textes permettent de définir quel jeu de caractères (charset) doit être utilisé pour l' | ||
===== Déterminer le charset d'un fichier ===== | ===== Déterminer le charset d'un fichier ===== | ||
- | Plusieurs outils: uchardet, file, enca | + | Plusieurs outils |
+ | |||
+ | <code bash> | ||
+ | # Détermine le type mime et l' | ||
+ | file --mime smp2.csv | ||
+ | smp2.csv: application/ | ||
+ | |||
+ | # Pour n' | ||
+ | file --brief --mime-encoding smp2.csv | ||
+ | us-ascii | ||
+ | |||
+ | # Déterminer l' | ||
+ | chardet smp2.csv | ||
+ | smp2.csv: ascii with confidence 1.0 | ||
+ | |||
+ | </ | ||
===== Conversion ===== | ===== Conversion ===== | ||
- | toDo: iconv | + | Depuis la ligne de commande via **iconv**: |
+ | <code bash> | ||
+ | # Créer un | ||
+ | iconv --from-code=US-ASCII --to-code=UTF-8 --output=smp3.csv smp2.csv | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | Certains jeux de caractères sont plus étendus que d' | ||
+ | </ | ||
+ | |||
+ | Les éditeurs de textes permettent de définir quel encodage utiliser lors de l' | ||
===== Références ===== | ===== Références ===== | ||
* https:// | * https:// | ||
+ | * https:// |