Ci-dessous, les différences entre deux révisions de la page.
| Prochaine révision | Révision précédente | ||
| sysadmin:linux:encodage-des-caracteres [2020/06/30 16:30] – créée yoann | sysadmin:linux:encodage-des-caracteres [2023/11/29 11:09] (Version actuelle) – yoann | ||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| - | {{tag> | + | {{tag> |
| ====== Encodage des caractères | ====== Encodage des caractères | ||
| - | Un jeu de caractère est une table permettant d' | + | Par son mode de fonctionnement, |
| - | Les éditeurs de textes permettent de définir quel jeu de caractères (charset) doit être utilisé pour l' | + | Pour représenter un caractère à l’écran il faut donc: |
| + | - décoder le flux d' | ||
| + | - Afficher un symbole, c'est à dire dessiner le glyphe correspondant au symbole c'est le rôle de la police de caractères. | ||
| + | |||
| + | Les éditeurs de textes permettent de définir quel jeu de caractères (charset) doit être utilisé pour l' | ||
| ===== Déterminer le charset d'un fichier ===== | ===== Déterminer le charset d'un fichier ===== | ||
| - | Plusieurs outils: uchardet, file, enca | + | Plusieurs outils |
| + | |||
| + | <code bash> | ||
| + | # Détermine le type mime et l' | ||
| + | file --mime smp2.csv | ||
| + | smp2.csv: application/ | ||
| + | |||
| + | # Pour n' | ||
| + | file --brief --mime-encoding smp2.csv | ||
| + | us-ascii | ||
| + | |||
| + | # Déterminer l' | ||
| + | chardet smp2.csv | ||
| + | smp2.csv: ascii with confidence 1.0 | ||
| + | |||
| + | </ | ||
| ===== Conversion ===== | ===== Conversion ===== | ||
| - | toDo: iconv | + | Depuis la ligne de commande via **iconv**: |
| + | <code bash> | ||
| + | # Créer un | ||
| + | iconv --from-code=US-ASCII --to-code=UTF-8 --output=smp3.csv smp2.csv | ||
| + | </ | ||
| + | |||
| + | < | ||
| + | Certains jeux de caractères sont plus étendus que d' | ||
| + | </ | ||
| + | |||
| + | Les éditeurs de textes permettent de définir quel encodage utiliser lors de l' | ||
| ===== Références ===== | ===== Références ===== | ||
| * https:// | * https:// | ||
| + | * https:// | ||