Différences

Ci-dessous, les différences entre deux révisions de la page.

--- dev:python:manipulation-de-fichiers [2020/11/20 19:00] – yoann
+++ dev:python:manipulation-de-fichiers [2021/02/01 21:51] (Version actuelle) – modification externe 127.0.0.1
@@ Ligne 48: / Ligne 48: @@
 </code>
-===== ecrire un flux binaire dans un fichier =====
+===== Ecrire un flux binaire dans un fichier =====
+<code python>
 with open('/path/to/filename.txt', 'bw') as file:
     # bloc d'instruction lié au context manager
     for line in range(100):
-        file.write(b'\0xFF')
+        file.write(b'\xff')
+        # l'objet doit être de type bytes, pour convertir un int
+        # c = 0xff.to_bytes(1,byteorder='little',signed=False)
+</code>
+Pour vérifier le contenu du fichier, on peut utiliser **od**:
+<code bash>
+#affiche le flux par valeurs hexadécimales de 1 octet interprétation des valeurs
+# en little endian
+od --address-radix=d --width=10 --output-duplicates --format=x1 --endian=little /tmp/test.raw
+0000000 f0 f0 f0 f0 f0 f0 f0 f0 f0 f0
+0000010 f0 f0 f0 f0 f0 f0 f0 f0 f0 f0
+0000020 f0 f0 f0 f0 f0 f0 f0 f0 f0 f0
+0000030 f0 f0 f0 f0 f0 f0 f0 f0 f0 f0
+0000040 f0 f0 f0 f0 f0 f0 f0 f0 f0 f0
+0000050 f0 f0 f0 f0 f0 f0 f0 f0 f0 f0
+0000060
+</code>
+===== Les modes d'ouvertures =====
+Les modes les plus utilisés:
+^ Mode ^ Description                   |
+| "r"  | read, lecture                 |
+| "w"  | write, écriture. Si un contenu existait il est écrasé. |
+| "a"  | append, ajout. Ecriture en fin de fichier. Conserve le contenu préexistant |
+Le détail des modes d'ouvertures existant est intégré à la documentation de la fonction built-in open().
+===== Méthodes bas niveau =====
+==== Méthode read() ====
+La méthode **read()** permet de lire dans un fichier un buffer d'une taille choisit. Si la taille du buffer n'est pas spécifiée, c'est tout le fichier qui est retourné.
+<code python>
+with open('/path/to/filename.txt', 'bw') as file:
+    # bloc d'instruction lié au context manager
+    all_content = file.read()
+        print(f"contenu complet:\n {all_content}", end="")
+</code>
+<code python>
+with open('/path/to/filename.txt', 'bw') as file:
+    # bloc d'instruction lié au context manager
+    for bloc in range(10):
+    #lecture par bloc de 4 caractères
+        print(f"bloc ID {bloc}: {repr(file.read(4))}")
+</code>
+==== Méthode flush() ====
+Pour des raisons de performances, le système d'exploitation peut différer les demandes de lectures/écritures en plaçant les données dans des tampons. Dans certains cas ce comportement par défaut peut être génant: la méthode flush() permet de vider les tampons et forcer immédiatement la lecture/écriture.
+===== Le module pathlib =====
+Pour opérer sur les chemins, nom de fichiers présents sur l'arborescence du système d'exploitation  il y avait les module os et glob aujourd'hui dépréciés.
+On utilisera plutôt **pathlib**:
+<code python>
+filename = '/tmp/test.txt'
+from pathlib import Path
+path = Path(filename)
+# retourne True si le fichier existe
+path.exists()
+# retourner un tuple contenant entre autre propriétaire, taille, date d'accès
+path.stat()
+file_size = path.stat().st_size()
+# Détruire un fichier:
+path.unlink()
+# rechercher des fichiers
+dirpath = Path('./data/')
+for files in dirpath.glob("*.txt"):
+   print(file)
+</code>
+===== Formats =====
+Lors de l'execution d'un programme python les données en mémoire ont une représentation qui dépend de l'architecture machine. Cette forme bien adaptée pour le traitement et les calcul sur l'hote n'est pas forcement pertinante lorsqu'il sagit de stocker ou transmettre l'information. Il convient donc de faire de la traduction dans les deux sens entre d'une part la représentation en mémoire et d'autre part la représentation sur le réseau ou les disques de stockage. Pour cela on utilise divers encodages (marshalling) comme **JSON**((**J**ava**S**cript **O**bject **N**otation)) ou **CSV** ((**C**omma **S**eparated **V**alues))
+JSON s'est popularisé car il est léger, permet de communiquer avec des applications web en JavaScript et qu'il est supporté par de nombreux langage. Il permet de sérialiser facilement la plupart des types de base:
+<code python>
+dataset = [10,33,
+           'ma chaine',
+           [2.5,3.1],
+           {'nom':'Doe', 'prenom':'John', 'age':33},
+           # les tuples seront convertis en listes
+           (2,3,4)
+          ]
+# Ecrire dans un fichier au format JSON
+with open("/tmp/test.json", 'w', encoding='utf8') as fs_json:
+    json.dump(dataset, fs_json)
+del(dataset)
+# Relire, récupérer des données au format JSON
+with open("/tmp/test.json", 'r', encoding='utf-8') as json_input:
+    dataset = json.load(json_input)
+dataset
+[10,
+,
+ 'ma chaine',
+ [2.5, 3.1],
+ {'nom': 'Doe', 'prenom': 'John', 'age': 33},
+ [2, 3, 4]]
+</code>
+<note>
+Les données une fois rechargées ne comportent plus le tuple initial, il a été remplacé par une liste équivalente. Certains types de base Python non natif en JavaScript ne sont pas supportés par JSON: tuple, complex, set, frozenset
+</note>
+Le module **pickle** offre un format proche de JSON intégrant les types de base et permettant de faire des sauvegardes locales d'objets. Pour enregistrer facilement des objets Python il peut être très utile.
+===== Entrées sorties standards =====
+Les fichiers d'entrées/sorties standards sont exposés par Python via le module sys
+<code python>
+import sys
+for channel in (sys.stdin, sys.stdout, sys.stderr):
+    print(channel, f" at @{id(channel):0x}")
+</code>
+Comme sys.stdout est une variable du module sys référençant un objet fichiere, on peut lui faire référencer un autre fichier et rediriger ainsi les sorties.

wikinotes

Outils pour utilisateurs

Outils du site

Différences

Outils de la page