# Gestion de fichiers sous python
**Marc BUFFAT, dpt mécanique, Université Claude Bernard Lyon 1**

![](images/files.png)

In [None]:
%matplotlib inline
import numpy as np
import scipy as sp
import matplotlib.pyplot as plt
from matplotlib import rcParams
rcParams['font.family'] = 'serif'
rcParams['font.size'] = 14
from IPython.core.display import HTML
from IPython.display import display
from matplotlib import animation
#css_file = 'style.css'
#HTML(open(css_file, "r").read())

## Fichier informatique

**définition (Wikipédia)**
un fichier informatique est  une collection d'informations numériques (séquences d'octets) réunies sous un même nom, enregistrées sur un support de stockage tel qu'un disque dur, un CD-ROM, une clé USB ...

En vue de faciliter leur organisation, les fichiers sont disposés dans des systèmes de fichiers qui permettent de placer les fichiers dans des emplacements appelés répertoires ou dossiers eux-mêmes organisés selon le même principe de manière à former une hiérarchie arborescente

Sur le système de l'ordinateur, un fichier est repéré par son nom avec éventuellement une extension et le répertoire dans lequel il se trouve.

En calcul scientifique, on considère 2 types principaux de fichiers:

- des fichiers de **programmes** qui contiennent un code informatique exécutable par l'ordinateur, sous 2 formes principales:

   - fichiers **exécutables** qui contiennent un code binaire directement exécutable par le processeur (extension **.exe** sous windows). Ces programmes ne sont pas modifiables et sont propre à l'ordinateur utilisé (programmes commerciaux ou propriétaires)
   - fichiers **sources** qui contiennent le code source du programme dans un langage de programmation (extension **.py** pour les programmes Python). Ces programmes peuvent être modifiés et être exécuter sur n'importe quel ordinateur.
  

- des fichiers de **données** qui contiennent des données (data) crées et manipulées par les programmes, sous 2 formes principales:

   - des fichiers **binaires** qui contiennent l'information brute, utilisant le codage de l'ordinateur (le plus efficace pour le stockage)
   - des fichiers **textes** qui contiennent les données écrites sous forme de lignes de texte (format le plus simple à manipuler)
 
 Dans la suite on ne considérera que les fichiers programmes Python (extension .py) et des fichiers de données textes (extension .dat).
 
 Pour éviter des problèmes de compatibilités entre systèmes informatiques, on choisira des noms de fichiers sans caractères accentués, sans espace ni caractéres spéciaux (autre que . ou _ ou - ) 

## Fichier de programme (ou script) sous Python

un fichier contenant un programme Python a par convention une extension **.py**. Un simple éditeur de texte (notepad sous Windows) suffit pour créer et modifier un programme Python

- **gedit** ["voir le site gedit"](http://wiki.gnome.org/Apps/Gedit) un éditeur simple et efficace
- **vim** et variante ["soir le site vim"](http://wiki.python.org/moin/Vim) un éditeur de référence pour les programmeurs
- **spyder** ["voir le site spyder"](http://pythonhosted.org/spyder/) un environnement de développement Python à la matlab pour les applications scientifiques. *Sous Spyder, on utilisera plutôt la console Ipython pour exécuter les programmes, que la console par défaut qui utilise des conventions matlab différentes d'un interpréteur Python classique*.
- **jupyter lab** extension jupyter pour un environnement de programmation 

## Fichiers de données sous Python

Comme dans la pluspart des langages informatiques, lire ou écrire dans un fichier, on va associer à un fichier (à son nom) une variable informatique de type **file**, qui posséde des fonctions (ou méthodes) permettant de lire ou écrire des données dans le fichier.
### fonction de lecture/écriture

- ouverture d'un fichier *mon_fichier.dat* en lecture:
        f=open("nom_fichier.dat",'r')
- ou en écriture:
        f=open("nom_fichier.dat",'w')
- lecture / ecriture (caractères)
        f.read(n) ou f.readline() 
        f.write(chaine)
- lecture / écriture de tableaux (numpy)
        A=loadtxt(file (ou nom de fichier))
        savetxt(file (ou nom de fichier), A)   
- fermeture du fichier
        f.close()
- attention caractères accentués (codage UTF8)
        encodage des chaines
           string.encode
        ouverture fichier (bytes)
           open("mon fichier","wb")

## Exemple manipulation de courbes de Lissajous
Une courbe de Lissajous (d'après le physicien français ["Jules Antoine Lissajous"](http://fr.wikipedia.org/wiki/Jules_Lissajous])) est une courbe paramétrique du plan dont les composantes sont des fonctions périodiques du paramètre (en général le temps en physique, et que l'on peut observer avec un oscilloscope).

On veut manipuler et tracer les courbes de Lissajous suivantes
\begin{eqnarray} 
x(t) &=&  \sin{(\frac{2\pi}{p} t)}\\
y(t) &=&  \sin{(\frac{2\pi}{q} t + \phi)}
\end{eqnarray}
Le rapport $n=\frac{p}{q}$ est le paramètre de la courbe et $\phi$ le déphasage. Le temps $T$ de parcours de la courbe est le plus petit commun multiple de $p$ et $q$:

$$T=ppcm(p,q)=\frac{pq}{pgcd(p,q)}$$

![](lissajous.png)

### Création d'une petite bibliothèque d'application

**lissajous.py** : fichier contient des fonctions utiles, et une partie `main` qui n'est exécutée que si l'on exécute directement le fichier avec un interpréteur python. Cette partie sert en général à tester la bibliothèque.

Cette partie n'est pas exécutée lorsque l'on importe la bibliothèque avec `import` . 
```python
def pgcd(a,b):
    
def Lissajous(p,q,phi,N):

def LissajousFigure(p,q,phi):

# programme principal (main) du module
if __name__ == "__main__":
    # test de la bibliothéque
```

**Attention** pour l'utiliser comme bibliothèque, il ne faut écrire aucune instruction python en dehors des fonctions et de la partie main (dans le if)


### fichier lissajous.py

fichier source Python

In [None]:
%%bash --err /dev/null
ls -al lissajous.py
#cat lissajous.py

### exécution du programme

In [None]:
%%bash --err /dev/null
echo "execution avec interpreteur python"
python3 lissajous.py
ls -al lissajous.png

### utilisation de  Jupyter lab
 
http://localhost:8888/lab

## module (ou librairie)

**module**  fichier contenant des fonctions et des définitions en python (bibliothèque)

**nom du module** nom du fichier sans l'extension .py

**utilisation** du module mon_module.py

    import mon_module
    import mon_module as mn
    from mom_module import ma_fonction
    from mon_module import *

In [None]:
from lissajous import pgcd,LissajousFigure
print(pgcd(21,9))
LissajousFigure(5,3,np.pi/2)

**rem** si votre bibliothèque n'est pas dans le répertoire courant, il faudra 
alors spécifier son chemin d’accès (path) (voir documentation Python)

### Exemple: écriture de données
écriture sur fichiers de $n$  points d'une courbe de Lissajous avec le format suivant 

    # ligne de commentaire
    # n
    t0 x0 y0
    .......
    ti xi yi
    .......
    tn-1 xn-1 yn-1
                
#### Programme Python

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from lissajous import Lissajous
# calcul des points
p=1; q=2; 
N=50
t,x,y=Lissajous(p,q,np.pi/2,N)
# mise sur fichier
F=open("lissajous.dat","w")
F.write("# courbe de lissajous avec p=%d q=%d\n"%(p,q))
F.write("# %d\n"%(N))
np.savetxt(F,np.transpose([t,x,y]))
F.close()

In [None]:
%%bash --err /dev/null
ls -al lissajous.dat
cat lissajous.dat

### Lecture des données avec `loadtxt`

In [None]:
F=open("lissajous.dat","r")
t,x,y =np.loadtxt(F,unpack=True)
F.close()
print("lecture des données taille=",x.shape, y.shape)
# tracer
plt.plot(x,y,lw=2)

## Entrée Sortie en python

### Lecture au clavier 
lecture au clavier **input** d'une valeur sans conversion

    val = input("message")

ensuite, on doit faire une conversion 



```python
val = int(input("entier ="))
print(val,type(val))
chaine = input("chaine =")
print(chaine,type(chaine))

```

### Écriture avec formatage (mise en forme)

    print(chaine%(val1,val2,..))
**chaine** est une chaîne de caractères contenant des champs **%[n][t]** 

- n = entier optionnel spécifiant la largueur (en colonnes) du champ
- t  spécifie le type du champ: **d**=entier (décimal), **f**=réel (float) , **e**=réel avec exposant, **g**=réel (format général),  **s**=chaîne (string)

**format avec python 3**

    string.format(var1,var2,..)
 
 où string est une chaine avec des {} pour spécifier la position des variables (pour le formattage on remplace % par : )

In [None]:
i=1425
x=3242.627
ch="chaine"
print(i,x,ch)

In [None]:
print("i={:} {:08d}  x: {:6.2f} ={:8.1e} titre={}".format(i,i,x,x,ch))

### Fonctions utiles de gestion des fichiers

In [None]:
# liste des fichiers dans un repertoire
import glob
fichiers = glob.glob('*')
print(fichiers)

## FIN