# Bonnes pratiques en informatique scientifique
**Marc BUFFAT , Université Claude Bernard Lyon 1**

![xkcd GOTO](https://imgs.xkcd.com/comics/goto.png)

[(C) graphique issu du site xkcd](https://xkcd.com/292)

## Workflow du calcul scientifique

Le workflow du calcul scientifique le plus courant est constitué de scripts qui appellent des données, des programmes et d'autres entrées et produisent des sorties pouvant inclure des visualisations et des résultats analytiques. Ces scripts peuvent être implémentés dans des programmes tels que R ou MATLAB, et maintenant de plus en plus Python avec une interface en ligne de commande, ou plus récemment en utilisant des applications Web telles que les Notebooks Jupyter.

Le développement est généralement basé sur une  construction itérative, avec une validation à chaque étape, privilégiant l'assemblage de solutions simples pour résoudre des problèmes complexes : **small is beautiful**

L'approche utilise la méthode **REPL** suivante: **Read-Eval-Print Loop**

  1. Définition d'une solution algorithmique
  2. Écriture du code
  3. Exécution avec analyse (print) et validation
  4. Si besoin corriger et Répéter

### règles de programmation

1. définir les données et les résultats à obtenir

3. chercher une solution algorithmique

2. écrire du code python de haute qualité (Writing high-quality Python code)

   - commentaire (docstring)
   - privilégier la simplicité
   - compréhensible
    
3. tester pour valider
4. connaître les variables et fonctions du problème

### Zen du python

In [None]:
# zen du python
import this

## Bonnes pratiques

1. Connaitre son environement de travail
2. Apprendre les bases du shell Unix (interpréteur de ligne de commandes)
4. Bien connaître le langage Python 3
5. Ecrire du code Python lissible, claire et de qualité
6. Vérifier et valider vos proagrammes
7. Et surtout faites **preuve de rigueur**



## Connaitre son environnement informatique

Pour connaître le système d'exploitation (opérating system OS ) utilisé, le système de fichiers ..., on utilise des commandes du shell (bash sous Unix) en utilisant dans une cellule le mot clé **%%bash** 


### commandes du shell (interpréteur de commandes)

pour avoir une dopcumentation en ligne d'une commande, p.e. whoami

         man whoami

In [None]:
%%bash
# nom utilisteur
whoami

In [None]:
%%bash
# système OS
uname -a

In [None]:
%%bash
# processeur
head -5 /proc/cpuinfo 

In [None]:
%%bash
# memoire 
head -5  /proc/meminfo

### système de fichiers, répertoire 


In [None]:
%%bash
# liste de tout les disques du système
df

In [None]:
%%bash
# affiche le répertoire courant 
pwd


In [None]:
%%bash
# caractéristique d'un fichier
ls -al testPoint.py
file testPoint.py

### quelques commandes classiques

 - copy  **cp**
 - déplace **mv**
 - efface **rm**
 - création répertoire **mkdir**
 - parcourir **cd**
 - affiche fichier **cat** , **head** , **tail**
 - recherche chaine dans un fichier **grep**
 
**shell script:** automatisation 

 - [introduction au shell sous unix/linux](https://perso.univ-lyon1.fr/marc.buffat/COURS/LINUX_HTML/)
              

## Recherche d'erreurs (debugging)

```{note}
Everyone knows that debugging is twice as hard as writing a program in the first place. So if you're as clever as you can be when you write it, how will you ever debug it? Don't comment bad code—rewrite it.

Brian Kernighan (auteur du livre C programming language)
```

- les erreurs sont inévitables : nous écrivons donc tous du code avec des erreurs

- apprenez donc à vérifier et tester systématiquement votre code

- Keep It Simple, Stupid (KISS) : gardez-le simple, stupide

- commentez et explicitez votre code

- vérifiez simplement avec la fonction `print`

- après ces étapes de base, si vous ne trouvez pas l'erreur, on peut utiliser un débugueur, qui est un outil permettant d'exécuter le code et d'afficher la valeur des variables




### Utilisation d'un IDE  (type spyder)

Un IDE (environnement logiciel de développement) est un outil extrêmement puissant utilisé par les développeurs pour l'écriture de codes complexes. 

- [spyder: IDE pour Python](https://www.spyder-ide.org/)

Pour des codes simples, il est sans doute trop puissant, et l'on préférera utiliser un outil plus simple, mème si moins sophistiqué. 



### Débugueur intégré

les dernières versions de jupyterlab intègre un débugueur intégré offrant des possibilités intéressantes.

Pour activer le débugueur, ouvrir une notebook IPython ou un programme python dans JupyterLab, puis  cliquer sur l'icône **bug** dans le coin supérieur droit:

![débugueur](images/debugger-kernel.png)

Une fois le débugueur activé, on active la fenêtre de debug à droite en cliquant sur l'icône **bug** dans la colonne de droite, qui fait apparaître différents panneaux 

![Débugueur ](images/debugger-sidebar.png)


**panneau Breakpoints**

- Mettre des points d'arrêts (breakpoint) dans le code python, ce qui permet de stopper le programme en cours d'exécution. Pour cela, déplace le curseur juste avant le numéro de ligne (un point rouge apparait). Pour mettre un point d'arrêt, il suffit alors de cliquer et le point rouge reste alors fixe 

**panneau Call Stack**

- Vous pouvez entrer dans le code et poursuivre l'exécution à l'aide des actions de débogage : exécuter le programme pas à pas 

**panneau Variables** 

- Permet d'afficher la liste et les valeurs des variables du code. Les variables peuvent être explorées à l'aide d'une vue arborescente et d'une vue tableau :

**panneau Source**

- Le panneau source affiche la source du fichier en cours de débogage


```{important}
Voici un screencast pour activer le débogueur et configurer des points d'arrêt extrait de la documentation
jupyterlab 

- [documentation débugueur de jupyter lab](https://jupyterlab.readthedocs.io/en/latest/user/debugger.html)

```

![screencast](images/step.gif)


## Exemple: courbe de Lissajous
Une courbe de Lissajous (d'après le physicien français ["Jules Antoine Lissajous"](http://fr.wikipedia.org/wiki/Jules_Lissajous])) est une courbe paramétrique du plan dont les composantes sont des fonctions périodiques du paramètre (en générale le temps en physique, et que l'on peut observer avec un oscilloscope).

Le programme Python suivant **lissajous.py** trace les courbes de Lissajous suivantes
\begin{eqnarray} 
x(t) &=&  \sin{(\frac{2\pi}{p} t)}\\
y(t) &=&  \sin{(\frac{2\pi}{q} t + \phi)}
\end{eqnarray}
Le rapport $n=\frac{p}{q}$ est le paramètre de la courbe et $\phi$ le déphassage. Le temps $T$ de parcours de la courbe est le plus petit commun multiple de $p$ et $q$:
$$T=pcm(p,q)=\frac{pq}{pgcd(p,q)}$$


### Méthodologie

1. Propriétés de l'algorithme PGCD à écrire

```
    calcul PGCD(a,b)
    propriétés : 
       PGCD(a,a) = a    
       si a >b PGCD(a,b)=PGCD(a-b,b)
       sinon PGCD(a,b)=PGCD(a,b-a)
``` 

2. Programme Python

  - traduction algorithme sous python

3. Validation

  - définition des cas de validation
  - PGCD(125,125)=125
  - PGCD(9,21)=3

### Solution algorithmique
**Algorithme PGCD(a,b)**
  
    tant que a#b
       si a>b alors a=b-a
       sinon b = b-a
    retour a

In [None]:
# programme
def PGCD(a,b):
    """calcul du pgcd de a et b par l'algorithme d'Euclide."""
    while a!=b:
        if a>b: 
            a = a -b
        else: 
            b = b -a
    return a

In [None]:
# validation
assert(PGCD(123,123)==123)
assert(PGCD(9,21)==3)
assert(PGCD(28,16)==4)

In [None]:
# variante (optimise)
def pgcd(a, b):
    """calcul du pgcd de a et b par l'algorithme d'Euclide."""
    print(a,b)
    while b:
        a, b = b, a % b
        print(a,b)
    return a

In [None]:
pgcd(30,21)

In [None]:
assert(pgcd(123,123)==123)
assert(pgcd(9,21)==3)
assert(pgcd(28,16)==4)

### Courbe de lissajous

\begin{eqnarray} 
x(t) &=&  \sin{(\frac{2\pi}{p} t)}\\
y(t) &=&  \sin{(\frac{2\pi}{q} t + \phi)}
\end{eqnarray}

    Algorithme Lissajous(p,q,phi,N)
      periode commune T = ppcm(p,q)
      T = pq/pgcd(p,q)
      t = [0,T/(N-1),...,T]
      x = sin(2*pi/p*t)
      y = sin(2*pi/q*t + phi)
      retour t,x,y
      

In [None]:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
def Lissajous(p,q,phi,N):
    """ calcul de N points d'une courbe de Lissajous"""
    omega1 = 2*np.pi/p
    omega2 = 2*np.pi/q
    # temps d'étude
    T = p*q/pgcd(p,q)
    t = np.linspace(0., T, N)
    # equations parametriques
    x = np.sin(omega1*t)
    y = np.sin(omega2*t+phi)
    return t,x,y

In [None]:
# validation
t,x,y = Lissajous(2,2,0.,100)
assert(np.all(np.abs(x-y)<1.e-8))

In [None]:
# application
t,x,y = Lissajous(2,3,0.,100)
plt.subplot(1,2,1)
plt.plot(t,x)
plt.plot(t,y)
plt.subplot(1,2,2)
plt.plot(x,y)

### Mise sur fichier (pour réutilisation comme module)

1. crétaion du fichier Lissajous.py

2. importation du module

mot clé **import**

In [None]:
%%bash
cat Lissajous.py

In [None]:
%%bash 
python3 Lissajous.py

In [None]:
import  Lissajous as li
t,x,y = li.Lissajous(2,3,0.,100)
plt.subplot(1,2,1)
plt.plot(t,x)
plt.plot(t,y)
plt.subplot(1,2,2)
plt.plot(x,y)
