# Introduction au calcul scientifique  avec Python
![](images/python-logo.png)

**Marc BUFFAT, dpt mécanique, Université Lyon 1**

(**) voir aussi le cours ["Scientific Python Lectures"](https://github.com/jrjohansson/scientific-python-lectures) by  Robert Johansson

<a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/2.0/fr/"><img alt="Licence Creative Commons" style="border-width:0;float:right;" src="images/cc.png" /></a><br />Mise à disposition selon les termes de la <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/2.0/fr/">Licence Creative Commons <br> Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 2.0 France</a>.

In [None]:
%matplotlib inline
import numpy as np
import scipy as sp
import matplotlib.pyplot as plt
# option de mise en page
from IPython.core.display import HTML,display

## Objectifs

### Apprendre:

- concept fondamentaux en programmation
- différentes techniques de base
- démarche de programmation scientifique
- syntaxe du langage Python

### À la fin du cours, vous pourrez: 

- résoudre des problèmes scientifiques (à l’aide de Python)
- appliquer la démarche de programmation scientifique avec d'autres langages (matlab, scilab, ..)

## Fonctionnement d'un ordinateur

**ordinateur** = matériel (CPU, mémoire, disque,..) + logiciel (OS, programmes,..)

### composants d'un ordinateur

``OS``

Système d'exploitation (OS) = gestion d'un ordinateur + environement

*Linux/Unix* = vue abstraite et générique indépendante du matériel

``programmes + données``

* programme = processus
* données = fichiers (files, devices, streams)
* gestion des droits: notion d'utilisateur (user), groupes (group), autres (other)
* super-utilisateur: root

``Principes``

  * **small** is beautiful
    
  * **generality** is better than specificity
    
  * **communication** is important (format ouvert pour les données)


### programmes / processus

**processus** = programme executé sur un ordinateur

* pid = numéro du processus
* programme (utilisateur ou commande système)
* E/S: entrée par défaut (input stream=**stdin**), sortie par défaut (output stream=**stdout**)
* sortie programme = entrée d'un autre programme : pipe ou **|**
 * pge 1 | pge 2 | pge 3
* controle des processus: **kill** pid ou ctrl+C, stop (ctrl+Z) , tache de fond (bg) , **ps**, **top**
* éxecution des commandes à travers une interface
  * un terminal avec un shell (interpérteur de commande): bash (avec auto-complétion)
  * un GUI (gnome, KDE, ..)
* syntaxe (attention majuscule # minuscule, espace = séparateur d'arguemnts)
  
  ``cde [-options] arguments``

In [None]:
%%bash
ps -au buffat | head

### Système de fichiers (Unix)
* vu arborescente abstraite indépendante du matériel à partir de la racine (root) **/**
<img src="images/unixFile.gif" width="400">

* notation
  * fichier = nom de fichier + répertoire + droits d'accés
  * **/** séparateur de répertoire (directory)
  * **.** répértoire courant
  * **..** répértoire parent
  * **pwd** : affiche répertoire courant
  * lien symbolique
  * fichiers cachés: commence par **.**

* principales commandes
  * **ls**    : liste des fichiers
  * **mkdir** : création répertoire
  * **rm**   : éfface un fichier
  * **cd**    : change de répertoire (directory)
  * **help** cde : aide
  * **cat** file : affiche le contenu du fichier

In [None]:
%%bash
ls -al | head

## Execution d'un programme

### Calcul de la somme d'une série:

$$ S = x - \frac{x^2}{2} + \frac{x^3}{3} + .. = \sum_{i=1}^n (-1)^{i+1} x^i/i $$

**démarche:**
1. algorithme
2. programmation 
3. execution du code machine sur l'ordinateur

### Algorithme de base

    Algorithme Serie(x,n)
       somme = 0
       pour i de 1 a n
          somme=somme + (-1)^(i+1)*x^i/i
       retour somme
    

Ecrire un algorithme plus efficace en notant que:

$$ (-1)^{i+1} \frac{x^i}{i}  = - \frac{x}{i} (-1)^{i} x^{i-1} $$

### Execution sur un ordinateur

L'ordinateur (le CPU) n'éxécute que des instructions machines codées en binaire.

``Problème: comment transformer un algorithme en langage machine ?``

### Langage machine (binaire)

* suite d'instruction binaire executer par le processeur: 01010111  (suite 0 ou 1 : bits)
* représentation en hexadécimal (octet ou bytes): 
  * **f8 = 248**
* instructions et données sont stockées en mémoire (à une adresse donnée) 
  * @000141  instruction f8 
* spécifiques au processeur (intel, ARM, power, AMD, ..)
* spécifique au système d'exploitation OS

In [None]:
%%bash
od -x -N 100 data/a.out
./data/a.out

## Langages de programmation
 - conversion d'une programme en code machine
 - plusieurs centaine de langages différents
 
 <img src="images/langage_difficulty.png" width="600">

-[langage le plus complexe: malbolge](https://en.wikipedia.org/wiki/Malbolge)


### Langage assembleur

L'assembleur traduit le code source en code binaire

* notation des instructions machines (move, push, load, add, mul)
* programme + assembleur = code machine

In [None]:
%%bash
head -15 data/serie.s

### Langage compilé: compilateur 

le compilateur transforme le code source en assembleur (compilation), éffectue l'édition avec des librairies pour obtenir un binaire qui dépend de l'ordinateur cible, mais qui s'exécute sans le compilateur et sans le code source.

* C++ Fortran C
* programme source + compilateur = programme binaire
* programme source = portable
* programme binaire = spécifique à l'ordinateur (non portable)

<img src="images/C.jpeg" style="width:300px;float:left;"/> **langage C**

In [None]:
%%bash
head -17 data/serie.C

In [None]:
%%bash
g++ data/serie.C -o serie
./serie

### Langage interprété: 

l'interpéteur exécute de façon interactive chaque ligne du fichier pour la traduire en code machine et l'execute interactivement. Pour exécuter le code, on a donc toujours besoin de l'interpréteur et du code source.

* Python, Matlab
* programme + interpréteur
* portable = indépendant du système (Linux, MacOS, Windows)

#### Matlab (Matrix Laboratory)
Matlab est un logiciel propriétaire qui est une boite à outils (toolbox) de calcul matriciel et numérique développé par Mathworks Inc. Il fonctionne sous Windows, Mac et Unix et permet d’écrire rapidement des scripts pour faire du calcul scientifique.

De nombreuses alternatives libres et de qualité existent, et notamment les logiciels : Scilab, Octave et surtout Python avec numpy.

In [None]:
%%bash
cat data/serie.m

#### **langage python**

Python est un language de programmation moderne de haut niveau, logiciel libre, généraliste, multi-plateformes, multi-architecture, multi-OS (linux, windows, MacOS,..). Un programme python peut s'executer sur un tout petit raspberry Pi à 30€ (ARM), sur des smartphones, des portables, des PC jusqu'aux super-calculateurs HPC avec $10^9$ coeurs de calcul. 

In [None]:
%%bash
cat data/serie.py

In [None]:
%%bash
python data/serie.py

## Historique des langages de programmation

- Années 1950 (approches expérimentales) : 
   - FORTRAN, LISP, COBOL...

- Années 1960 (langages universels) : 
   - ALGOL, PL/1, PASCAL...

- Années 1970 (génie logiciel) : 
   - C, MODULA-2, ADA...

- Années 1980 (programmation objet) : 
   - C++, Eiffel... 

- Années 1980 (boites à outils): 
   - LabView, Matlab...

- Années 1990 (langages interprétés objet) : 
   - Java, Perl, Python...

### Langages les plus utilisées par les scientifiques 

Pour le calcul intensif (HPC) (Argonne Lab)

1. C,C++
2. Fortran
3. Python

**Matlab** est très utilisé pour le traitement des données, mais peut être avantageusement remplacer par Python avec ses librairies numpy et matplotlib et pandas


## Exigences du calcul scientifique

**"Le logiciel (software) est une des pierres angulaires de la science moderne. Sans logiciel,  la science du vingt et unième siècle serait impossible. Mais sans de meilleurs logiciels, la science ne peut pas progresser"** [http://sciencecodemanifesto.org/]

**Réplicabilité et de reproductibilité** sont des pierres angulaires de la méthode scientifique. En ce qui concerne le travail numérique, se conformer à ces concepts a des implications pratiques suivantes:

* **Réplicable:** L'auteur d'un article scientifique qui implique des calculs numériques doit être en mesure de relancer les simulations et de reproduire les résultats sur demande. D'autres scientifiques devraient également être en mesure d'effectuer les mêmes calculs et d'obtenir les mêmes résultats, compte tenu des informations sur les méthodes utilisées dans une publication.

* **Reproductible:** Les résultats obtenus à partir de simulations numériques doivent être reproductibles avec une mise en oeuvre indépendante du procédé, ou en utilisant un procédé tout à fait différent.



En résumé: un résultat scientifique solide doit être reproductible, et une étude scientifique solide doit être réplicable.
    
<ul style="background:#ffff00;border:3px solid red;padding:10px;">

 * importance de la **documentation**
 
 * importance de la **validation**
 
 * importance de la **maîtrise** du code et des transformations de données (logiciels libres)
 
 </ol>

### Démarche du calcul scientifique

1. Modèle mathématique
2. Discrétisation numérique: solution approchée
3. Recherche solution algorithmique
4. Programmation
5. Validation

## Documentation
 * [Python](http://www.python.org). The official Python web site.
 * [Python tutorials](http://docs.python.org/2/tutorial). The official Python tutorials.
 * [Think Python](http://www.greenteapress.com/thinkpython). ''How to Think Like a Computer Scientist'' by Allen B. Downey (free book).
 * [COURS InProS](http://inpros.univ-lyon1.fr) ''Introduction à la Programmation Scientifique''
 


### Installation (logiciel libre)
 - Distribution pour Linux, Windows, Mac
 
 - [Distribution Anaconda](https://www.continuum.io)
 
 - accès aux serveurs Jupyter à l'UCB Lyon 1:
 
 

## Fin de la leçon