projet:sujets2017automne

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
projet:sujets2017automne [2017/09/14 00:40] – [FR3. Mise en place d'un serveur FOREMAN/Puppet] fabien.ricoprojet:sujets2017automne [2018/01/21 21:57] (Version actuelle) fabien.rico
Ligne 60: Ligne 60:
  
 ^ Domaines                                                                                | Synthèse d'images | ^ Domaines                                                                                | Synthèse d'images |
-^ Techniques et langages                                                              | Animation de particules. C++  |+^ Techniques et langages                                                              | Animation de particules. C++ (ou éventuellement WebGL)  |
 ^ Responsable du sujet                                                                                                                             || ^ Responsable du sujet                                                                                                                             ||
 |                                                                                          | Alexandre Meyer                                           | |                                                                                          | Alexandre Meyer                                           |
Ligne 120: Ligne 120:
 =====RC1. Valorisation de données open data par une interface géographique   ===== =====RC1. Valorisation de données open data par une interface géographique   =====
  
-^ Domaines                                                  | Data Science, IHM, Open data | +^ Domaines                                                               | Data Science, IHM, Open data                                          
-^ Techniques                                                | Développement d'interface web  +^ Techniques                                                             | Développement d'interface web                                         
-^ Langages                                                   | Langage web (visu, javascript), Langage libre (Collecte, traitement) | +^ Langages                                                               | Langage web (visu, javascript), Langage libre (Collecte, traitement)  
-^ Responsable du sujet                                                                                                 || +^ Responsable du sujet                                                                                                                          || 
-                                                                                         | Rémy Cazabet                                           +                                                                       | Rémy Cazabet                                                          
-^ Informations à voir                                         [cf ci-dessous]                                                                                     || +^ Informations à voir                                                                                                                           || 
-                                                          ||+Plus de détails sur les sujets : http://cazabetremy.fr/LIFPROJET.html                                                                         ||
  
  
Ligne 151: Ligne 151:
 =====RC2. Guide d’alimentation assisté par le data mining   ===== =====RC2. Guide d’alimentation assisté par le data mining   =====
  
-^ Domaines                                                  | Data Science, IHM | +^ Domaines                                                               | Data Science, IHM                   
-^ Techniques                                                | Clustering, ACP   +^ Techniques                                                             | Clustering, ACP                     
-^ Langages                                                   | Python conseillé (n'ayez pas peur) | +^ Langages                                                               | Python conseillé (n'ayez pas peur)  
-^ Responsable du sujet                                                                                                 || +^ Responsable du sujet                                                                                        || 
-                                                                                         | Rémy Cazabet                                           +                                                                       | Rémy Cazabet                        
-^ Informations à voir                                         [cf ci-dessous]                                                                                     || +^ Informations à voir                                                                                         || 
-                                                          ||+Plus de détails sur les sujets : http://cazabetremy.fr/LIFPROJET.html                                       ||
  
  
 La plateforme open data “open food fact” recense des informations nutritionnelles et autres sur des aliments disponibles dans le commerce. La base de données est importante (350.000 produits en Septembre 2017), mais comme la plupart des données réelles, elle est bruitée et incomplète. La plateforme open data “open food fact” recense des informations nutritionnelles et autres sur des aliments disponibles dans le commerce. La base de données est importante (350.000 produits en Septembre 2017), mais comme la plupart des données réelles, elle est bruitée et incomplète.
 Votre objectif sera de développer un guide interactif permettant à un utilisateur de comparer des produits au niveau de leurs caractéristiques connues. Au moins deux fonctionnalités sont attendues, faisant intervenir des outils de base du data mining :  Votre objectif sera de développer un guide interactif permettant à un utilisateur de comparer des produits au niveau de leurs caractéristiques connues. Au moins deux fonctionnalités sont attendues, faisant intervenir des outils de base du data mining : 
- * À partir d’un produit choisi par l’utilisateur (ex: compote de pomme de la marque X ...), proposer un ensemble de produits similaires que l’utilisateur pourra comparer (outil data mining : clustering, notion de distance) +  * À partir d’un produit choisi par l’utilisateur (ex: compote de pomme de la marque X ...), proposer un ensemble de produits similaires que l’utilisateur pourra comparer (outil data mining : clustering, notion de distance) 
- * Pour un groupe de produits (ex: les compotes, les produits laitiers, les gateaux au chocolat, ...), proposer une visualisation graphique de type “cartographie”, c’est à dire où chaque produit apparait comme un point (ou une image…) sur un “espace” (un carré, un cercle…), et la position des produits est calculée automatiquement en fonction de leurs ressemblances en termes de propriétés (glucose, vitamines, additifs...). Il s’agit d’une application classique d’outils de type analyse en composante principale.+  * Pour un groupe de produits (ex: les compotes, les produits laitiers, les gateaux au chocolat, ...), proposer une visualisation graphique de type “cartographie”, c’est à dire où chaque produit apparait comme un point (ou une image…) sur un “espace” (un carré, un cercle…), et la position des produits est calculée automatiquement en fonction de leurs ressemblances en termes de propriétés (glucose, vitamines, additifs...). Il s’agit d’une application classique d’outils de type analyse en composante principale.
  
 Quelques remarques par rapport au travail attendu :  Quelques remarques par rapport au travail attendu : 
- * Bien que le langage soit libre, je vous incite fortement à utiliser Python. Si vous ne le connaissez pas, ça n’est pas du tout grave, c’est un language qui reprend les codes du C/JAVA, mais avec de nombreuses fonctionnalisés de haut niveau pour l’analyse de données +  * Bien que le langage soit libre, je vous incite fortement à utiliser Python. Si vous ne le connaissez pas, ça n’est pas du tout grave, c’est un language qui reprend les codes du C/JAVA, mais avec de nombreuses fonctionnalisés de haut niveau pour l’analyse de données 
- * Il ne vous sera pas demandé de coder les algorithmes de data mining utilisés. Il existe d’excellentes libraires bien documentées et faciles d’utilisation pour ce faire.+  * Il ne vous sera pas demandé de coder les algorithmes de data mining utilisés. Il existe d’excellentes libraires bien documentées et faciles d’utilisation pour ce faire.
  
 Selon votre intérêt, vous pourrez passer plus de temps à travailler sur la partie collecte des données (récupération automatique des mises à jour de la base…), traitement des données (Quels algorithmes utiliser, optimisation selon les données à afficher, etc…), ou visualisation (intéractive, options de filtrages, …) Selon votre intérêt, vous pourrez passer plus de temps à travailler sur la partie collecte des données (récupération automatique des mises à jour de la base…), traitement des données (Quels algorithmes utiliser, optimisation selon les données à afficher, etc…), ou visualisation (intéractive, options de filtrages, …)
- 
 =====RC3. Analyse de l’évolution de réseaux sociaux   ===== =====RC3. Analyse de l’évolution de réseaux sociaux   =====
  
-^ Domaines                                                  | Data Science, Network science | +^ Domaines                                                               | Data Science, Network science               
-^ Techniques                                                | Analyse de réseaux   +^ Techniques                                                             | Analyse de réseaux                          
-^ Langages                                                   | Libre, Python recommandé (N'ayez pas peur) | +^ Langages                                                               | Libre, Python recommandé (N'ayez pas peur)  
-^ Responsable du sujet                                                                                                 || +^ Responsable du sujet                                                                                                || 
-                                                                                         | Rémy Cazabet                                           +                                                                       | Rémy Cazabet                                
-^ Informations à voir                                         [cf ci-dessous]                                                                                     || +^ Informations à voir                                                                                                 || 
-                                                          ||+Plus de détails sur les sujets : http://cazabetremy.fr/LIFPROJET.html                                               ||
  
  
Ligne 214: Ligne 213:
 Les améliorations possibles de votre travail pouront porter sur les différentes optimisations ou adaptations de l'algorithme à des cas spécifiques, sur l'amélioration du temps  temps de calcul et du coût mémoire de votre programme. Vous pourrez aussi ajouter des prétraitements pour résoudre les cas ou les données sont lacunaires ou ajouter une interface graphique au programme. Les améliorations possibles de votre travail pouront porter sur les différentes optimisations ou adaptations de l'algorithme à des cas spécifiques, sur l'amélioration du temps  temps de calcul et du coût mémoire de votre programme. Vous pourrez aussi ajouter des prétraitements pour résoudre les cas ou les données sont lacunaires ou ajouter une interface graphique au programme.
    
-===== FR2. Compression d'image par PCA =====+===== FR2. Compression d'image par ACP =====
 ^ Techniques | calcul de valeur propres, compression| ^ Techniques | calcul de valeur propres, compression|
 ^ Responsable du sujet                                               || ^ Responsable du sujet                                               ||
Ligne 223: Ligne 222:
 On cherche ici à implémenter un algorithme de compression d'image avec perte (comme jpeg). L'image que l'on utilise (ou une partie de celle-ci) peut être vue comme une matrice. On peut utiliser sur cette matrice des techniques de réduction de dimension, c'est à dire obtenir une matrice de dimension plus petite qui contient l'essentielle de l'information de départ. C'est le rôle de l'analyse en composante principale (PCA). A partir de cette matrice plus petite (compréssée), on peut reconstruire l'image de départ avec quelques déformations dépendant du taux de compression utilisé. On cherche ici à implémenter un algorithme de compression d'image avec perte (comme jpeg). L'image que l'on utilise (ou une partie de celle-ci) peut être vue comme une matrice. On peut utiliser sur cette matrice des techniques de réduction de dimension, c'est à dire obtenir une matrice de dimension plus petite qui contient l'essentielle de l'information de départ. C'est le rôle de l'analyse en composante principale (PCA). A partir de cette matrice plus petite (compréssée), on peut reconstruire l'image de départ avec quelques déformations dépendant du taux de compression utilisé.
  
-Votre programme devra être capacle de lire une image sous un format simple (sans perte), et produire un fichier compressé. Il devra bien sur permettre d'appliquer le traitement inverse.+Votre programme devra être capable de lire une image sous un format simple (sans perte), et produire un fichier compressé. Il devra bien sur permettre d'appliquer le traitement inverse.
  
 ==Améliorations== ==Améliorations==
Ligne 231: Ligne 230:
   - améliorer le temps de calcule et le cout mémoire de votre programme.   - améliorer le temps de calcule et le cout mémoire de votre programme.
  
-===== FR3. Mise en place d'un serveur FOREMAN/Puppet =====+===== FR3. Mise en place d'un serveur Foreman/Puppet =====
 ^ Techniques | administration système| ^ Techniques | administration système|
 ^ Responsable du sujet                                               || ^ Responsable du sujet                                               ||
Ligne 239: Ligne 238:
 |  https://puppet.com/       || |  https://puppet.com/       ||
  
-FOREMAN est un serveur capable d'installer le système d'exploitation d'une machine, Puppet est un serveur agissant sur une machine disposant d'un système de base et capable de vérifier et modifier les configurations de cette dernière. Les deux services ensemble permettent d'administrer un parc de machines virtuelles ou non.+''Foreman'' est un serveur capable d'installer le système d'exploitation d'une machine, ''Puppet'' est un serveur agissant sur une machine disposant d'un système de base et capable de vérifier et modifier les configurations de cette dernière. Les deux services ensemble permettent d'administrer un parc de machines virtuelles ou non.
  
  Vous devez mettre en place un système proposant ces deux services et capable d'installer 3 distribution linux différentes (debian/ubuntu, centos, ...) sur des machines virtuelles. Les machines devront être installée avec un système de base, un utilisateur, un ensemble de paquets à définir avec votre encadrant.  Vous devez mettre en place un système proposant ces deux services et capable d'installer 3 distribution linux différentes (debian/ubuntu, centos, ...) sur des machines virtuelles. Les machines devront être installée avec un système de base, un utilisateur, un ensemble de paquets à définir avec votre encadrant.
Ligne 247: Ligne 246:
   * installation de windows   * installation de windows
   * installation de machines physiques (il faut disposer d'un ordinateur sous linux avec une carte réseau).   * installation de machines physiques (il faut disposer d'un ordinateur sous linux avec une carte réseau).
 +
 +===== FR4. Mise en place d'un site web =====
 +^ Techniques | administration système et web|
 +^ Responsable du sujet                                               ||
 +|                     | Fabien Rico                                          | 
 +^ Information à voir                                                      ||
 +|         ||
 +|         ||
 +
 +Le but de ce sujet est de mettre en place un site web avec une partie visible (front) et une partie d'administration (backend).
 +Le sujet du site est encore indéterminé (et des idées sont les bienvenues). Il ne devra comporter une part de programmation important (ne pas uniquement installer un CMS). Il devra comporter un système de gestion des utilisateur, des droits, de modification du front...
 +
 +Le langage de programmation est laissé libre, mais le site se basera sur la technologie des docker pour être mis en place de manière simplifiée.
 +
 +==Amélioration==
 +Selon la difficulté technique de certaines parties du site :
 +  * authentification web basée sur openid connect;
 +  * lien avec les réseaux sociaux
 +
  • projet/sujets2017automne.1505342436.txt.gz
  • Dernière modification : 2017/09/14 00:40
  • de fabien.rico