Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
projet:sujets2017automne [2017/09/13 17:25] – [AM3. Exploration des capacités des réseaux de neurones (Deep Learning) à classifier, des images ou tout type de données, et/ou à prédire] alexandre.meyer | projet:sujets2017automne [2018/01/21 21:57] (Version actuelle) – fabien.rico | ||
---|---|---|---|
Ligne 60: | Ligne 60: | ||
^ Domaines | ^ Domaines | ||
- | ^ Techniques et langages | + | ^ Techniques et langages |
^ Responsable du sujet || | ^ Responsable du sujet || | ||
| | Alexandre Meyer | | | | Alexandre Meyer | | ||
Ligne 80: | Ligne 80: | ||
=====AM2. Visage humain : reconnaissance, | =====AM2. Visage humain : reconnaissance, | ||
- | ^ Domaines | + | ^ Domaines |
^ Techniques | ^ Techniques | ||
^ Langages | ^ Langages | ||
Ligne 101: | Ligne 101: | ||
=====AM3. Exploration des capacités des réseaux de neurones (Deep Learning) à classifier, des images ou tout type de données, et/ou à prédire | =====AM3. Exploration des capacités des réseaux de neurones (Deep Learning) à classifier, des images ou tout type de données, et/ou à prédire | ||
- | ^ Domaines | + | ^ Domaines |
^ Techniques | ^ Techniques | ||
^ Langages | ^ Langages | ||
Ligne 120: | Ligne 120: | ||
=====RC1. Valorisation de données open data par une interface géographique | =====RC1. Valorisation de données open data par une interface géographique | ||
- | ^ Domaines | + | ^ Domaines |
- | ^ Techniques | + | ^ Techniques |
- | ^ Langages | + | ^ Langages |
- | ^ Responsable du sujet | + | ^ Responsable du sujet || |
- | | | Rémy Cazabet | + | | | Rémy Cazabet |
- | ^ Informations à voir [cf ci-dessous] | + | ^ Informations à voir |
- | | | + | | Plus de détails sur les sujets : http:// |
Ligne 151: | Ligne 151: | ||
=====RC2. Guide d’alimentation assisté par le data mining | =====RC2. Guide d’alimentation assisté par le data mining | ||
- | ^ Domaines | + | ^ Domaines |
- | ^ Techniques | + | ^ Techniques |
- | ^ Langages | + | ^ Langages |
- | ^ Responsable du sujet | + | ^ Responsable du sujet || |
- | | | Rémy Cazabet | + | | | Rémy Cazabet |
- | ^ Informations à voir [cf ci-dessous] | + | ^ Informations à voir |
- | | | + | | Plus de détails sur les sujets : http:// |
La plateforme open data “open food fact” recense des informations nutritionnelles et autres sur des aliments disponibles dans le commerce. La base de données est importante (350.000 produits en Septembre 2017), mais comme la plupart des données réelles, elle est bruitée et incomplète. | La plateforme open data “open food fact” recense des informations nutritionnelles et autres sur des aliments disponibles dans le commerce. La base de données est importante (350.000 produits en Septembre 2017), mais comme la plupart des données réelles, elle est bruitée et incomplète. | ||
Votre objectif sera de développer un guide interactif permettant à un utilisateur de comparer des produits au niveau de leurs caractéristiques connues. Au moins deux fonctionnalités sont attendues, faisant intervenir des outils de base du data mining : | Votre objectif sera de développer un guide interactif permettant à un utilisateur de comparer des produits au niveau de leurs caractéristiques connues. Au moins deux fonctionnalités sont attendues, faisant intervenir des outils de base du data mining : | ||
- | * À partir d’un produit choisi par l’utilisateur (ex: compote de pomme de la marque X ...), proposer un ensemble de produits similaires que l’utilisateur pourra comparer (outil data mining : clustering, notion de distance) | + | |
- | * Pour un groupe de produits (ex: les compotes, les produits laitiers, les gateaux au chocolat, ...), proposer une visualisation graphique de type “cartographie”, | + | * Pour un groupe de produits (ex: les compotes, les produits laitiers, les gateaux au chocolat, ...), proposer une visualisation graphique de type “cartographie”, |
Quelques remarques par rapport au travail attendu : | Quelques remarques par rapport au travail attendu : | ||
- | * Bien que le langage soit libre, je vous incite fortement à utiliser Python. Si vous ne le connaissez pas, ça n’est pas du tout grave, c’est un language qui reprend les codes du C/JAVA, mais avec de nombreuses fonctionnalisés de haut niveau pour l’analyse de données | + | |
- | * Il ne vous sera pas demandé de coder les algorithmes de data mining utilisés. Il existe d’excellentes libraires bien documentées et faciles d’utilisation pour ce faire. | + | * Il ne vous sera pas demandé de coder les algorithmes de data mining utilisés. Il existe d’excellentes libraires bien documentées et faciles d’utilisation pour ce faire. |
Selon votre intérêt, vous pourrez passer plus de temps à travailler sur la partie collecte des données (récupération automatique des mises à jour de la base…), traitement des données (Quels algorithmes utiliser, optimisation selon les données à afficher, etc…), ou visualisation (intéractive, | Selon votre intérêt, vous pourrez passer plus de temps à travailler sur la partie collecte des données (récupération automatique des mises à jour de la base…), traitement des données (Quels algorithmes utiliser, optimisation selon les données à afficher, etc…), ou visualisation (intéractive, | ||
- | |||
=====RC3. Analyse de l’évolution de réseaux sociaux | =====RC3. Analyse de l’évolution de réseaux sociaux | ||
- | ^ Domaines | + | ^ Domaines |
- | ^ Techniques | + | ^ Techniques |
- | ^ Langages | + | ^ Langages |
- | ^ Responsable du sujet | + | ^ Responsable du sujet || |
- | | | Rémy Cazabet | + | | | Rémy Cazabet |
- | ^ Informations à voir [cf ci-dessous] | + | ^ Informations à voir |
- | | | + | | Plus de détails sur les sujets : http:// |
Ligne 192: | Ligne 191: | ||
Pour travailler sur un cas concret, je vous fournirez les jeux de données correspondant à l’évolution des réseaux sociaux des personnages de 2 séries télé (Trône de fer et House of Cards). | Pour travailler sur un cas concret, je vous fournirez les jeux de données correspondant à l’évolution des réseaux sociaux des personnages de 2 séries télé (Trône de fer et House of Cards). | ||
+ | |||
+ | ===== FR1. Classification par arbre de décision et forêt aléatoire ===== | ||
+ | ^Techniques | Classification, | ||
+ | ^Responsable du sujet || | ||
+ | | | Fabien Rico | | ||
+ | ^Informations à voir || | ||
+ | | [[http:// | ||
+ | |||
+ | La classification automatique est un domaine où on cherche à apprendre à reconnaitre la classe d' | ||
+ | |||
+ | Le but de votre projet est d' | ||
+ | |||
+ | Pour cela il faut : | ||
+ | - implémenter la construction d'un arbre de décision à partir d'un jeu de données d' | ||
+ | - implémenter un système permettant de générer un grand nombre d' | ||
+ | - mettre en place un système de test permettant de mesurer la qualité de vos algorithmes. | ||
+ | |||
+ | Votre logiciel devra être capable à partir d'un fichier d' | ||
+ | |||
+ | == Améliorations== | ||
+ | Les améliorations possibles de votre travail pouront porter sur les différentes optimisations ou adaptations de l' | ||
+ | |||
+ | ===== FR2. Compression d' | ||
+ | ^ Techniques | calcul de valeur propres, compression| | ||
+ | ^ Responsable du sujet || | ||
+ | | | Fabien Rico | ||
+ | ^ Information à voir || | ||
+ | | [[projet: | ||
+ | |||
+ | On cherche ici à implémenter un algorithme de compression d' | ||
+ | |||
+ | Votre programme devra être capable de lire une image sous un format simple (sans perte), et produire un fichier compressé. Il devra bien sur permettre d' | ||
+ | |||
+ | ==Améliorations== | ||
+ | Pour améliorer ce dernier vous pourrez : | ||
+ | - ajouter une interface graphique; | ||
+ | - mettre en place un système de comparaison avec la représentation jpeg; | ||
+ | - améliorer le temps de calcule et le cout mémoire de votre programme. | ||
+ | |||
+ | ===== FR3. Mise en place d'un serveur Foreman/ | ||
+ | ^ Techniques | administration système| | ||
+ | ^ Responsable du sujet || | ||
+ | | | Fabien Rico | | ||
+ | ^ Information à voir || | ||
+ | | https:// | ||
+ | | https:// | ||
+ | |||
+ | '' | ||
+ | |||
+ | Vous devez mettre en place un système proposant ces deux services et capable d' | ||
+ | |||
+ | ==Améliorations== | ||
+ | * liaison avec différents sytème d' | ||
+ | * installation de windows | ||
+ | * installation de machines physiques (il faut disposer d'un ordinateur sous linux avec une carte réseau). | ||
+ | |||
+ | ===== FR4. Mise en place d'un site web ===== | ||
+ | ^ Techniques | administration système et web| | ||
+ | ^ Responsable du sujet || | ||
+ | | | Fabien Rico | | ||
+ | ^ Information à voir || | ||
+ | | || | ||
+ | | || | ||
+ | |||
+ | Le but de ce sujet est de mettre en place un site web avec une partie visible (front) et une partie d' | ||
+ | Le sujet du site est encore indéterminé (et des idées sont les bienvenues). Il ne devra comporter une part de programmation important (ne pas uniquement installer un CMS). Il devra comporter un système de gestion des utilisateur, | ||
+ | |||
+ | Le langage de programmation est laissé libre, mais le site se basera sur la technologie des docker pour être mis en place de manière simplifiée. | ||
+ | |||
+ | ==Amélioration== | ||
+ | Selon la difficulté technique de certaines parties du site : | ||
+ | * authentification web basée sur openid connect; | ||
+ | * lien avec les réseaux sociaux | ||