projet:2019:aut:start

Domaines Data science, Data Mining , IA, data visualization…
Librairies (proposées) scikit-learn, seaborn, bokeh, etc.
Langages (proposé) Python, javascript, html/css, etc.
Responsable du sujet Rémy Cazabet
Informations à voir http://cazabetremy.fr/Teaching/LIFPROJET.html

Le principe de ce projet est de 1) Choisir une source de données accessible (open data, data crawling, etc), de collecter ces données, les analyser, et construire un “explorable” permettant à n'importe qui d'explorer ces données de manière interactive. Vous êtes libre de choisir les données qui vous intéresse (sport, politique, réseaux sociaux, économie, environnement, sécurité, culture, etc.), et nous discuterons des analyses que nous pouvons en faire (restitution sous forme de cartes, de réseaux/graphes, de graphiques interactifs, sous forme de site-web ou non, etc.). Si vous ne savez pas quelles données existent ou non, partez du principe que tout existe, et nous chercherons ensemble ce qui est effectivement accessible. Vous pouvez consulter quelques projets précédents sur ma page http://cazabetremy.fr/Teaching/StudentsProduction.html .

Domaines IA, Machine Learning, Data Science, Réseaux de neurones, data visualization…
Librairies (proposées) scikit-learn, tensor-flow, keras, pyTorch, etc.
Langages (proposé) Python
Responsable du sujet Rémy Cazabet
Informations à voir http://cazabetremy.fr/Teaching/LIFPROJET.html

Le principe de ce projet est de 1) Choisir une source de données accessible (open data, data crawling, etc), puis utiliser un framework d'apprentissage auomatique (Machine Learning/IA) de manière à résoudre l'une des tâches classiques du domaine: 1)Prédire de futurs résultats (regression, supervisé), 2)Reconnaître une “classe” d'objet (classification, supervisé), 3)Découvrir automatiquement comment les données sont organisées (non supervisé, clustering). Vous serez libre de choisir les données qui vous intéresse (sport, politique, réseaux sociaux, économie, environnement, sécurité, culture, etc.), et nous discuterons de ce qu'il est possible d'en faire. Si vous ne savez pas quelles données existent ou non, partez du principe que tout existe, et nous chercherons ensemble ce qui est effectivement accessible. Tous types de données peuvent être analysés: textes, valeurs numériques, images, etc. Vous pouvez consulter quelques projets précédents sur ma page http://cazabetremy.fr/Teaching/StudentsProduction.html.

Domaines Machine Learning (“Intelligence Artificielle”)
Librairies (proposées) scikit-learn, keras, tensor-flow…
Langages (proposé) Python, autre
Responsable du sujet Rémy Cazabet
Informations à voir Challenges Kaggle en cours

Kaggle est le site web le plus connu de challenges en machine learning. En 2 mots: des entreprises proposent des challenges auxquels n'importe qui peut tenter de proposer une solution. La meilleure solution gagne. Mais là où Kaggle est particulièrement intéressant, c'est qu'il propose des tutoriels pour résoudre certains problèmes classiques, en utilisant différentes méthodes. Votre objectif: 1) Suivre un/des tutoriels pour résoudre un problème tout fait, 2)Choisir un challenge en cours et appliquer ce que vous avez appris

Domaines Data visualisation, Site Web, Data Mining
Librairies Bootstrap
Langages (proposé) javascript/html/css, python (analyse/nettoyage données)
Responsable du sujet Rémy Cazabet
Informations à voir -

Une commercante en Vin (https://www.facebook.com/atoutvins/) a une base de données (Excel) avec les informations de ses clients et des crus qu'elle représente. A partir de ces données, vous créerez un site web permettant a des clients (restaurateurs, particuliers, etc.) de visualiser sur une carte les vins représentés, de pouvoir chercher par information (cépage, couleur…), d'accéder aux sites web des domaines, etc.

Domaines Machine Learning (IA), génie logiciel, logiciel libre
Librairies - la votre :)
Langages (proposé) python, interfacage avec du c
Responsable du sujet Rémy Cazabet
Informations à voir http://cazabetremy.fr/Teaching/LIFPROJET.html, https://cdlib.readthedocs.io

CDlib (Community Detection library) https://cdlib.readthedocs.io est une librairie de machine learning, développé en python pour le problème du clustering de graphe, aussi appelé detection de communautés. Elle est pour l’instant développé par 3 chercheurs (dont votre serviteur) au sein du projet européen SoBigData (http://sobigdata.eu/index). Dans le cadre de ce projet, vous pouvez contribuer de différentes manières, notamment en ajoutant un module (visualisation, nouvel algorithme, etc.). Selon votre intérêt et vos compétences, il pourra s’agir d’intégrer des méthodes récentes basées sur les réseaux de neurones, de ré-implémenter des méthodes existantes dont le code ne serait pas disponible ou non-compatible, etc. Une autre manière de contribuer serait d'utiliser la librairie pour effectuer une expérience scientifique (en suivant un protocole standard), ce qui constituerait également une initiation au travail de chercheur.

Une attention particulière sera portée à produire un code propre et standard, (tests unitaires, commentaires adaptés à une génération automatique de documentation, etc.) pour qu’il soit intégré à une libraire de recherche publique. Il s’agit également d’une bonne introduction au machine learning/ intelligence artificielle.

Domaine Intelligence Artificielle
Langage (proposé) C++, java
Responsable du sujet Samir AKNINE

L’objectif de ce projet est de proposer une modélisation distribuée d’un jeu stratégique. Nous prendrons comme exemple une version proche du jeu de dames (du Shogi ou d'un autre jeu). Nous considérerons un ensemble de pions qui évoluent sur un plateau. Les pions sont répartis en deux groupes. Plusieurs pions d’un même groupe peuvent se déplacer en même temps selon des règles préétablies. L’objectif de chaque groupe est de remporter la partie en capturant les pions du groupe adverse. Nous implémenterons une méthode de résolution distribuée dans laquelle chaque pion est représenté par une entité autonome dotée de comportements intelligents. Nous commencerons par définir des stratégies de résolution simples dans lesquelles les pions effectuent des déplacements uniquement sur la base de leur perception de l’occupation des cases voisines. Dans une deuxième étape, nous définirons des stratégies de résolution plus fines permettant aux pions de construire des stratégies de jeu collectives en interagissant avec leur voisinage. L'étudiant peut avoir acces a une premiere implementation deja realisee.

Domaine Intelligence Artificielle
Langage (proposé) C++, java
Responsable du sujet Samir AKNINE

Les récentes évolutions technologiques des dernières années ont permis d’améliorer le niveau d’équipement des véhicules rendus de plus en plus connectés, voire autonomes, ce qui permet de proposer de nouvelles réponses aux problèmes du trafic urbain. Les véhicules sont, à présent, capables de communiquer et de se coordonner. Avec notre projet, nous proposons une approche de régulation du trafic s’appuyant sur des méthodes distribuées pour améliorer les conditions de mobilité des véhicules.

Dans le cadre ce travail, nous implémenterons la méthode de régulation que nous avons définie à l’échelle de l’intersection tirant parti des capacités de communication des véhicules, et dans laquelle les véhicules autonomes négocient leur droit de passage dans chaque intersection. Cette négociation s’effectue en utilisant des mécanismes prédéfinis en s’appuyant sur les données de mobilité de chaque véhicule et en permettant ainsi de prendre en compte différents critères pour la prise de décision locale, comme l’état général du trafic, la localisation d’éventuelles congestions, ou encore la circulation des bus, les trajets programmés par les véhicules, etc. L'étudiant peut avoir acces a une premiere implementation deja realisee.

Domaine Intelligence Artificielle
Langage (proposé) C++, java
Responsable du sujet Samir AKNINE

Nous allons développer un système automatique pour le partage efficace de tâches entre des individus souhaitons collaborer. Nous prendrons comme exemple le covoiturage. Le système devra prendre en compte les préférences et les contraintes des voyageurs pour formuler les meilleures solutions. L’objectif de la coordination entre les voyageurs est de minimiser les coûts des transports. Ce problème est intéressant du fait que les préférences sont diverses et les contraintes sont multiples. De plus les individus ne partagent pas nécessairement toutes leurs informations. Nous considérerons une résolution distribuée et nous testerons ainsi différentes méthodes.

Domaine Intelligence Artificielle
Langage (proposé) C++, java
Responsable du sujet Samir AKNINE

Plusieurs projets urbains innovants d’ilots autonomes tels que le projet du groupe Bouygues-construction pour la gestion intelligente de l’énergie traitent du problème du partage dynamique de l’énergie avec son réseau de communication énergétique et un système de stockage par des batteries de nouvelle génération directement installées dans les bâtiments. Ce projet vise à équiper les foyers avec de nouveaux dispositifs intelligents pour éprouver des solutions originales pour les futurs réseaux de distribution. Il cible l’ouverture des réseaux et l’exploitation automatique des îlots. L’évolution actuelle de ces ilots est renforcée grâce au développement de nouvelles batteries de stockage à fort potentiel et à faibles coûts, et au transfert intelligent de l’énergie entre les ilots avec un câblage interne indépendamment des systèmes de distribution classiques. Ce transfert permet d’envisager une adaptation de la consommation de manière locale, i.e., à l’échelle d’un quartier, en réduisant les coûts et les pertes du transport de l’énergie.

Pour accompagner le développement de ce projet, une solution pour la gestion du surplus d’énergie s’est inscrite en direction des véhicules autonomes solution de stockage et d’usage intelligent de l’énergie renouvelable. Ce modèle de fonctionnement requière l’installation de bornes de rechargement communicantes au niveau des ilots autonomes permettant aux résidents et aux non-résidents de l’ilot d’accéder au surplus d’énergie produite dans ces ilots moyennant une participation financière mais avec un coup d’achat de cette énergie relativement inférieur à celui appliqué par les fournisseurs standards. La gestion de l’énergie doit ainsi être reformulée comme un problème de planification où l’énergie fournie est considérée comme une ressource partagée et intermittente dont l’usage doit être régulé et optimisé par ce nouveau système intelligent. L’objectif de ce projet est ainsi d’implémenter une méthode de résolution qui permet aux véhicules de se recharger auprès des bornes intelligentes et de contrôler dynamiquement les interactions entre les véhicules autonomes et les bornes. L'étudiant peut avoir acces a une premiere implementation deja realisee.

Domaine Intelligence Artificielle
Langage (proposé) C++, java
Responsable du sujet Samir AKNINE

La conduite en peloton est un mode de conduite collaborative où les véhicules forment des groupes ou le premier véhicule, dit le véhicule meneur, est piloté par un conducteur humain ou un programme ; les autres véhicules suivent de manière automatique leur prédécesseur sachant que chaque conducteur peut garder le contrôle de son véhicule. Les véhicules sont directement interconnectés par un réseau sans-fil et échangent des informations en temps réel sur un réseau ad hoc dédié. Cette formation présente de nombreux avantages, notamment de sécurité puisque la signalisation du meneur est automatiquement retransmise aux autres véhicules. Par exemple, si un des véhicules du peloton effectue un freinage d’urgence alors tous ceux qui le suivent freineront instantanément, ainsi le risque de carambolage est réduit. La communication inter véhicules peut alors être utilisée pour pallier au problème de stabilité des pelotons, et leur permet un certain niveau d’organisation interne.

Le rôle de l’étudiant est de formaliser et d’implémenter un ensemble de comportements nécessaires à un véhicule autonome pour qu’il puisse former des pelotons pendant son trajet sans devoir modifier son itinéraire.

Domaines Image Processing / Deep Learning(IA) / Interaction
Techniques et langages Python / PyQt
Responsable du sujet Alexandre Meyer
Niveau de difficulté intermédiaire

L'objectif de ce projet est de developpé une application capable de proposer des curseurs pour éditer la photo d'une classe d'objet (par exemple des visages d'une personne) en se basant sur des auto-encodeurs.

Les auto-encoders sont une classe d'algorithme basée sur les réseaux de neurones profonds qui transforment un jeu de données (des images pour nous) en une représentation latente (cachée) que l'on nomme un code. Ils sont composés d'un encodeur qui produit le code et d'un décodeur qui repasse du code à la données d'origine (l'image). L'objectif de ce sujet est de construire cet auto-encoder sur une classe d'images puis d'offrir à l'utilisateur des curseurs pour éditer le code tout en lui montrant l'image décodé.

Dans un 2e temps, par exemple pour l'édition d'un visage, nous pouvons imaginer construire un auto-encoder pour chaque partie du visage : nez, yeux, bouche. L'utilisateur pourra ainsi éditer chaque partie du visage séparément. Il est également envisageable d'explorer les GAN (Generative Adversarial Network) pour produire une nouvelle image …

GANs vs. Autoencoders: Comparison of Deep Generative Models GAN — Some cool applications of GANs.

Domaines Capture de mouvement/Interaction/Jeu vidéo
Techniques et langages C# / Unity
Responsable du sujet Alexandre Meyer
Difficulté Raisonnable / Intermédiaire

Le suivi de marqueur peut facilement se réaliser avec OpenCV et une webcam. Même plus loin, la capture des mouvements d'un visage ou du corps peut être réalisé avec Dlib (visage) ou OpenPose (il faut néanmoins une machine avec un GPU Nvidia). Ce projet ce propose de developper un (ou des mini jeux) sou Unity pensés pour que l'interaction se fasse avec son corps filmé par la webcam de son ordinateur. On peut imaginer dans un premier temps un mini jeu avec des ballons qui tombent du ciel et qu'il faut attrapper soit avec les mains (marqueurs rouge suivi), soit avec la tête (DLib). Puis si ces outils sont bien maitrisés, libre à vous d'imaginer tout type de jeu : voir les jeux basés sur la Kinect ou Wii avec le même type d'interaction.

Une des difficultés techniques sera l’interfaçage entre Unity et OpenCV. Unity peut charger des librairies dynamiquement (.dll ou .so) mais il y a une phase de configuration technique.

[Unity et OpenCV] https://www.raywenderlich.com/5475-introduction-to-using-opencv-with-unity

Domaines Jeu vidéo
Techniques et langages C# / Unity
Responsable du sujet Alexandre Meyer
Difficulté Raisonnable / Intermédiaire

Mister Red est un personnage 2D représenté par des battons pour chaque partie du corps : jambes, bras, tronc, tête. Ce sujet vous propose de développer le jeu de votre choix incluant Mister Red. La difficulté portera sur produire les animations de Mister Red, plusieurs pistes semblent envisageables. Entrer à la main ou concevoir une petite interface pour entrer les positions des mains, de la tête et des pieds sur des poses clées (1 pose pour debout, 2 poses pour marche, 1 pose coup de pied, 1 pose coup de poing) puis d'interpoler ces positions pour obtenir une animation. Une autre piste serait de partir de capture de mouvement 3D (des animations existent sous Unity) et de les projeter en 2D. La 2e difficulté sera de gérer les interactions entre Mister Red et les décors qui pourront être codée dans des images.

Libre à vous d'imaginer tout type de jeu : combat, aventure, etc.

[Video de Mister Red] https://www.youtube.com/watch?v=MoDGzRa1LW0

Domaines Image Processing
Techniques et langages Python ou C++/OpenGL
Responsable du sujet Alexandre Meyer
Difficulté Sujet progressif

L'objectif de ce projet est de développé un algorithme capable de transférer le mouvement d'un visage d'une personne filmé vers une autre personne. La capture de l'animation du visage source se fera en détectant les points caractéristiques d'un visage filmé avec une webcam en utilisant DLib (python ou C++).

Un premier prototype se fera en générant une nouvelle position de marqueurs de visage puis en réalisant un warping (déformation) de l'image du visage cible. Une interpolation par RBF (ou autre) semble une solution réalisable. Ce warping pourra s'etendre à la déformation d'un maillage 3D, probablement en utilsant Gkit (le code de LIFGRAPHIQUE en L2).

Domaine Classification, Machine Learning
Langage (proposé) C++, java
Responsable du sujet
Fabien Rico
Informations à voir
Ensembles de cours datamining (cf *Arbre de décision* et *Random Forest*)

Le but de votre projet est d'implémenter un algorithme classique de construction d'une forêt.

Pour cela il faut :

  1. implémenter la construction d'un arbre de décision à partir d'un jeu de données d'exemples;
  2. implémenter un système permettant de générer un grand nombre d'arbres de décision;
  3. mettre en place un système de test permettant de mesurer la qualité de vos algorithmes.

Votre logiciel devra être capable à partir d'un fichier d'exemple dans un format simple (CSV) de construire un modèle. Puis à partir d'un modèle et d'un fichier de test dans le même format de trouver les classes des objets.

Améliorations

Les améliorations possibles de votre travail pourront porter sur les différentes optimisations ou adaptations de l'algorithme à des cas spécifiques, sur l'amélioration du temps de calcul et du coût mémoire de votre programme. Vous pourrez aussi ajouter des prétraitements pour résoudre les cas ou les données sont lacunaires ou ajouter une interface graphique au programme.

Domaine administration système
Technologie Docker
Responsable du sujet Fabien Rico
Information à voir
https://nextcloud.com/
https://rocket.chat/
https://fr.wordpress.org/

Le but de ce travail est de créer un script d'installation d'un site de travail collaboratif. Ce site est basé sur plusieurs composant

  • nextcloud qui permettra le partage de documents, l'édition en ligne …;
  • rocketchat qui permettra les discussions en lignes.
  • wordpress (ou autre chose) qui permettra de créer un site web classique;

Ces composants devront de plus s'appuyer sur un système d'authentification unique (ldap?).

Pour simplifier l'installation automatique de l'ensemble, vous devrez utiliser des conteneurs docker. Le résultat de votre travail doit être une archive et un script dont l'exécution permettra d'installer l'ensemble des composant et de les faire communiquer.

Amélioration

Il y a un grand nombre de composants annexes pouvant être ajouter : webmail, forge, système d'authentification CAS/OpenIDConnect … Il est aussi possible d'ajouter des modules utiles au composants proposé : conférence vidéo pour rocketchat, édition de documents pour owncloud …

Domaine administration système
Technologie Docker, Ldap
Responsable du sujet Fabien Rico
Information à voir
https://rocket.chat/

Le but de ce travail est de créer chat pour les étudiants du département. Il doit leur permettre la discussion en ligne mais surtout s'intégrer avec le système d'information de l'université. Par exemple,vous devrez configurer un bot qui écoutera les conversations pour reconnaitre certaines commande. Ce dernier devra permettre d'ajouter à une discussion tous les étudiants inscrit à une UE ou à une année d'étude.

Pour simplifier l'installation automatique de l'ensemble, vous devrez utiliser des conteneurs docker.

Amélioration

Il est possible d'étendre les fonctionnalité de rocketchat. Une autre manière est de développer un robot pour d'autre tâches.

Domaine administration système
Techniques Docker, machines virtuelles
Responsable du sujet
Fabien Rico
Information à voir
https://www.docker.com/
http://spark.apache.org/

Pour gérer de grands volumes de données, plusieurs framework ont été développés. Spark est l'un d'entre eux, il permet de définir des programmes dont les calculs seront facilement et efficacement distribués sur un cluster. Mais ces cluster doivent être créés. Vous devez créer un système capable de mettre en place un cluster spark et de lui soumettre des tâches de calcul.

Le système que vous allez développer pourra utiliser un outil comme docker-machine pour créer des machines virtuelles dans une plateforme de cloud computing (celle du département), puis les conteneurs dockers pour lancer les différentes parties du cluster de calcul. Enfin, il soumettront les tâches au cluster pour obtenir leurs résultats.

Amélioration

  • utilisation d'une plateformes de cloud computing publique (AWS, Azure, …)
  • utilisation d'autres frameworks (hadoop)
  • interface web de gestion
Domaine web
Langage php ou JS
Responsable du sujet Fabien Rico
Information à voir
http://laravel.com/
http://symfony.com/
https://fr.vuejs.org/

Le but de ce sujet est de mettre en place un site web avec une partie visible (front) et une partie d'administration (backend). Le sujet du site est encore indéterminé (et des idées sont les bienvenues). Il devra comporter une part de programmation importante (ne pas uniquement installer un CMS). Il devra comporter un système de gestion des utilisateurs, des droits, de modification du front…

Amélioration

Selon la difficulté technique de certaines parties du site :

  • authentification web basée sur openid connect, ou CAS;
  • lien avec les réseaux sociaux
Domaine méta heuristiques, optimisation, moteur physique
Langage C++, python, etc. ?
Responsable du sujet Fabien Rico et Alexandre Meyer
Information à voir
http://jvf.free.fr/550_Articles_LinuxMag/GLMF_076_034_041.pdf
https://www.youtube.com/watch?v=JBgG_VSP7f8
https://www.youtube.com/watch?v=m4E9sj9vH1I

Les algorithmes évolutionnistes ou génétiques sont des méta-heuristique d'optimisation c'est à dire des méthodes globales pour résoudre des problèmes de toutes sorte qu'il faut adapté à un problème particulier. Comme leur nom l'indique, ils sont basés sur le concepts d'évolution. On génère une famille aléatoire d'individu dont on conserve les plus performant, que l'on mélange pour générer une nouvelle famille …

  • projet/2019/aut/start.txt
  • Dernière modification : 2019/09/12 08:16
  • de alexandre.meyer