projet:2019:pri:sujets

Ceci est une ancienne révision du document !


Domaine Classification, Machine Learning
Langage (proposé) C++, java
Responsable du sujet
Fabien Rico
Informations à voir
Ensembles de cours datamining (cf *Arbre de décision* et *Random Forest*)

Le but de votre projet est d'implémenter un algorithme classique de construction d'une forêt.

Pour cela il faut :

  1. implémenter la construction d'un arbre de décision à partir d'un jeu de données d'exemples;
  2. implémenter un système permettant de générer un grand nombre d'arbres de décision;
  3. mettre en place un système de test permettant de mesurer la qualité de vos algorithmes.

Votre logiciel devra être capable à partir d'un fichier d'exemple dans un format simple (CSV) de construire un modèle. Puis à partir d'un modèle et d'un fichier de test dans le même format de trouver les classes des objets.

Améliorations

Les améliorations possibles de votre travail pourront porter sur les différentes optimisations ou adaptations de l'algorithme à des cas spécifiques, sur l'amélioration du temps de calcul et du coût mémoire de votre programme. Vous pourrez aussi ajouter des prétraitements pour résoudre les cas ou les données sont lacunaires ou ajouter une interface graphique au programme.

Domaine administration système
Technologie Docker
Responsable du sujet Fabien Rico
Information à voir
https://owncloud.org/
https://rocket.chat/
https://fr.wordpress.org/

Le but de ce travail est de créer un script d'installation d'un site de travail collaboratif. Ce site est basé sur plusieurs composant

  • owncloud qui permettra le partage de documents;
  • rocketchat qui permettra les discussions en lignes.
  • wordpress (ou autre chose) qui permettra de créer un site web classique;

Ces composants devront de plus s'appuyer sur un système d'authentification unique (ldap?).

Pour simplifier l'installation automatique de l'ensemble, vous devrez utiliser des conteneurs docker. Le résultat de votre travail doit être une archive et un script dont l'exécution permettra d'installer l'ensemble des composant et de les faire communiquer.

Amélioration

Il y a un grand nombre de composants annexes pouvant être ajouter : webmail, forge, système d'authentification CAS/OpenIDConnect … Il est aussi possible d'ajouter des modules utiles au composants proposé : conférence vidéo pour rocketchat, édition de documents pour owncloud …

Domaine administration système
Techniques Docker, machines virtuelles
Responsable du sujet
Fabien Rico
Information à voir
https://www.docker.com/
http://spark.apache.org/

Pour gérer de grands volumes de données, plusieurs framework ont été développés. Spark est l'un d'entre eux, il permet de définir des programmes dont les calculs seront facilement et efficacement distribués sur un cluster. Mais ces cluster doivent être créés. Vous devez créer un système capable de mettre en place un cluster spark et de lui soumettre des tâches de calcul.

Le système que vous allez développer pourra utiliser un outil comme docker-machine pour créer des machines virtuelles dans une plateforme de cloud computing (celle du département), puis les conteneurs dockers pour lancer les différentes parties du cluster de calcul. Enfin, il soumettront les tâches au cluster pour obtenir leurs résultats.

Amélioration

  • utilisation d'une plateformes de cloud computing publique (AWS, Azure, …)
  • utilisation d'autres frameworks (hadoop)
  • interface web de gestion
Domaine web
Langage php
Responsable du sujet Fabien Rico
Information à voir
http://laravel.com/
http://symfony.com/

Le but de ce sujet est de mettre en place un site web avec une partie visible (front) et une partie d'administration (backend). Le sujet du site est encore indéterminé (et des idées sont les bienvenues). Il devra comporter une part de programmation importante (ne pas uniquement installer un CMS). Il devra comporter un système de gestion des utilisateurs, des droits, de modification du front…

Amélioration

Selon la difficulté technique de certaines parties du site :

  • authentification web basée sur openid connect, ou CAS;
  • lien avec les réseaux sociaux
Domaine méta heuristiques
Langage C, python ?
Responsable du sujet Fabien Rico et Alexandre Meyer
Information à voir
http://jvf.free.fr/550_Articles_LinuxMag/GLMF_076_034_041.pdf
https://www.youtube.com/watch?v=JBgG_VSP7f8

Les algorithmes génétiques sont des méta heuristique d'optimisation c'est à dire des méthodes globales pour résoudre des problèmes de toutes sorte qu'il faut adapté à un problème particulier. Comme leur nom l'indique, ils sont basés sur le concepts d'évolution. On génère une famille aléatoire d'individu dont on conserve les plus performant, que l'on mélange pour générer une nouvelle famille …

Domaine Intelligence Artificielle
Langage (proposé) C++, java
Responsable du sujet Samir AKNINE

L’objectif de ce projet est de proposer une modélisation distribuée d’un jeu stratégique. Nous prendrons comme exemple une version proche du jeu de dames. Nous considérerons un ensemble de pions qui évoluent sur un plateau. Les pions sont répartis en deux groupes. Plusieurs pions d’un même groupe peuvent se déplacer en même temps selon des règles préétablies. L’objectif de chaque groupe est de remporter la partie en capturant les pions du groupe adverse. Nous implémenterons une méthode de résolution distribuée dans laquelle chaque pion est représenté par une entité autonome dotée de comportements intelligents. Nous commencerons par définir des stratégies de résolution simples dans lesquelles les pions effectuent des déplacements uniquement sur la base de leur perception de l’occupation des cases voisines. Dans une deuxième étape, nous définirons des stratégies de résolution plus fines permettant aux pions de construire des stratégies de jeu collectives en interagissant avec leur voisinage.

Domaine Intelligence Artificielle
Langage (proposé) C++, java
Responsable du sujet Samir AKNINE

Les récentes évolutions technologiques des dernières années ont permis d’améliorer le niveau d’équipement des véhicules rendus de plus en plus connectés, voire autonomes, ce qui permet de proposer de nouvelles réponses aux problèmes du trafic urbain. Les véhicules sont, à présent, capables de communiquer et de se coordonner. Avec notre projet, nous proposons une approche de régulation du trafic s’appuyant sur des méthodes distribuées pour améliorer les conditions de mobilité des véhicules.

Dans le cadre ce travail, nous implémenterons la méthode de régulation que nous avons définie à l’échelle de l’intersection tirant parti des capacités de communication des véhicules, et dans laquelle les véhicules autonomes négocient leur droit de passage dans chaque intersection. Cette négociation s’effectue en utilisant des mécanismes prédéfinis en s’appuyant sur les données de mobilité de chaque véhicule et en permettant ainsi de prendre en compte différents critères pour la prise de décision locale, comme l’état général du trafic, la localisation d’éventuelles congestions, ou encore la circulation des bus, les trajets programmés par les véhicules, etc.

Domaine Intelligence Artificielle
Langage (proposé) C++, java
Responsable du sujet Samir AKNINE

Nous allons développer un système automatique pour le partage efficace de tâches entre des individus souhaitons collaborer. Nous prendrons comme exemple le covoiturage. Le système devra prendre en compte les préférences et les contraintes des voyageurs pour formuler les meilleures solutions. L’objectif de la coordination entre les voyageurs est de minimiser les coûts des transports. Ce problème est intéressant du fait que les préférences sont diverses et les contraintes sont multiples. De plus les individus ne partagent pas nécessairement toutes leurs informations. Nous considérerons une résolution distribuée et nous testerons ainsi différentes méthodes.

Domaine Intelligence Artificielle
Langage (proposé) C++, java
Responsable du sujet Samir AKNINE

Plusieurs projets urbains innovants d’ilots autonomes tels que le projet du groupe Bouygues-construction pour la gestion intelligente de l’énergie traitent du problème du partage dynamique de l’énergie avec son réseau de communication énergétique et un système de stockage par des batteries de nouvelle génération directement installées dans les bâtiments. Ce projet vise à équiper les foyers avec de nouveaux dispositifs intelligents pour éprouver des solutions originales pour les futurs réseaux de distribution. Il cible l’ouverture des réseaux et l’exploitation automatique des îlots. L’évolution actuelle de ces ilots est renforcée grâce au développement de nouvelles batteries de stockage à fort potentiel et à faibles coûts, et au transfert intelligent de l’énergie entre les ilots avec un câblage interne indépendamment des systèmes de distribution classiques. Ce transfert permet d’envisager une adaptation de la consommation de manière locale, i.e., à l’échelle d’un quartier, en réduisant les coûts et les pertes du transport de l’énergie.

Pour accompagner le développement de ce projet, une solution pour la gestion du surplus d’énergie s’est inscrite en direction des véhicules autonomes solution de stockage et d’usage intelligent de l’énergie renouvelable. Ce modèle de fonctionnement requière l’installation de bornes de rechargement communicantes au niveau des ilots autonomes permettant aux résidents et aux non-résidents de l’ilot d’accéder au surplus d’énergie produite dans ces ilots moyennant une participation financière mais avec un coup d’achat de cette énergie relativement inférieur à celui appliqué par les fournisseurs standards. La gestion de l’énergie doit ainsi être reformulée comme un problème de planification où l’énergie fournie est considérée comme une ressource partagée et intermittente dont l’usage doit être régulé et optimisé par ce nouveau système intelligent. L’objectif de ce projet est ainsi d’implémenter une méthode de résolution qui permet aux véhicules de se recharger auprès des bornes intelligentes et de contrôler dynamiquement les interactions entre les véhicules autonomes et les bornes.

Domaines IA et Image
Techniques Apprentissage par renforcement
Langages C# / Unity et éventuellement python
Responsable du sujet
Alexandre Meyer
Informations à voir Unity et Apprentissage Machine

Unity est un framework devenu hyper classique pour le développement de jeux vidéo. Ce sujet se propose de vous faire explorer trois aspects.

  • La création d'un ou des mini jeu avec Unity.
  • Les algorithmes classique d'apprentissage par renforcement (QLearning, etc.) pour qu'un programme joue automatiquement aux mini jeux.
  • Et les outils mise à disposition des développeurs Unity pour qu'une “IA” apprenne à jouer à un jeu via tout une série d'algorithmes d'apprentissage par renforcement déjà codés mais si évident à entrainer sans une bonne compréhension du problème (ML-Agent).

C'est un sujet assez exploratoire et demandant une bonne capacité à aller se documenter seul sur les différents algorithmes qu'il sera possible de mettre en place. Vous viserez un mini jeu déjà développé et dans un 1er temps vous mettrez en place une IA très basique, voir même jouant au hasard en ne gardant que les meilleurs actions.

Domaines Image Processing / Deep Learning
Techniques et langages Python
Responsable du sujet
Alexandre Meyer
Informations à voir

L'objectif de ce projet est de developpé un algorithme capable de modifier/éditer le visage d'une personne filmé : par exemple rendre son discours plus joyeux, piloter le visage d'une autre personne, etc. La capture de l'animation du visage source se fera en detectant les points caractéristiques d'un visage filmé avec une webcam en utilisant DLib (python ou C++). Un premier prototype se fera simplement en générant une nouvelle position de marqueurs de visage puis en réalisant un warping (déformation) de l'image du visage cible.

Le deuxième aspect porte sur l'apprentisasge profond dont certains algorithmes (GAN, autoencoder) sont capables d'apprendre à générer de nouvelles données. Ces algorithmes ont montré de très bonnes capacités pour la génération de nouveau visage : vieillissement, modification de l'expression, de la couleur des cheveux, etc.

GAN — Some cool applications of GANs.

Domaines Image/Capture de mouvement
Techniques et langages C# / Unity
Responsable du sujet
Alexandre Meyer
Informations à voir

La capture de l'animation d'un visage ou du corps via une webcam peut facilement être réalisé avec OpenPose (il faut néanmoins une machine avec un GPU Nvidia), ou DLIb pour juste le visage. Ce projet ce propose de developper un (ou des mini jeux) sou Unity pensés pour que l'interaction se fasse avec son corps filmé par la webcam de son ordinateur. On peut imaginer dans un premier temps un mini jeu avec des ballons qui tombent du ciel et qu'il faut attrapper soit avec les mains (corps), soit avec la tête (DLib). Puis si ces outils sont bien maitrisés, libre à vous d'imaginer tout type de jeu : voir les jeux basés sur la Kinect ou Wii avec le même type d'interaction.

Domaines data science, visualisation, web
Librairies (proposées) scikit-learn, bootstrap
Langages (proposé) Python, javascript, html/css…
Responsable du sujet Rémy Cazabet
Informations à voir -

Les compteurs électriques intelligents (Linky) permettent de suivre notre consommation électrique demi-heure par demi-heure. Vous développerez une application web pour permettre à chacun de comprendre (et idéalement de réduire…) sa consommation électrique. Un projet précédent a accompli les premières étapes (script de récupération des données…), mais n'a pas mis en place d'outils de fouille de données ni de visualisation avancé. Vos objectifs seront notamment de convertir la consommation en kw/h collectée en une information compréhensible (euros par heure, ..), d'essayer de détecter automatiquement des patterns d'utilisation (ballon d'eau chaude, consommation lors des repas, etc.) et de permettre à l'utilisateur d'explorer les données le concernant.

Domaines data science, visualisation, traitement automatique de la langue
Librairies (proposées) scikit-learn, bootstrap
Langages (proposé) Python, javascript, html/css…
Responsable du sujet Rémy Cazabet
Informations à voir Portail de l'université de Lyon

Les informations des publications scientifiques des chercheurs de Lyon sont accessibles en ligne via un site web qui offre une API. Vous développerez une application (web ou non) utilisant des outils de fouille de données (Clustering, analyse de réseaux, traitement automatique du language …) pour permettre d'exploiter ces données. Par example, l'application permettra de détecter automatiquement les sujets “à la mode” (Deep learning…), de visualiser des graphes thématiques, des collaborations entre laboratoires, etc.

Domaines Machine Learning (“Intelligence Artificielle”)
Librairies (proposées) scikit-learn, keras, tensor-flow…
Langages (proposé) Python, autre
Responsable du sujet Rémy Cazabet
Informations à voir Challenges Kaggle en cours

Kaggle est le site web le plus connu de challenges en machine learning. En 2 mots: des entreprises proposent des challenges auxquels n'importe qui peut tenter de proposer une solution. La meilleure solution gagne. Mais là où Kaggle est particulièrement intéressant, c'est qu'il propose des tutoriels pour résoudre certains problèmes classiques, en utilisant différentes méthodes. Votre objectif: 1) Suivre un/des tutoriels pour résoudre un problème tout fait, 2)Choisir un challenge en cours et appliquer ce que vous avez appris

Domaines Visualisation, exploitation de données
Librairies (proposées) mapbox, leaflet, d3
Langages (proposé) javascript, html/css, language back-end (python?…)
Responsable du sujet Rémy Cazabet
Informations à voir Projet semestre précédent

Le but de ce projet est de créer une carte interactive des restaurants/bars (et/ou autres lieux) de Lyon, avec pour objectif de faire un vrai site utile. Attention ! Ce projet est réservé à une équipe motivée, car il est INDISPENSABLE de faire mieux que le travail précédent, qui est déjà le résultat de 3 projets successifs. Il est donc obligatoire de réutiliser une partie du travail déjà effectué (tous les codes sont disponibles). Plusieurs éléments sont à travailler: amélioration de l'interface, ajout de données de sources différentes (actuellement: Google maps et un peu Yelp), solution pour supprimer les temps de chargement, ajout de quelques fonctionnalitées de “fouille de données” (exploitation des commentaires, notes, textes descriptifs, …).

Domaines Machine Learning (IA), génie logiciel, logiciel libre
Librairies - la votre :)
Langages (proposé) python, interfacage avec du c
Responsable du sujet Rémy Cazabet
Informations à voir

Nclib (Network Community Library) est une librairie de machine learning, développé en python pour le problème du clustering de graphe, aussi appelé detection de communautés. Il s’agit d’une librarie encore en phase bêta, donc non publique, dont le but est de rassembler un ensemble d’algorithmes pour répondre à ce problème. Elle est pour l’instant développé par 2 chercheurs au sein du projet européen SoBigData (http://sobigdata.eu/index). Dans le cadre de ce projet, vous contribuerez en ajoutant des algorithmes publiés mais non présents dans la librairie (d'autres contributions sont possibles). Selon votre intérêt et vos compétences, il pourra s’agir de faire le pont avec des librairies existantes, par exemple: https://graph-tool.skewed.de, d’intégrer des méthodes récentes basées sur les réseaux de neurones, voire de ré-implémenter des méthodes existantes dont le code ne serait pas disponible ou non-compatible.

Une attention particulière sera portée à produire un code propre et standard, (tests unitaires, commentaires adaptés à une génération automatique de documentation, etc.) pour qu’il soit intégré à une libraire de recherche publique. Il s’agit également d’une bonne introduction au machine learning/ intelligence artificielle.

  • projet/2019/pri/sujets.1548011923.txt.gz
  • Dernière modification : 2019/01/20 20:18
  • de remy.cazabet