projet:sujets2018printemps

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
projet:sujets2018printemps [2018/01/25 10:42] aurelie.kong-win-chaprojet:sujets2018printemps [2018/01/30 14:33] (Version actuelle) – [FM3. Système de sondage anonyme] + sujet complet aurelie.kong-win-cha
Ligne 171: Ligne 171:
 On cherche ici à implémenter un algorithme de compression d'image avec perte (comme jpeg). L'image que l'on utilise (ou une partie de celle-ci) peut être vue comme une matrice. On peut utiliser sur cette matrice des techniques de réduction de dimension, c'est à dire obtenir une matrice de dimension plus petite qui contient l'essentielle de l'information de départ. C'est le rôle de l'analyse en composante principale (PCA). À partir de cette matrice plus petite (compressée), on peut reconstruire l'image de départ avec quelques déformations dépendant du taux de compression utilisé. On cherche ici à implémenter un algorithme de compression d'image avec perte (comme jpeg). L'image que l'on utilise (ou une partie de celle-ci) peut être vue comme une matrice. On peut utiliser sur cette matrice des techniques de réduction de dimension, c'est à dire obtenir une matrice de dimension plus petite qui contient l'essentielle de l'information de départ. C'est le rôle de l'analyse en composante principale (PCA). À partir de cette matrice plus petite (compressée), on peut reconstruire l'image de départ avec quelques déformations dépendant du taux de compression utilisé.
  
-Votre programme devra être capacle de lire une image sous un format simple (sans perte), et produire un fichier compressé. Il devra bien sur permettre d'appliquer le traitement inverse.+Votre programme devra être capable de lire une image sous un format simple (sans perte), et produire un fichier compressé. Il devra bien sur permettre d'appliquer le traitement inverse.
  
 ==Améliorations== ==Améliorations==
Ligne 177: Ligne 177:
   - ajouter une interface graphique;   - ajouter une interface graphique;
   - mettre en place un système de comparaison avec la représentation jpeg;   - mettre en place un système de comparaison avec la représentation jpeg;
-  - améliorer le temps de calcule et le cout mémoire de votre programme.+  - améliorer le temps de calcul et le coût mémoire de votre programme.
  
 ===== FR3. Mise en place de cluster de calcul parallèle ===== ===== FR3. Mise en place de cluster de calcul parallèle =====
Ligne 187: Ligne 187:
 |  http://spark.apache.org/       || |  http://spark.apache.org/       ||
  
-Pour gérer de grands volumes de donnés, plusieurs //framework// on été développé. //Spark// est l'un d'entre eux, il permet de définir des programmes dont les calculs seront facilement et efficacement distribué sur un cluster. Vous devez créer un système capable de mettre en place un cluster spark et de lui soumettre des tâche de calcul.+Pour gérer de grands volumes de données, plusieurs //framework// ont été développés. //Spark// est l'un d'entre eux, il permet de définir des programmes dont les calculs seront facilement et efficacement distribués sur un cluster. Vous devez créer un système capable de mettre en place un cluster spark et de lui soumettre des tâche de calcul.
  
-Le système que vous allez développer pourra utiliser un outils comme //docker-machine// pour créer des machines virtuelle dans une plateforme de //cloud computing// (celle du département), puis les conteneurs //dockers// pour lancer les différentes partie du cluster. Enfin, il soumettrons les tâche au cluster pour obtenir leurs résultats.+Le système que vous allez développer pourra utiliser un outil comme //docker-machine// pour créer des machines virtuelles dans une plateforme de //cloud computing// (celle du département), puis les conteneurs //dockers// pour lancer les différentes parties du cluster. Enfin, il soumettront les tâches au cluster pour obtenir leurs résultats.
  
 ===Amélioration=== ===Amélioration===
-  * utilisation de plusieurs plateforme de //cloud computing// (AWS, Azure, ...) +  * utilisation de plusieurs plateformes de //cloud computing// (AWS, Azure, ...) 
-  * utilisation d'autre //framework// (hadoop)+  * utilisation d'autres //frameworks// (hadoop)
   * interface web de gestion   * interface web de gestion
  
Ligne 206: Ligne 206:
  
 Le but de ce sujet est de mettre en place un site web avec une partie visible (front) et une partie d'administration (backend). Le but de ce sujet est de mettre en place un site web avec une partie visible (front) et une partie d'administration (backend).
-Le sujet du site est encore indéterminé (et des idées sont les bienvenues). Il ne devra comporter une part de programmation important (ne pas uniquement installer un CMS). Il devra comporter un système de gestion des utilisateur, des droits, de modification du front...+Le sujet du site est encore indéterminé (et des idées sont les bienvenues). Il devra comporter une part de programmation importante (ne pas uniquement installer un CMS). Il devra comporter un système de gestion des utilisateurs, des droits, de modification du front...
  
-Le langage de programmation est laissé libre, mais le site se basera sur la technologie des docker pour être mis en place de manière simplifiée.+Le langage de programmation est laissé libre, mais le site se basera sur la technologie des dockers pour être mis en place de manière simplifiée.
  
 ==Amélioration== ==Amélioration==
Ligne 221: Ligne 221:
 ^ Responsable du sujet                      |                   | ^ Responsable du sujet                      |                   |
 |                                           | Fabrice Mouhartem | |                                           | Fabrice Mouhartem |
 +^ Sujet Complet | [[https://perso.ens-lyon.fr/fabrice.mouhartem/LIFProj1-fr.html#fm1.-chiffrement-fond%C3%A9-sur-lidentit%C3%A9| https://perso.ens-lyon.fr/fabrice.mouhartem/LIFProj1-fr.html]] |
 ^ Informations à voir                                         | ^ Informations à voir                                         |
 |                                           | [[https://en.wikipedia.org/wiki/ID-based_encryption| Identity-Based Encryption (en)]]; [[https://en.wikipedia.org/wiki/Public_key_infrastructure| Public-Key infrastructures (en)]]; [[https://fr.wikipedia.org/wiki/Cryptographie_hybride| Chiffrement hybride]]; [[https://fr.wikipedia.org/wiki/Attaque_par_canal_auxiliaire|Attaque par canal auxiliaire]]                  |                                           | [[https://en.wikipedia.org/wiki/ID-based_encryption| Identity-Based Encryption (en)]]; [[https://en.wikipedia.org/wiki/Public_key_infrastructure| Public-Key infrastructures (en)]]; [[https://fr.wikipedia.org/wiki/Cryptographie_hybride| Chiffrement hybride]]; [[https://fr.wikipedia.org/wiki/Attaque_par_canal_auxiliaire|Attaque par canal auxiliaire]]                 
Ligne 234: Ligne 235:
 Cette méthodologie devient ainsi résistante aux [[https://fr.wikipedia.org/wiki/Attaque_de_l%27homme_du_milieu|attaques de l'homme du milieu]].  Cette méthodologie devient ainsi résistante aux [[https://fr.wikipedia.org/wiki/Attaque_de_l%27homme_du_milieu|attaques de l'homme du milieu]]. 
  
-''Objectifs:'' Le but de ce projet est ainsi d'implanter une mécanique de chiffrement par identité (couplée à un chiffrement hybride), cryptographiquement sure. L'implantation devra donc être résistante aux attaques par canaux auxiliaires, et une possible intégration à un client lourd pour les e-mails.+**Objectifs:** Le but de ce projet est ainsi d'implanter une mécanique de chiffrement par identité (couplée à un chiffrement hybride), cryptographiquement sure. L'implantation devra donc être résistante aux attaques par canaux auxiliaires, et une possible intégration à un client lourd pour les e-mails.
  
 ===== FM2. Cryptanalyse de schémas asymétriques  ===== ===== FM2. Cryptanalyse de schémas asymétriques  =====
Ligne 242: Ligne 243:
 ^ Responsable du sujet                      |                   | ^ Responsable du sujet                      |                   |
 |                                           | Fabrice Mouhartem | |                                           | Fabrice Mouhartem |
 +^ Sujet complet | [[https://perso.ens-lyon.fr/fabrice.mouhartem/LIFProj1-fr.html#fm2.-cryptanalyse-de-sch%C3%A9mas-asym%C3%A9triques| https://perso.ens-lyon.fr/fabrice.mouhartem/LIFProj1-fr.html]] |
 ^ Informations à voir                                         | ^ Informations à voir                                         |
 |                                           | [[https://en.wikipedia.org/wiki/General_number_field_sieve|Crible algébrique (en)]]                  |  |                                           | [[https://en.wikipedia.org/wiki/General_number_field_sieve|Crible algébrique (en)]]                  | 
Ligne 249: Ligne 251:
 La sécurité de ce protocole repose sur le fait que la clef publique, qui est le produit de deux grands nombres premiers, est difficile à factoriser. Le but est donc d'utiliser les méthodes récentes pour la résolution de ce problème, et de les déployer sur des exemples assez gros à l'aide des ressources informatiques de l'Université. La sécurité de ce protocole repose sur le fait que la clef publique, qui est le produit de deux grands nombres premiers, est difficile à factoriser. Le but est donc d'utiliser les méthodes récentes pour la résolution de ce problème, et de les déployer sur des exemples assez gros à l'aide des ressources informatiques de l'Université.
  
-''Thématiques abordées:''+**Thématiques abordées:**
   * Manipulation de grands entiers   * Manipulation de grands entiers
   * Algèbre linéaire creuse   * Algèbre linéaire creuse
Ligne 260: Ligne 262:
 ^ Responsable du sujet                      |                   | ^ Responsable du sujet                      |                   |
 |                                           | Fabrice Mouhartem | |                                           | Fabrice Mouhartem |
 +^ Sujet Complet  | [[https://perso.ens-lyon.fr/fabrice.mouhartem/LIFProj1-fr.html#fm3.-syst%C3%A8me-de-sondage-anonyme| https://perso.ens-lyon.fr/fabrice.mouhartem/LIFProj1-fr.html]] |
 ^ Informations à voir                                         | ^ Informations à voir                                         |
 |                                           | [[http://www.belenios.org/|Bélénios]] [[https://anonize.org/|Anonize]]                    |                                           | [[http://www.belenios.org/|Bélénios]] [[https://anonize.org/|Anonize]]                   
Ligne 282: Ligne 285:
 |                                           | [[https://www.elastic.co/|ElasticSearch]], [[http://babelnet.org/|BabelNet]] | |                                           | [[https://www.elastic.co/|ElasticSearch]], [[http://babelnet.org/|BabelNet]] |
  
-Le but du projet est de créer un outil capable d'assigner à des articles journalistiques un ou plusieurs label correspondant à leur sujet. Cela permettrait ainsi de fournir un outil pour aider les journaliste à trier et traiter ces articles. Ce projet se base sur un logiciel actuellement développement et pourra éventuellement s'y intégrer. Ce projet demande d'apprendre à utiliser plusieurs techniques de traitement automatique de la langue récentes (TAL/NLP), comme par exemple le //word embedding// (plongement lexical). Il vous familiarisera aussi avec l'apprentissage automatique et l'utilisation de services web.+Le but du projet est de créer un outil capable d'assigner à des articles journalistiques un ou plusieurs labels correspondant à leur sujet. Cela permettrait ainsi de fournir un outil pour aider les journalistes à trier et traiter ces articles. Ce projet se base sur un logiciel actuellement en développement et pourra éventuellement s'y intégrer. Ce projet demande d'apprendre à utiliser plusieurs techniques de traitement automatique de la langue récentes (TAL/NLP), comme par exemple le //word embedding// (plongement lexical). Il vous familiarisera aussi avec l'apprentissage automatique et l'utilisation de services web.
  
 ===Amélioration===  ===Amélioration=== 
Ligne 304: Ligne 307:
 On peut facilement utiliser l'API Twitter pour télécharger des //tweets// sur des sujets particuliers. Si on est capable d'analyser les sentiments exprimés dans les tweets, on peut alors mesurer la popularité d'un produit, d'une personne ou d'un sujet. Pour cela il est nécessaire de construire un ensemble d'apprentissage, ce qui peut être fait en utilisant les émoticones. En effet, on peut généralement supposer que les tweets contenants des émoticones souriants sont positifs et ceux contenants des émoticones tristes sont négatifs. On peut facilement utiliser l'API Twitter pour télécharger des //tweets// sur des sujets particuliers. Si on est capable d'analyser les sentiments exprimés dans les tweets, on peut alors mesurer la popularité d'un produit, d'une personne ou d'un sujet. Pour cela il est nécessaire de construire un ensemble d'apprentissage, ce qui peut être fait en utilisant les émoticones. En effet, on peut généralement supposer que les tweets contenants des émoticones souriants sont positifs et ceux contenants des émoticones tristes sont négatifs.
  
-Vous devez faire un projet capable de construire un jeux de données suffisamment important pour entrainer des classifieurs. Ces derniers utilierons des techniques de NLP récentes et des algorithmes d'apprentissage pour gé,érer des modèles capables de reconnaitre la polarité d'un tweet.+Vous devez faire un projet capable de construire un jeu de données suffisamment important pour entraîner des classifieurs. Ces derniers utiliseront des techniques de NLP récentes et des algorithmes d'apprentissage pour générer des modèles capables de reconnaître la polarité d'un tweet.
  
 ===Amélioration=== ===Amélioration===
Ligne 322: Ligne 325:
 |                                           | [[http://www.istex.fr/istex-excellence-initiative-of-scientific-and-technical-information/|ISTEX]] | |                                           | [[http://www.istex.fr/istex-excellence-initiative-of-scientific-and-technical-information/|ISTEX]] |
  
-Ce projet vise à développer une interface web interactive pour détecter les paraphrases dans les résumé d'articles scientifiques. Il s’appuiera sur la base de données ISTEX qui contient des millions d'articles et devra être capable de lire les résumés et utiliser un modèle de similarité de phrases pour trouver et visualiser les phrases similaires entre des résumés.+Ce projet vise à développer une interface web interactive pour détecter les paraphrases dans les résumés d'articles scientifiques. Il s’appuiera sur la base de données ISTEX qui contient des millions d'articles et devra être capable de lire les résumés et utiliser un modèle de similarité de phrases pour trouver et visualiser les phrases similaires entre des résumés.
  
 ===Amélioration=== ===Amélioration===
-  * Permettre d'obtenir un retour des utilisateur et l'intégrer au modèle dans le but d'améliorer son résultat.+  * Permettre d'obtenir un retour des utilisateurs et l'intégrer au modèle dans le but d'améliorer son résultat.
   * Utiliser la détection de périphrase pour effectuer une recherche d'un document dans la base de donnée ISTEX à partir d'un document fourni.   * Utiliser la détection de périphrase pour effectuer une recherche d'un document dans la base de donnée ISTEX à partir d'un document fourni.
  
Ligne 340: Ligne 343:
 |                                           | [[https://developers.facebook.com/| Développement Facebook]] | |                                           | [[https://developers.facebook.com/| Développement Facebook]] |
  
-Le but est de développer un robot capable de comprendre une requête de réservation exprimée en langage naturel. Il sera donc nécessaire de reconnaitre dans la phrase les mots important représentant, les lieux, les dates, ... C'est ce qu'on appelle les entités nommées. Pour cela, il sera possible d'utiliser l'API //dialogflow// qui permet d'utiliser le français. Il faudra ensuite exécuter des requêtes sur une plateforme de réservation comme [[https://www.hotelscombined.com/|HotelCombined]].+Le but est de développer un robot capable de comprendre une requête de réservation exprimée en langage naturel. Il sera donc nécessaire de reconnaître dans la phrase les mots importants représentant, les lieux, les dates, ... C'est ce qu'on appelle les entités nommées. Pour cela, il sera possible d'utiliser l'API //dialogflow// qui permet d'utiliser le français. Il faudra ensuite exécuter des requêtes sur une plateforme de réservation comme [[https://www.hotelscombined.com/|HotelCombined]].
  
 ===Amélioration=== ===Amélioration===
-  * Une meilleur reconnaissance du langage naturel.+  * Une meilleure reconnaissance du langage naturel.
   * Une intégration à facebook via la création d'un chatbot avec Messenger.   * Une intégration à facebook via la création d'un chatbot avec Messenger.
  
  • projet/sujets2018printemps.1516873376.txt.gz
  • Dernière modification : 2018/01/25 10:42
  • de aurelie.kong-win-cha