Accès à l'information textuelle hétérogène

Résumé Définition et instrumentation d'un format pivot de documents basé sur XML
Encadreur Lionel Médini
Nombre de personnes (min-max) 1-2
Compétences requises XML, langage Java
Formation mil, miage
Importance (A-E) A
Mots-clefs (séparés par une virgule)XML, Java, Documents Virtuels, Gestion électronique de documents.

Contexte : les documents textuels électroniques échangés sur le web ou sur les intranets peuvent être dans des formats très divers. Cela peut poser des problèmes pour leur visualisation et rendre problématique leur indexation pour la recherche documentaire.

Objectifs : L'objectif de ce stage est de proposer un format de stockage intermédiaire commun pour tous ces formats. Ce format, basé sur XML, doit permettre l'homogénéisation de toutes ces sources d'information. Une fois ce format défini, il s'agira de proposer des outils simples permettant de l'utiliser.

Travail à réaliser : Le travail comporte deux étapes :

Remarques : Aspects techniques : L'association de XML, XSLT et CSS, permettra de générer des sorties en XHTML virtuel. Une connaissance de tous ces langages n'est pas nécessaire a priori, même si elle serait un plus. Les divers développements seront réalisés en Java et si possible, un démonstrateur sera réalisé en servlet/JSP sur un serveur Java de type Tomcat.