sian:2022:oai_pmh

Ceci est une ancienne révision du document !


TP découverte de l'API OAI-PMH

OAI-PMH est un protocole d'interrogation de données documentaires. Il permet une interrogation via une API WEB d'un entrepôt. Il y a plusieurs interrogations possibles (les verb)

  • ListSets pour obtenir la liste des ensembles de documents
  • ListRecords pour obtenir les métadonnées de documents

Voir la description ici ou à la BFN

Le résultat est en XML sous différents format notamment lom (le plus complet) ou oai_dc (le plus courant).

Vous allez testez l'api de openedition ici

  • Suivez les liens Lister les enregistrements et Lister les sets. En regardant l'URL, comment choisit-on ce qui est demandé ?
  • Combien y a-t-il d'enregistrements ? Comment faire pour avoir les suivant ? Faites la requête pour avoir la seconde page.
  • Listez les enregistrements du premier journal présenté dans les sets.

Il est possible de lire directement les résultats du dépots OAI_PMH mais cela suppose de traiter le XML ce qui n'est pas simple. C'est pourquoi, nous allons utiliser la librairie sickle qui permet l'interrogation et le traitement des données Dublin Core

  • sian/2022/oai_pmh.1669276437.txt.gz
  • Dernière modification : 2022/11/24 08:53
  • de fabien.rico