Ceci est une ancienne révision du document !
TP découverte de l'API OAI-PMH
OAI-PMH est un protocole d'interrogation de données documentaires. Il permet une interrogation via une API WEB d'un entrepôt. Il y a plusieurs interrogations possibles (les verb)
ListSets
pour obtenir la liste des ensembles de documentsListRecords
pour obtenir les métadonnées de documents- …
Voir la description ici ou à la BFN
Le résultat est en XML sous différents format notamment lom
(le plus complet) ou oai_dc
ou Dublin Core (le plus courant).
Utilisation directe de l'API
Vous allez testez l'api de openedition ici
- Suivez les liens
Lister les enregistrements
etLister les sets
. En regardant l'URL, comment choisit-on ce qui est demandé ? - Combien y a-t-il d'enregistrements ? Comment faire pour avoir les suivant ? Faites la requête pour avoir la seconde page.
- Listez les enregistrements du premier journal présenté dans les sets.
Utilisation d'un client python
Il est possible de lire directement les résultats du dépots OAI_PMH mais cela suppose de traiter le XML ce qui n'est pas simple. C'est pourquoi, nous allons utiliser la librairie sickle qui permet l'interrogation et le traitement des données Dublin Core
- Installez la librairie via pip
- Utilisez la librairie pour afficher les titres des 20 premiers documents du dépôt.
- Interrogez
openedition
pour avoir la liste des documents de cette année. Combien y en a-t-il ?