Table des matières

TP découverte de l'API OAI-PMH

OAI-PMH est un protocole d'interrogation de données documentaires. Il permet l'interrogation d'un entrepôt via une API WEB. Il y a plusieurs interrogations possibles (les verb)

Voir des explication détaillées ici la description ici ou à la BFN

Le résultat d'une intérrogation est sous la forme de XML. Le forma de description des document peut parfois être choisi, les plus utilisés sont lom (le plus complet) ou oai_dc ou Dublin Core (le plus courant).

Utilisation directe de l'API

Vous allez testez l'api de openedition ici

Utilisation d'un client python

Il est possible de lire directement les résultats du dépots OAI_PMH mais cela suppose de traiter le XML ce qui n'est pas simple. C'est pourquoi, nous allons utiliser la librairie sickle qui permet l'interrogation et le traitement des données Dublin Core

Récupération des dates d'un journal

Vous devez faire un script python qui récupère tous les articles de la revue XVII-XVIII “revue de la société d’études anglo-américaines des XVIIe et XVIIIe siècles”. Qui compte le nombre d'article par an et le nombre d'article en accès ouvert.

Pour vous aider: