OAI-PMH est un protocole d'interrogation de données documentaires. Il permet l'interrogation d'un entrepôt via une API WEB. Il y a plusieurs interrogations possibles (les verb)
ListSets
pour obtenir la liste des ensembles de documentsListRecords
pour obtenir les métadonnées de documentsVoir des explication détaillées ici la description ici ou à la BFN
Le résultat d'une intérrogation est sous la forme de XML. Le forma de description des document peut parfois être choisi, les plus utilisés sont lom
(le plus complet) ou oai_dc
ou Dublin Core (le plus courant).
Vous allez testez l'api de openedition ici
Lister les enregistrements
et Lister les sets
. En regardant l'URL, comment choisit-on ce qui est demandé ?sets
.Il est possible de lire directement les résultats du dépots OAI_PMH mais cela suppose de traiter le XML ce qui n'est pas simple. C'est pourquoi, nous allons utiliser la librairie sickle qui permet l'interrogation et le traitement des données Dublin Core
openedition
pour avoir la liste des documents de cette année. Combien y en a-t-il ?
Vous devez faire un script python qui récupère tous les articles de la revue XVII-XVIII
“revue de la société d’études anglo-américaines des XVIIe et XVIIIe siècles”. Qui compte le nombre d'article par an et le nombre d'article en accès ouvert.
Pour vous aider:
datestamp
de l'entête,dc:rights
des métadonnées.