sian:2022:apihal

Ceci est une ancienne révision du document !


TP découverte de l'API HAL

Hal est une plateforme numérique pour le dépôt et le partage d'articles scientifiques. Il contient environ 2 000 000 de notice bibliographique et 1 000 000 d'articles. Cette plateforme propose une API pour la récupération des informations sur les documents dont la documentation est ici

  • Regardez rapidement la documentation, en comparant au requêtes SQL, comment considérez-vous les champs suivant :
    • le champ q ou les filtres fq
    • le champ fl
    • le champ sort, les champs rows et start
    • les facets
  • Quel paramètres de requêtes faudrait-il envoyer pour obtenir les différents mots clefs utilisés cette année dans les articles déposés ?

Cliquez pour afficher ⇲

Cliquez pour masquer ⇱

Le plus simple pour cela est d'utiliser les facets c'est à dire de faire une requète avec les parametre suivant:

q=submittedDateY_i:2022
fl=keyword_s,submittedDateY_i
wt=json
facet=true
facet.field=keyword_s

Ce qui donne l'url https://api.archives-ouvertes.fr/search/?q=submittedDateY_i:2022&fl=keyword_s,submittedDateY_i&wt=json&facet=true&facet.field=keyword_s

Vous pouvez utiliser le notebook à cette url https://jupyter.imst.os.univ-lyon1.fr/

Requests est une bibliothèque python facilitant les requète HTTP donc sur les API basée sur le web.

  • En utilisantrequests, téléchargez les informations de l'ensemble des articles du laboratoire ELICO. Affichez les titres et les auteurs. Enfin, stockez le résultat dans un fichier.
  • Faire un résumé graphique de ces données, par exemple, un camembert affichant le nombre d'article par personne, un diagramme avec le nombre d'article par an…
  • sian/2022/apihal.1670926370.txt.gz
  • Dernière modification : 2022/12/13 11:12
  • de fabien.rico