TP découverte de l'API HAL
Hal est une plateforme numérique pour le dépôt et le partage d'articles scientifiques. Il contient environ 2 000 000 de notice bibliographique et 1 000 000 d'articles. Cette plateforme propose une API pour la récupération des informations sur les documents dont la documentation est ici
- Regardez rapidement la documentation, en comparant au requêtes SQL, comment considérez-vous les champs suivant :
- le champ
q
ou les filtresfq
- le champ
fl
- le champ
sort
, les champsrows
etstart
- les
facets
- Quel paramètres de requêtes faudrait-il envoyer pour obtenir les différents mots clefs utilisés cette année dans les articles déposés ?
Récupération en python
Vous pouvez utiliser le notebook à cette url https://jupyter.imst.os.univ-lyon1.fr/
Requests est une bibliothèque python facilitant les requète HTTP donc sur les API basée sur le web.
- En utilisant
requests
, téléchargez les informations de l'ensemble des articles du laboratoire ELICO. Affichez les titres et les auteurs. Enfin, stockez le résultat dans un fichier.
* Utilisez les facettes pour obtenir
- le nombre d'article par an,
- le nombre d'article par auteur.
Visualisation de données
Nous allons utiliser la librairie plotly pour afficher les résultats.
- Affichez le nombre d'articles par an sous la forme d'un line-chart
- Affichez le nombre d'articles par auteur sous la forme d'un bar-chart