Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
sian:2022:apihal [2022/10/25 16:45] – fabien.rico | sian:2022:apihal [2022/12/13 23:11] (Version actuelle) – [Visualisation de données] fabien.rico | ||
---|---|---|---|
Ligne 10: | Ligne 10: | ||
* Quel paramètres de requêtes faudrait-il envoyer pour obtenir les différents mots clefs utilisés cette année dans les articles déposés ? | * Quel paramètres de requêtes faudrait-il envoyer pour obtenir les différents mots clefs utilisés cette année dans les articles déposés ? | ||
+ | |||
+ | < | ||
+ | Le plus simple pour cela est d' | ||
+ | |||
+ | < | ||
+ | q=submittedDateY_i: | ||
+ | fl=keyword_s, | ||
+ | wt=json | ||
+ | facet=true | ||
+ | facet.field=keyword_s | ||
+ | </ | ||
+ | |||
+ | Ce qui donne l'url [[https:// | ||
+ | </ | ||
===== Récupération en python ===== | ===== Récupération en python ===== | ||
+ | |||
+ | Vous pouvez utiliser le notebook à cette url [[https:// | ||
+ | |||
+ | [[https:// | ||
+ | |||
+ | * En utilisant'' | ||
+ | |||
+ | |||
+ | |||
+ | <hidden Correction de la première question> | ||
+ | Le notebook peux être trouvé ici: | ||
+ | [[https:// | ||
+ | |||
+ | Voici son code | ||
+ | < | ||
+ | # | ||
+ | # coding: utf-8 | ||
+ | |||
+ | # # Utilisation de request | ||
+ | |||
+ | # In[31]: | ||
+ | |||
+ | |||
+ | import requests | ||
+ | import json | ||
+ | import pandas as pd | ||
+ | |||
+ | |||
+ | # In[59]: | ||
+ | |||
+ | parametres = { | ||
+ | " | ||
+ | " | ||
+ | " | ||
+ | " | ||
+ | } | ||
+ | |||
+ | |||
+ | # In[60]: | ||
+ | |||
+ | r = requests.get(' | ||
+ | |||
+ | |||
+ | # In[64]: | ||
+ | |||
+ | resultat = r.json() | ||
+ | liste_reps = resultat[" | ||
+ | # print(liste_reps) | ||
+ | |||
+ | # In[71]: | ||
+ | |||
+ | result = [] | ||
+ | for rep in liste_reps: | ||
+ | elem = {} | ||
+ | elem[" | ||
+ | elem[" | ||
+ | elem[" | ||
+ | # print(elem) | ||
+ | result.append(elem) | ||
+ | | ||
+ | df = pd.DataFrame(result) | ||
+ | |||
+ | |||
+ | # In[72]: | ||
+ | |||
+ | |||
+ | df | ||
+ | |||
+ | |||
+ | # In[78]: | ||
+ | |||
+ | df.to_excel(" | ||
+ | |||
+ | # In[79]: | ||
+ | |||
+ | df.to_csv(" | ||
+ | |||
+ | |||
+ | </ | ||
+ | |||
+ | </ | ||
+ | |||
+ | * Utilisez les facettes pour obtenir | ||
+ | * le nombre d' | ||
+ | * le nombre d' | ||
+ | |||
+ | |||
+ | ===== Visualisation de données ===== | ||
+ | |||
+ | Nous allons utiliser la librairie [[https:// | ||
+ | |||
+ | * Affichez le nombre d' | ||
+ | * Affichez le nombre d' | ||
- | * En utilisant la [[https:// | ||