Information et Documentation

Contenu

4. Information et Documentation#

En science, lorsque que l’on veut traiter un nouveau problème, la première étape consiste à faire une étude bibliographique. Cette étape consiste à comprendre comment d’autres auteurs ont résolus un problème similaire et s’en inspirer pour proposer une solution.

Avertissement

Attention cette étape ne consiste pas à recopier même partiellement une solution trouvée sur internet ou générer par un agent conversationnel (ChatGPT).

Cela s’appelle du PLAGIAT, et peut conduire à des sanctions pouvant aller jusqu’à l’exclusion. Les diplômes s’obtiennent en prouvant que le sujet est maîtrisé pas en recopiant le travail d’un autre!

Du point de vue légal, il s’agit de la violation du droit d’auteur. Du point de vue moral : il s’agit d’une question d’honnêteté intellectuelle, l’étudiant qui a recours à la pratique du « copier-coller » décrédibilise son travail et renonce ainsi à acquérir des connaissances.

Ceci étant clarifié, on peut utiliser intelligemment les outils de recherche d’information, en particulier sur internet, à condition de citer ses sources et à s’assurer de leur validité.

4.1. Sources d’information#

Vous avez accès à plusieurs sources d’informations

les documents et livre du cours
la bibliothèque universitaire avec un accès aux livres et aux articles de revus scientifiques
les articles scientifiques, en particulier sur les archives ouvertes HAL
la recherche sur les moteurs de recherche (google, qwant, .. )
les agents convertationnels (ChatGPT)

Note

Quelque soit la source d’information utilisée, il faut la vérifier et citer systématiquement les sources.

4.2. ChatGPT (ou LLM Large Language Model)#

source Wikipédia

ChatGPT (Generative Pre-trained Transformer) est un prototype d’agent conversationnel utilisant l’intelligence artificielle (réseaux de neurones), développé par OpenAI et spécialisé dans le dialogue.

L’agent conversationnel de ChatGPT repose sur les technologies du traitement automatique des langues (NLP), des grands modèles de langage (LLM) et des chatbots. Il est issu du modèle de langage GPT d’OpenAI, et est affiné en continu grâce à l’utilisation de techniques d’apprentissage supervisé et d’apprentissage par renforcement.

ChatGPT est capable de générer des réponses à des questions, de compléter des phrases, de traduire des textes, d’écrire des articles et des programmes informatiques et de tenir des conversations avec des humains.

En raison de ses capacités multiples, le prototype suscite cependant des inquiétudes. Des détournements à des fins malveillantes, des risques de plagiat dans le monde académique et de possibles suppressions d’emplois dans certains secteurs ont été évoqués.

4.2.1. Exemple d’utilisation de ChatGPT#

Pour un problème classique ChatGPT peut donner une réponse correcte, comme pour la question classique de l’algorithme

Question à ChatGPT

Ecrit une fonction python pour calculer la liste des nombres premiers inférieurs à un nombre p

réponse ChatGPT

Voici une fonction Python qui calcule la liste des nombres premiers inférieurs à un nombre donné p :

def primes_below(p):
    primes = []
    for num in range(2, p):
        is_prime = True
        for i in range(2, int(num ** 0.5) + 1):
            if num % i == 0:
                is_prime = False
                break
        if is_prime:
            primes.append(num)
    return primes

réponse ChatGPT (suite)

Cette fonction utilise une approche naïve pour vérifier si un nombre est premier. Elle itère à travers tous les nombres de 2 à p-1 et vérifie s’ils sont divisibles par des nombres inférieurs à leur racine carrée. Si un nombre est divisible par un autre nombre, il n’est pas premier et la boucle interne est interrompue. Sinon, le nombre est ajouté à la liste primes.

Voici un exemple d’utilisation de cette fonction. Dans cet exemple, la fonction primes_below(20) renvoie la liste [2, 3, 5, 7, 11, 13, 17, 19], qui sont tous les nombres premiers inférieurs à 20.

p = 20
result = primes_below(p)
print(result)  # Output: [2, 3, 5, 7, 11, 13, 17, 19]

L’algorithme proposé est correcte mais classique, et ChatGPT ne fournit aucune référence: il s’agit de l’algorithme, connu depuis l’antiquité, appelé Crible d’Ératosthène . L’article sur les nombres premiers de Wikipedia fournit une explication détaillée avec des citations, en faisant remarquer que la complexité de cet algorithme est exponentielle et donc inutilisable lorsque p devient très grand.

4.2.2. Un contre exemple#

On modifie légèrement la question précédente en ajoutant une contrainte.

Question à ChatGPT

Ecrit une fonction python pour calculer la liste des nombres premiers pairs inférieurs à un nombre p

réponse ChatGPT

Voici une fonction Python qui calcule la liste des nombres premiers pairs inférieurs à un nombre donné p :

def even_primes_below(p):
    primes = []
    for num in range(2, p, 2):
        is_prime = True
        for i in range(2, int(num ** 0.5) + 1):
            if num % i == 0:
                is_prime = False
                break
        if is_prime:
            primes.append(num)
    return primes

réponse ChatGPT (suite)

Cette fonction est similaire à la précédente, mais elle itère uniquement à travers les nombres pairs de 2 à p-1 en utilisant un pas de 2 (c’est-à-dire range(2, p, 2)). Cela garantit que seuls les nombres pairs sont considérés. Le reste de la logique est identique à la fonction précédente pour vérifier si un nombre est premier.

Voici un exemple d’utilisation de cette fonction. Dans cet exemple, la fonction even_primes_below(20) renvoie la liste [2, 3, 5, 7, 13, 17, 19], qui sont tous les nombres premiers pairs inférieurs à 20.

p = 20
result = even_primes_below(p)
print(result)  # Output: [2, 3, 5, 7, 13, 17, 19]

On constate que ChatGPT a bien reconnu la contrainte, mais la solution proposée montre clairement qu’il ne comprend pas la question (i.e. la notion de nombre premier et de nombre pair) puisque dans ce cas le seul nombre premier pair est 2.

Cela se confirme avec l’exemple d’utilisation proposé dans lequel il reprend la réponse précédente en affirmant que [3, 5, 7, 13, 17, 19] sont tous des nombres premiers pairs (ce qui est faux !!).

Avertissement

ATTENTION ChatGPT ne comprend pas les questions, mais construit sa réponse en utilisant une approche statistique à partir d’une base de données extrêmement large.

Le problème plus fondamental est que ChatGPT ne fournit pas les références des sources qu’il utilise. Il faut donc systématiquement vérifier les réponses pour en juger la validité.

4.2.3. Comment utiliser ChatGPT (ou un autre LLM)#

Pour obtenir un résultat plus pertinent, fournissez des instructions sur la manière dont vous souhaitez qu’il réponde.
Si votre requête ne donne pas le résultat escompté, essayez de modifier les instructions et relancez la requête.
En raison de la forte demande, la version gratuite peut être indisponible ou fonctionner très lentement.
Les données utilisées pour entraîner les réponses vont jusqu’en 2021 (pour ChatGPT 3). Cela signifie que ChatGPT n’a aucune connaissance des événements ou des créations postérieurs à 2021. Cependant, certains navigateurs intégrant ChatGPT lui permettent d’accéder à des informations plus récentes.
Il n’existe aucun moyen pour ChatGPT de vérifier les informations qu’il fournit ou d’évaluer leur fiabilité.

Pour déterminer dans quelles circonstances ChatGPT (ou un autre LLM) peut être utilisé en toute sécurité, suivez le diagramme suivant ici du cite de l’UNESCO[1].

Bonne utilisation de ChatGPT (ou autre LLM)

4.2.4. Synthèse de notes#

On peut aussi utiliser ChatGPT pour fournir une première synthèse de notes, qu’il faut reprendre ensuite. Par exemple:

Question à ChatGPT

reformule les notes suivantes:

pour système masse ressort
modèle équation différentielle linéaire du 2nd ordre
oscillation périodique énergie et potentielle
conservation énergie totale

ChatGPT fournit la réponse suivante:

Réponse ChatGPT

Réformulation :

Pour un système de masse et de ressort,
Le modèle repose sur une équation différentielle linéaire du deuxième ordre,
Ce modèle décrit les oscillations périodiques en termes d’énergie cinétique et potentielle,
Il est observé une conservation de l’énergie totale du système.

Il faut bien entendu reprendre la formulation, en particulier la troisième phrase, car le modèle ne décrit pas mais prédit des oscillations périodiques de l’énergie.

ChatGPT est une IA génératives, i.e. une machine qui produit du texte à partir d’une analyse statistique basée sur une énorme base de données d’apprentissage (et des milliers de petites mains humaines pour valider) . Il analyse le langage humain (ou le langage informatique) en cherchant des corrélations pour générer des réponses, donc sans comprendre le sens ou la réalité des questions. Le texte généré est en général syntaxiquement correcte (sans faute d’orthographe) et reflète en général la pensée du plus grand nombre sans imagination et avec parfois d’énorme contre-sens. Il ne faut donc jamais utiliser ses réponses telles quelles !

4.3. Références bibliographiques#

Lorsque que l’on utilise de l’information, il est important de citer ses sources. En science, le référencement bibliographique obéit à des règles qui assurent que l’information peut être retrouvée et référencée.

La forme d’une bibliographie suit quelques règles de base :

Une liste de références se place en général à la fin d’un document
Seules des références utilisées et citées dans le document relatif doivent figurer dans la bibliographie ; toute autre notice (suggestion de lecture, p. ex.) doit être placée dans une liste à part
Les références sont en générale classées par ordre alphabétique du nom des auteurs. En cas de multiples références d’un même auteur, classer celles-ci par ordre chronologique (du plus ancien au plus récent), et en cas de multiples références de mêmes auteur et date, classer celles-ci par ordre alphabétique du début des titres des publications:
Pour la référence d’un livre, articles, ouvrages, le modèle est:
- Nom, initiale(s) du prénom, date de publication. Titre en italique. (nom du journal, numéro et pages), Lieu de publication : Editeur.
Pour un document en ligne
- Nom, initiale(s) du prénom. date de publication. Titre du document, site de [auteur/institution] : [URL du document]

4.4. Conclusion#

L’utilisation d’internet est une source d’information extrêmement utile, à condition que l’on puisse la vérifier et que les sources soient identifiées. En général cette étape intervient surtout dans la phase bibliographique initiale et dans la mise en oeuvre. Dans la phase la plus importante du choix de la méthode, il faut éviter d’utiliser telles quelles des méthodes toutes prêtes issues d’internet sans comprendre et s’être approprier la méthode. Interroger Chat GPT pour résoudre un problème et ne pas vérifier les informations qui sortent n’est pas raisonnable en particulier tant que le modèle n’est pas capable de dire d’où viennent les informations.

Information et Documentation

Contenu

4. Information et Documentation#

4.1. Sources d’information#

4.2. ChatGPT (ou LLM Large Language Model)#

4.2.1. Exemple d’utilisation de ChatGPT#

4.2.2. Un contre exemple#

4.2.3. Comment utiliser ChatGPT (ou un autre LLM)#

4.2.4. Synthèse de notes#

4.3. Références bibliographiques#

4.4. Conclusion#

4.4.1. Références#