• Intégrer l'IA

    Réseau de neurones
    L'IA dans votre process de recherche
    Objectifs du module
    • Identifier la nature probabiliste des IA génératives pour en comprendre les limites.
    • Concevoir des prompts structurés (rôle, tâche, contraintes) adaptés à des besoins documentaires précis.
    • Appliquer une méthodologie de vérification critique systématique face aux contenus générés.
    Contenus abordés
    1. Grands principes de fonctionnementdes modèles génératifs de textes
    2. Panorama d'outils à utiliser pendant votre recherche documentaire
    3. Bases de la rédaction de prompts
    4. Principes méthodologiques fondamentaux
    5. Déclarer son usage de l'IAG
    En résumé

    L'IA générative peut dans certains cas être utilisé comme un assistant. Il est important d'avoir toujours en tête que les réponses se basent sur de la probabilité. Il est essentiel de lire, vérifier et citer chaque utilisation avant tout intégration dans vos travaux. Pour cela, référez-vous au document de déclaration des usages de l'IAG de la Faculté Jean Monnet.


    Les fiches à télécharger
    • Cadre général

      Dans le cadre d'un travail de recherche et de rédaction, il peut être tentant de s'aider d'une IA générative. Néanmoins, vous devez impérativement vous renseigner auprès de votre directeur.ice de mémoire afin de connaître les consignes d'utilisation de tels outils.

      En l'absence de directives claires de la part de votre directeur ou directrice de mémoire l'usage de l'IAg n'est, par défaut, pas autorisé, et peut être traité de la même manière qu'un cas de plagiat (Charte d'usage de l'IA générative à l'Université Paris-Saclay, section "Bonnes pratiques par les étudiantes et les étudiants", p. 7.)

      💡 Reportez-vous sur la Charte d'usage de l'IA générative à l'Université Paris-Saclay, section "Bonnes pratiques d'usage par les étudiantes et les étudiants"

      Dans le cas où l'usage d'une IA générative a été explicitement autorisé, il est important de garder en tête les éléments qui vont suivre.

      Vous pouvez demander par exemple à une IAg de :

      • vous aider dans votre recherche de vocabulaire,
      • vous aider à définir des termes,
      • vous aider à structurer et styliser un document.

      Ce qui n'est pas recommandé

      Il n'est pas recommandé de déléguer à une IAg :

      • la recherche de l'information précise et/ou scientifique,
      • la synthèse d'idées très différentes l'une de l'autre,
      • l'imagination d'idées originales.
      Illustration des usages recommandés (résumés, synthèses, liens entre concepts...) et non recommandés de l'IA (originalité...)

      💡 L'illustration est tirée de la formation : DOCQ, Françoise, POLAIN, Céline, WARNIER, Léticia et WOUTERS, Pascale, 2023. ChatGPT et les outils d’IA : quels enjeux sur les mémoires en 2023 ? [en ligne]. Formation. UCLouvain. 17 mars 2023. Disponible à l’adresse : https://oer.uclouvain.be/jspui/bitstream/20.500.12279/901/1/Formation_IA_memoires_2023-03-17.pdf [Consulté le 5 décembre 2025].

      This work is licensed under CC BY-SA 4.0

    • Principes élémentaires de fonctionnement des IAg de textes

      Quelques mots sur les principes de base à connaître au sujet du fonctionnement des IA génératives de textes (les IA génératives d'images fonctionnent sur d'autres principes) :

      Schéma de l'entraînement d'une IA générative textuelle

      Une IAg de texte, c'est avant tout un modèle, c'est-à-dire un ensemble gigantesque d'instructions, les algorithmes. On entraîne ce modèle sur un ensemble non moins gigantesque de données textuelles issues pour une grande part d'Internet. On y trouve l'intégralité de Wikipédia, les interactions humaines sur les réseaux sociaux, les codes sur GitHub, les blogs, etc.

      💡 Ces données n'ont pas toutes été obtenues de manière régulière. Elles sont de plus fortement biaisées (surreprésentation de la langue anglaise). Ces biais se retrouvent encodés dans les modèles que nous utilisons.

      Le but de cet entraînement, c'est d'avoir un modèle capable de prédire, à partir d'une séquence linguistique incomplète, la suite de la séquence d'une manière qui ne dépareillerait pas avec le contenu des données textuelles de l'entraînement. Cet entraînement n'a pas besoin de la supervisation d'un humain, le modèle se corrige seul, c'est ce qu'on appelle l'entraînement auto-supervisé (ou non supervisé) par renforcement.

      Il s'agit de la première phase de l'entraînement d'une IAg textuelle : la phase de pretraining.

      Schéma du fonctionnement probabiliste d'une IA générative textuelle

      Dans le cas d’une IAG générant du texte, elle produira au fur et à mesure une suite de tokens, qui peuvent être des morceaux de mots, des mots, des éléments de ponctuations, etc, en les enchaînant de façon la plus probable en lien avec le prompt donné en entrée.

      Vous pouvez tester et voir en direct le fonctionnement de plusieurs IAg textuelles sur le site Vittascience (sans nécessité de création de compte).

      Il ne s'agit que de la première phase d'entraînement à l'issue de laquelle on obtient un modèle de fondation qu'il faut ensuite entraîner à tenir des conversations respectueuses et utiles avec des humains.

      Plusieurs phases d'entraînement supplémentaires (fine-tuning) sont alors nécessaires pour aboutir aux différents modèles que nous connaissons aujourd'hui, et de nouvelles méthodes de fine-tuning sont régulièrement élaborées comme le fine-tuning par raisonnement.

      💡 Les illustrations de cette page sont issues du cours d'Aline Bouchard : BOUCHARD, Aline, 2025. Savoir utiliser ChatGPT et d’autres IA génératives pour la recherche documentaire en master [en ligne]. Formation. URFIST de Paris - Ecole nationale des chartes - PSL. 11 avril 2025. Disponible à l’adresse : https://www.enssib.fr/bibliotheque-numerique/documents/73173-savoir-utiliser-chatgpt-et-d-autres-ia-generatives-pour-la-recherche-documentaire-en-master.pdf [Consulté le 5 décembre 2025].


      Aline Bouchard © 2025 Creative Commons Attribution 4.0 International

    • Pour aller plus loin
      • Un panorama des outils disponibles pour la recherche documentaire

        Quand on pense intelligence artificielle générative, c'est, le plus souvent, aux chatbots qu'on fait référence. Mais il existe une très grande diversité d'outils que l'on peut répartir en trois grandes catégories pour ce qui concerne la recherche documentaire.

        Chatbots i 🔍 Outils de recherche i 🛠️ Assistants i
        Moteurs de recherche Bases bibliographiques Outils de productivité Assistants de recherche
        ChatGPT Google AI overviews Scopus AI DeepL Write Jenni
        Claude Perplexity Consensus Grammarly Keenious
        Gemini ChatGPT Search SciSpace Quillbot SciSpace AI writer
        Le Chat Mistral Search Brave AI WoS Research Assistant ARIA Zotero Undermind
        Copilot Google Scholar Labs Elicit Notebook LM genei
        DeepSeek Semantic Scholar Les catalogues de bibliothèque Wordtune Scholarcy
      • Élaborer le prompt le plus efficace possible

        En fonction de l'objectif que vous vous donnez, la structure et le contenu du prompt (ou de l'instruction) vont changer.

        "Le prompt est une instruction ou requête fournie à un modèle d’IAG pour générer ce contenu. Il peut être une simple phrase, une question, un début de texte, ou même une combinaison d’exemples et de consignes. C’est la phase d’inférence du modèle (déjà entraîné) d’IAG." (annexe charte de l'IAG de l'Université Paris-Saclay)

        Le prompt doit être construit de manière précise, en tenant compte des capacités de l'agent que vous interrogez, il ne s'agit pas de simplement formuler le sujet en entrée pour récupérer la réponse en sortie.

        Élément de prompt Pourquoi 🗂️ Exemple — Champ sémantique 📚 Exemple — Bibliographie
        1 Rôle de l'agent Le rôle définit le niveau d'expertise attendu et oriente le vocabulaire ainsi que la posture de l'IA, garantissant une réponse adaptée au domaine étudié. « Tu es un juriste spécialisé en droit du patrimoine dans une collectivité territoriale. » « Tu es bibliothécaire dans une bibliothèque universitaire de droit. »
        2 Tâche générale de l'agent Indiquer précisément la nature de la tâche évite les interprétations incorrectes et améliore la cohérence de la production. « Ta tâche est d'analyser un concept juridique et d'identifier l'ensemble de ses notions associées. » « Ta tâche est de sélectionner et de présenter des références académiques pertinentes selon des normes bibliographiques strictes. »
        3 Demande précise à l'agent Une demande explicite permet d'obtenir un résultat ciblé, sans hors-sujet ni ajout inutile. « Dégage le champ sémantique complet du sujet suivant : les labels en droit du patrimoine. » « Produis une bibliographie en style APA portant sur le sujet suivant : l'exploitation des terres rares. »
        4 Format(s) souhaité(s) Le format impose une structure stable et permet d'obtenir des résultats directement exploitables dans un travail académique. « Présente les résultats sous forme d'un tableau Markdown : catégorie / terme / définition courte. » « Présente les références sous forme d'une liste APA, une référence par ligne, en Markdown. »
        5 Contraintes de style Ces contraintes garantissent la conformité académique, un niveau de langue adapté et l'absence d'éléments non désirés. « Utilise un style académique concis, sans exemples, sans paraphrase, et sans ajout contextuel. » « Utilise un style académique, respecte strictement les normes APA, n'ajoute aucun commentaire explicatif. »
        6 Ce que l'agent ne doit pas faire Délimiter les interdictions réduit les risques d'erreurs fréquentes : invention, extrapolation, confusion ou hors-sujet. « Ne crée aucun terme fictif, ne traduis aucun élément, et n'introduis aucune notion qui ne relève pas du droit du patrimoine. » « N'invente aucune source, n'utilise aucun style autre que l'APA, et n'ajoute aucune référence non vérifiable. »
      • Rester vigilant

        Gardez en tête que, d'un point de vue fondamental, les IAg textuelles sont des outils chargés d'émuler des conversations avec des êtres humains. Les notions de vérité, de réalité ou de mensonge ne leur appartiennent pas. C'est à vous de rester prudent·e face à ce qu'une IAg textuelle (ou autre) vous raconte.

        💡 Pour approfondir, visionnez la vidéo :

        .

      • Trois repères méthodologiques pour un usage raisonné de l’IA générative

        L’IA ne remplace ni le raisonnement, ni l’expertise que vous développez au fil de votre formation et de vos recherches. Elle propose des pistes, parfois utiles, souvent discutables ; c’est donc à l’utilisateur d’encadrer, vérifier et documenter ce qu’il obtient.

        Sans méthode claire, les erreurs et les biais se propagent facilement, au détriment de la qualité du travail juridique. Les trois exigences qui suivent offrent un cadre solide pour utiliser ces outils de manière éclairée et professionnelle.

        1. Une démarche scientifique

        Les IA produisent du texte, pas du savoir. C’est à vous d’apporter la méthode.

        Risques

        • Faux positifs convaincants
        • Sources inventées
        • Explications plausibles mais incorrectes

        Réponses

        • Vérification systématique des contenus vérifiables
        • Documenter avec ses sources et pas celles de l'agent
        • Distinguer la plausibilité de la vérité
        2. Des travaux responsables

        Les IA génératives ne sont pas des outils de délégation totale.

        Risques

        • Des résultats non reproductibles
        • Dépendance à un outil
        • Absence de traçabilité

        Réponses

        • Un carnet de bord / Un journal de recherche
        • Expliciter ce qui relève de la part humaine et ce qui relève de la part générée
        3. Des usages éthiques

        Varier les outils, c’est réduire les angles morts.

        Risques

        • Des biais de corpus
        • Des perspectives invisibilisées
        • Des hallucinations de représentations

        Réponses

        • Varier les outils