Qu'est-ce que la génération augmentée par récupération (RAG) ?

La génération augmentée par récupération, ou RAG (pour Retrieval Augmented Generation), est une technique d'IA qui combine de grands modèles de langage (LLM) avec un accès en temps réel à des données externes. Au lieu de s'appuyer uniquement sur des connaissances pré-entraînées, elle récupère des documents ou des faits pertinents pendant le processus de génération, afin d'améliorer la précision et de réduire les hallucinations. Les entreprises bénéficient ainsi de résultats d'IA plus fiables pour la prise de décision, le reporting et les interactions avec les clients.

Définition plus globale

Les modèles de langage traditionnels génèrent du texte en se basant uniquement sur les schémas, aussi appelés « patterns », qu'ils ont appris lors de leur entraînement. Cette méthode présente un inconvénient : ils peuvent passer à côté du contexte, en particulier si les informations ont changé depuis la collecte des données d'entraînement. La RAG résout ce problème en insérant une étape dite de récupération : lorsque le système reçoit un prompt, il recherche dans les bases de connaissances, les API ou les bases de données connectées et réinjecte les résultats dans le modèle. Cela permet d'obtenir des résultats qui sont à la fois fluides et fondés sur un contenu actuel et vérifié.

Selon Gartner, les méthodes augmentées par l'enrichissement contextuel deviennent essentielles pour l'adoption de l'IA en entreprise, car elles permettent d'atténuer les risques et d'accroître la confiance dans les systèmes génératifs.

Alteryx prend en charge les workflows de type RAG en permettant aux équipes de connecter les modèles directement à des jeux de données contrôlés et prêts pour l'analytique. De cette façon, les entreprises peuvent générer des insights avec l'assurance qu'ils reposent sur des sources fiables et vérifiables.

Le rôle de la génération augmentée par récupération dans le business et la data

La RAG aide les entreprises à valoriser davantage l'IA générative sans sacrifier la gouvernance ou la précision.

  • Les équipes financières peuvent produire des rapports qui font référence aux documents de conformité les plus récents
  • Le service clientèle peut fournir des réponses cohérentes en s'appuyant sur les bases de connaissances
  • Les responsables de chaîne d'approvisionnement peuvent effectuer des analyses de simulation en utilisant des données logistiques réelles plutôt que des hypothèses statiques

Dans chaque cas, la RAG améliore les résultats en veillant à ce que l'étape « G » (génération) s'appuie sur des données réelles, actuelles et contextualisées.

Comment fonctionne la génération augmentée par récupération (RAG) ?

La RAG combine la recherche et la génération pour rendre les réponses de l'IA plus fiables :

  1. Elle trouve les bonnes informations : elle analyse les sources internes ou externes telles que les rapports, les documents ou les bases de données
    • Elle décompose les documents en blocs plus petits (souvent de 200 à 500 tokens) afin que le système puisse en tirer un contexte précis.
    • Elle convertit les requêtes et les documents en nombres afin d'identifier et d'extraire rapidement les passages les plus proches et les plus pertinents.
  2. Elle ajoute le contexte et génère des réponses : les informations récupérées sont fournies au modèle de langage comme complément.
    • Le modèle produit alors une réponse fondée.
    • Comme les modèles ont une mémoire limitée (« fenêtres contextuelles »), les systèmes RAG classent et ajustent les résultats de manière à n'utiliser que les meilleures informations.

À grande échelle, les systèmes RAG utilisent des bases de données vectorielles telles que Pinecone, Weaviate ou Elastic pour accélérer la recherche de similarités. Cela permet de s'assurer que les résultats restent factuels et explicables, ce qui est essentiel pour l'adoption par les entreprises.

Cas d'usage

  • Produire des résumés d'études de marché en utilisant des rapports internes et des jeux de données tiers
  • Automatiser les déclarations réglementaires en s'appuyant sur les dernières règles de conformité
  • Alimenter des chatbots qui fournissent des réponses précises, basées sur le contexte

Exemples concrets

  • Banque : automatisation des contrôles KYC (Know Your Customer) en récupérant les dernières politiques et l'historique client
  • Santé : synthèse des antécédents des patients tout en se référant aux directives cliniques actuelles
  • Commerce de détail : enrichissement des recommandations personnalisées avec l'historique des achats et les données d'inventaire

FAQ

La RAG remplace-t-elle la gouvernance des données ?
Non. Pour être efficace, la RAG s'appuie sur des sources de données soigneusement sélectionnées et contrôlées. Sans gouvernance solide, le processus de récupération risque d'introduire des biais ou des erreurs.

La RAG et le fine-tuning sont-ils équivalents ?
Non. Le fine-tuning, c'est-à-dire l'ajustement fin, actualise en permanence les paramètres d'un modèle. La RAG, en revanche, ajoute du contexte de manière dynamique au moment de l'exécution, ce qui la rend plus flexible et moins gourmande en ressources.

Comment mesurez-vous la qualité de la RAG ?

La qualité de la RAG se mesure selon plusieurs dimensions :

  • Précision de la récupération : est-ce que les bons documents ou passages sont extraits ?
  • Fidélité : les réponses sont-elles clairement fondées sur ces documents ou passages ?
  • Pertinence : la réponse correspond-elle directement à la demande de l'utilisateur ?
  • Satisfaction des utilisateurs : les utilisateurs trouvent-ils les réponses utiles et dignes de confiance ?
  • Latence : le système peut-il fournir des résultats suffisamment vite ?

Cette combinaison de paramètres permet aux entreprises de concilier la précision, la facilité d'utilisation et la performance lors de l'évaluation des systèmes RAG.

Synonymes

  • Génération basée sur la récupération
  • LLM augmentés
  • Génération enrichie de connaissances

Termes liés

 

Dernière révision :

Septembre 2025

Normes éditoriales et révision d'Alteryx

Cette entrée de glossaire a été créée et révisée par l'équipe chargée des contenus Alteryx pour garantir la clarté, l'exactitude et l'adéquation des textes avec notre expertise en matière d'automatisation de l'analytique des données.