Retrieval : Définition et Exemples
Le retrieval (récupération) désigne le processus par lequel un système d'IA va chercher des informations pertinentes dans une base de données ou un corpus de documents pour enrichir sa réponse à une requête.
Définition complète
Le retrieval, ou récupération d'information, est un mécanisme fondamental en intelligence artificielle qui permet à un modèle de langage d'accéder à des connaissances externes au moment de générer une réponse. Plutôt que de se fier uniquement à ce qu'il a appris pendant son entraînement, le modèle interroge une source de données structurée pour trouver les passages les plus pertinents par rapport à la question posée.
Ce processus repose généralement sur des techniques de recherche sémantique : la requête de l'utilisateur est transformée en un vecteur numérique (embedding), puis comparée aux vecteurs des documents stockés dans une base vectorielle. Les documents les plus proches sémantiquement sont alors sélectionnés et injectés dans le contexte du modèle avant la génération de la réponse. C'est le principe au cœur de l'architecture RAG (Retrieval-Augmented Generation).
L'intérêt majeur du retrieval est de permettre aux modèles d'IA de fournir des réponses à jour, factuellement ancrées et spécifiques à un domaine, sans nécessiter un réentraînement coûteux. Une entreprise peut ainsi connecter un LLM à sa documentation interne, ses bases de connaissances ou ses archives, et obtenir des réponses contextualisées et fiables.
La qualité du retrieval conditionne directement la qualité de la réponse finale. Un mauvais retrieval — documents non pertinents, trop nombreux ou mal découpés — entraîne des hallucinations ou des réponses hors sujet. C'est pourquoi l'optimisation du pipeline de retrieval (chunking, ranking, filtrage) est devenue une discipline à part entière dans l'ingénierie des systèmes d'IA.
Étymologie
Du verbe anglais "to retrieve" (récupérer, retrouver), issu de l'ancien français "retrouver". En informatique, le terme est utilisé depuis les années 1950 dans le domaine de l'"Information Retrieval" (recherche d'information), discipline fondatrice des moteurs de recherche.
Exemples concrets
Un chatbot d'entreprise qui répond aux questions des employés en consultant la documentation interne
En te basant uniquement sur les documents fournis ci-dessous, réponds à la question suivante : quelle est la politique de télétravail de l'entreprise ?
Un assistant juridique qui recherche des articles de loi pertinents avant de formuler une analyse
Recherche dans le Code du travail les articles relatifs au licenciement économique, puis résume les obligations de l'employeur.
Un système de support client qui extrait les passages pertinents d'une FAQ avant de répondre
Usage pratique
En prompt engineering, le retrieval s'exploite principalement via des architectures RAG : on injecte dans le prompt les documents récupérés comme contexte, puis on demande au modèle de s'appuyer exclusivement sur ces sources. Pour optimiser les résultats, il faut soigner le découpage des documents (chunks de 200 à 500 tokens), formuler des requêtes de recherche précises, et instruire le modèle à citer ses sources ou à signaler quand l'information est absente du contexte fourni.
Concepts liés
FAQ
Quelle est la différence entre retrieval et RAG ?
Comment améliorer la qualité du retrieval ?
Le retrieval élimine-t-il les hallucinations du modèle ?
Voir aussi
Autres définitions
RLHF : Définition et Exemples
Le RLHF (Reinforcement Learning from Human Feedback) est une technique d'entraînement des modèles de langage qui utilise les retours humains pour aligner les ré
Role Prompting : Définition et Exemples
Le role prompting consiste à attribuer un rôle, une identité ou une expertise spécifique à un modèle d'IA dans le prompt, afin d'orienter le style, le ton et la
Rotary Position Embedding : Définition et Exemples
Le Rotary Position Embedding (RoPE) est une technique d'encodage positionnel qui intègre l'information de position des tokens dans un modèle Transformer en appl
Rouge Score : Définition et Exemples
ROUGE (Recall-Oriented Understudy for Gisting Evaluation) est une famille de métriques automatiques utilisées pour évaluer la qualité des résumés générés par de
Runway ML : Définition et Exemples
Runway ML est une plateforme d'intelligence artificielle générative spécialisée dans la création et l'édition de contenus visuels (vidéo, image, 3D) à partir de
Safety Filter : Définition et Exemples
Un safety filter est un mécanisme intégré aux modèles d'IA générative qui détecte et bloque automatiquement les contenus jugés dangereux, inappropriés ou contra
Recevez de nouveaux prompts chaque semaine
Rejoignez notre newsletter.