Knowledge Cutoff : Définition et Exemples
Le knowledge cutoff (ou date de coupure des connaissances) désigne la date limite jusqu'à laquelle un modèle d'IA a été entraîné sur des données. Au-delà de cette date, le modèle n'a aucune connaissance des événements ou informations survenus.
Définition complète
Le knowledge cutoff est un concept fondamental pour comprendre les limites des grands modèles de langage (LLM). Chaque modèle d'IA est entraîné sur un corpus de données collectées jusqu'à une date précise. Cette date constitue sa "frontière temporelle" : tout ce qui s'est passé après lui est totalement inconnu.
Par exemple, si un modèle a un knowledge cutoff en avril 2024, il ne connaîtra pas les résultats d'une élection ayant eu lieu en novembre 2024, ni les dernières avancées scientifiques publiées après cette date. Il pourrait même fournir des informations obsolètes en toute confiance, car il n'a aucun moyen de savoir que ses données sont périmées.
Cette limitation a des implications pratiques majeures en prompt engineering. Lorsque vous interrogez un modèle sur des sujets d'actualité, des données récentes ou des événements postérieurs à sa date de coupure, les réponses peuvent être incorrectes ou inventées (hallucinations). C'est pourquoi il est essentiel de connaître le knowledge cutoff du modèle que vous utilisez.
Pour contourner cette limitation, plusieurs approches existent : le Retrieval-Augmented Generation (RAG) qui injecte des données à jour dans le contexte, la navigation web en temps réel intégrée à certains assistants, ou simplement le fait de fournir manuellement les informations récentes nécessaires dans votre prompt.
Étymologie
Le terme vient de l'anglais "knowledge" (connaissance) et "cutoff" (coupure, limite). Il est apparu avec la démocratisation des LLM vers 2022-2023 pour décrire de manière intuitive cette frontière temporelle inhérente à tout modèle entraîné sur un corpus figé. Le terme est généralement utilisé tel quel en français, bien qu'on trouve parfois "date de coupure des connaissances".
Exemples concrets
Vérifier les limites temporelles du modèle
Quelle est ta date de coupure des connaissances ? Quels événements majeurs de 2026 connais-tu ?
Fournir du contexte récent pour compenser le cutoff
Voici les résultats financiers du T1 2026 d'Apple : [données]. En te basant sur ces chiffres, analyse les tendances par rapport aux trimestres précédents que tu connais.
Éviter les hallucinations sur des sujets récents
Sans inventer d'informations, dis-moi ce que tu sais sur la réglementation européenne sur l'IA. Précise si tes informations risquent d'être obsolètes.
Usage pratique
En prompt engineering, tenez toujours compte du knowledge cutoff du modèle utilisé. Pour les sujets sensibles au temps, fournissez les données récentes directement dans le prompt ou utilisez des outils de recherche web. Ajoutez des instructions comme "Si tu n'es pas sûr de l'actualité de cette information, précise-le" pour limiter les hallucinations.
Concepts liés
FAQ
Comment connaître le knowledge cutoff d'un modèle ?
Le knowledge cutoff signifie-t-il que le modèle ne sait rien après cette date ?
Comment contourner le knowledge cutoff dans mes prompts ?
Voir aussi
Autres définitions
Knowledge Graph : Définition et Exemples
Un Knowledge Graph (graphe de connaissances) est une structure de données qui organise l'information sous forme de réseau de relations entre des entités, permet
KV Cache : Définition et Exemples
Le KV Cache (Key-Value Cache) est un mécanisme d'optimisation utilisé par les modèles de langage (LLM) pour stocker les clés et valeurs des couches d'attention
LangChain : Définition et Exemples
LangChain est un framework open source conçu pour faciliter le développement d'applications alimentées par des modèles de langage (LLM), en permettant de chaîne
Large Language Model : Définition et Exemples
Un Large Language Model (LLM) est un modèle d'intelligence artificielle entraîné sur d'immenses volumes de texte, capable de comprendre et de générer du langage
Latent Space : Définition et Exemples
Le latent space (espace latent) est une représentation mathématique compressée où un modèle d'IA encode les caractéristiques essentielles des données sous forme
Layer Normalization : Définition et Exemples
La Layer Normalization est une technique de normalisation qui standardise les activations d'un réseau de neurones en calculant la moyenne et la variance sur l'e
Recevez de nouveaux prompts chaque semaine
Rejoignez notre newsletter.