GloVe : Définition et Exemples
GloVe (Global Vectors for Word Representation) est un algorithme d'apprentissage non supervisé développé par Stanford qui génère des représentations vectorielles de mots en exploitant les statistiques de co-occurrence dans un corpus de texte.
Définition complète
GloVe, acronyme de Global Vectors for Word Representation, est un modèle de plongement de mots (word embedding) créé en 2014 par Jeffrey Pennington, Richard Socher et Christopher Manning au laboratoire NLP de Stanford. Son objectif est de transformer chaque mot d'un vocabulaire en un vecteur numérique dense qui capture sa signification sémantique.
Contrairement à Word2Vec qui apprend les représentations à partir de fenêtres contextuelles locales, GloVe exploite une matrice globale de co-occurrence des mots sur l'ensemble du corpus. L'algorithme factorise cette matrice pour produire des vecteurs où les relations géométriques (distances, directions) entre vecteurs reflètent les relations sémantiques entre mots. Par exemple, la célèbre analogie vectorielle roi - homme + femme ≈ reine fonctionne remarquablement bien avec GloVe.
Le modèle repose sur l'intuition que le ratio des probabilités de co-occurrence entre deux mots par rapport à un troisième encode une information sémantique riche. GloVe optimise une fonction de coût qui préserve ces ratios dans l'espace vectoriel, combinant ainsi les avantages des méthodes de factorisation matricielle globale et des méthodes prédictives locales.
Bien que les modèles de langage modernes comme BERT ou GPT aient largement supplanté GloVe pour de nombreuses tâches NLP, il reste un outil fondamental pour comprendre les word embeddings. Ses vecteurs pré-entraînés (sur Wikipedia, Common Crawl) sont encore utilisés comme point de départ dans certaines applications, et sa simplicité en fait un excellent outil pédagogique pour appréhender la représentation vectorielle du langage.
Étymologie
GloVe est un acronyme de « Global Vectors for Word Representation » (vecteurs globaux pour la représentation des mots). Le nom souligne la différence clé avec Word2Vec : l'utilisation de statistiques globales du corpus plutôt que de contextes locaux.
Exemples concrets
Analyse de similarité sémantique entre mots
En utilisant des embeddings GloVe, calcule la similarité cosinus entre les mots 'roi', 'reine', 'prince' et 'princesse'. Explique les relations sémantiques que les vecteurs capturent.
Classification de texte avec embeddings pré-entraînés
Conçois un classifieur de sentiments pour des avis clients en utilisant des embeddings GloVe 300d pré-entraînés comme couche d'entrée. Décris l'architecture et les étapes de prétraitement.
Détection de biais dans les représentations vectorielles
Analyse les biais de genre présents dans les vecteurs GloVe entraînés sur Common Crawl. Quelles associations stéréotypées peut-on observer et comment les atténuer ?
Usage pratique
En prompt engineering, comprendre GloVe aide à saisir comment les modèles de langage représentent les mots et leurs relations sémantiques. Lorsque vous formulez des prompts exploitant des analogies ou des relations entre concepts, vous tirez parti de mécanismes similaires à ceux de GloVe. Savoir que les embeddings capturent des biais du corpus d'entraînement permet aussi de mieux anticiper et corriger les biais dans les réponses générées.
Concepts liés
FAQ
Quelle est la différence entre GloVe et Word2Vec ?
GloVe est-il encore utilisé avec les modèles modernes comme GPT ou BERT ?
Comment les vecteurs GloVe capturent-ils le sens des mots ?
Voir aussi
Autres définitions
Google DeepMind : Définition et Exemples
Google DeepMind est le laboratoire de recherche en intelligence artificielle de Google, né de la fusion entre DeepMind Technologies et Google Brain en 2023, rec
GPT 4 : Définition et Exemples
GPT-4 est un modèle de langage multimodal développé par OpenAI, capable de comprendre du texte et des images pour générer des réponses d'une qualité et d'une pr
GPT 4o : Définition et Exemples
GPT-4o (« o » pour « omni ») est le modèle multimodal phare d'OpenAI, capable de traiter et de générer du texte, des images et de l'audio au sein d'une même arc
Gradient Descent : Définition et Exemples
Le Gradient Descent (descente de gradient) est un algorithme d'optimisation itératif utilisé pour minimiser une fonction de coût en ajustant progressivement les
Grounding : Définition et Exemples
Le grounding (ancrage) est une technique qui consiste à fournir au modèle d'IA des données factuelles, des documents ou un contexte concret pour que ses réponse
Grouped Query Attention : Définition et Exemples
Mécanisme d'attention qui regroupe plusieurs têtes de requête (query heads) pour partager les mêmes clés et valeurs, réduisant ainsi la mémoire et le coût de ca
Recevez de nouveaux prompts chaque semaine
Rejoignez notre newsletter.