Référence

Glossaire de l'IA

Les termes de l'IA expliqués en français, sans jargon inutile ni promesse marketing. 23 définitions, à jour et vérifiables, pour suivre les comparatifs de Joute sans rester sur le bord.

Concepts

Agent IA

Un agent IA est un système qui ne se contente pas de répondre : il décompose un objectif en étapes, choisit des outils, exécute des actions et observe les résultats avant de continuer. Un agent de code peut ainsi lire des fichiers, lancer des tests et corriger le code en boucle. L'autonomie a un revers : une erreur de raisonnement peut se propager sur plusieurs étapes sans contrôle humain.

Voir aussiAgentic engineer (ingénieur agentique)MCP (Model Context Protocol)Raisonnement (reasoning)IDE IA

Vocabulaire Joute

Agentic engineer (ingénieur agentique)

L'agentic engineer est un profil de développeur qui pilote des agents IA tout en gardant la maîtrise de l'architecture, des tests et de la qualité du code. À la différence du vibe coder, il lit ce que l'IA produit, sait l'évaluer et reprendre la main. Chez Joute, c'est l'un des deux profils de référence pour situer un outil. La devise associée : déléguer l'exécution, pas la compréhension.

Voir aussiVibe coding Agent IA IDE IA Catégorie : IA pour coder

Usage & pratique

Benchmark

Un benchmark est un jeu de tests standardisé servant à comparer les modèles sur une tâche : code, mathématiques, compréhension. Il donne un repère chiffré, utile mais limité. Un modèle peut être optimisé pour bien figurer sur un benchmark sans être meilleur en usage réel, et certains jeux de test finissent par fuiter dans les données d'entraînement.

Voir aussiLLM (grand modèle de langage)Raisonnement (reasoning)Notre méthode

Modèles & architecture

Contexte (fenêtre de contexte)

La fenêtre de contexte est la quantité maximale de texte qu'un modèle peut prendre en compte en une seule fois : la consigne, l'historique de conversation et les documents fournis. Elle se mesure en tokens. Au-delà de cette limite, le modèle oublie le début de l'échange. Une fenêtre large permet d'analyser un long document, mais ne garantit pas que le modèle exploite bien chaque partie.

Voir aussiToken LLM (grand modèle de langage)RAG (génération augmentée par récupération)

Concepts

Embedding (vecteur sémantique)

Un embedding est la représentation d'un texte, d'une image ou d'un son sous forme de liste de nombres, un vecteur, qui capture son sens. Deux contenus proches en sens ont des vecteurs proches dans l'espace. Les embeddings rendent possibles la recherche sémantique, les recommandations et le RAG.

Voir aussiRAG (génération augmentée par récupération)Inférence

Modèles & architecture

Fine-tuning (affinage)

Le fine-tuning consiste à poursuivre l'entraînement d'un modèle déjà existant sur un jeu de données spécifique, pour l'adapter à un ton, un domaine ou un format précis. Il modifie les poids du modèle, contrairement au prompt ou au RAG. C'est utile pour spécialiser un comportement, mais coûteux et vite dépassé quand un nouveau modèle de base sort.

Voir aussiLLM (grand modèle de langage)RAG (génération augmentée par récupération)Open source et poids ouverts Risque d'obsolescence

Usage & pratique

Génération d'images

La génération d'images crée des visuels à partir d'une description textuelle, le plus souvent au moyen de modèles de diffusion qui partent d'un bruit aléatoire et le débruitent étape par étape. Midjourney, Flux et Ideogram en sont des exemples. Les points sensibles restent le rendu du texte dans l'image, la cohérence d'un personnage d'une image à l'autre et les questions de droits d'auteur sur les données d'entraînement.

Voir aussiMultimodal Catégorie : IA pour l'image Fiche outil : Midjourney Fiche outil : Flux

Infrastructure

GPU

Le GPU, processeur graphique, est le matériel qui exécute les calculs massivement parallèles dont l'IA a besoin, à l'entraînement comme à l'inférence. Sa disponibilité et son prix conditionnent le coût des modèles. La dépendance du secteur à un petit nombre de fabricants de GPU est un facteur économique majeur de l'IA.

Voir aussiInférence Open source et poids ouverts

Concepts

Hallucination

Une hallucination est une réponse fausse qu'un modèle présente avec assurance, comme une citation inventée ou une fonction logicielle inexistante. Elle découle du fonctionnement même des LLM, qui prédisent un texte plausible sans vérifier sa véracité. Aucun modèle n'en est totalement exempt : tout résultat à enjeu doit être vérifié à la source.

Voir aussiLLM (grand modèle de langage)RAG (génération augmentée par récupération)Risque d'obsolescence

Usage & pratique

IDE IA

Un IDE IA est un environnement de développement où l'assistance par intelligence artificielle est native : complétion, génération de code, agents, conversation sur le projet. Cursor et Windsurf en sont des exemples, là où GitHub Copilot s'ajoute à un éditeur existant. L'IDE IA déplace le travail du développeur vers la relecture et le cadrage plutôt que la frappe.

Voir aussiAgent IA Vibe coding MCP (Model Context Protocol)Catégorie : IA pour coder Fiche outil : Cursor

Infrastructure

Inférence

L'inférence est la phase d'utilisation d'un modèle déjà entraîné : on lui envoie une entrée, il produit une sortie. Elle s'oppose à l'entraînement, qui crée le modèle. Chaque réponse d'un assistant IA est une inférence, dont le coût se mesure en calcul et en tokens. C'est là que se joue la vitesse perçue d'un outil.

Voir aussiToken GPU LLM (grand modèle de langage)

Concepts

Jailbreak

Un jailbreak est une manipulation de prompt visant à contourner les garde-fous d'un modèle pour lui faire produire un contenu normalement bloqué. Les techniques exploitent souvent un jeu de rôle ou des consignes contradictoires. Les éditeurs corrigent ces failles en continu, mais la sécurité d'un LLM reste un domaine ouvert plutôt qu'un problème résolu.

Voir aussiPrompt et prompt engineering LLM (grand modèle de langage)

Modèles & architecture

LLM (grand modèle de langage)

Un LLM, pour large language model, est un réseau de neurones entraîné à prédire le mot suivant sur d'immenses quantités de texte. De cette tâche simple émergent des capacités de rédaction, de traduction et de raisonnement partiel. GPT, Claude et Gemini sont des LLM. Un LLM ne consulte pas de base de connaissances en direct : il restitue ce que ses paramètres ont encodé pendant l'entraînement.

Voir aussiToken Contexte (fenêtre de contexte)Hallucination Fine-tuning (affinage)Raisonnement (reasoning)

Infrastructure

MCP (Model Context Protocol)

Le MCP, Model Context Protocol, est un standard ouvert qui décrit comment un modèle d'IA se connecte à des outils et des sources de données externes : fichiers, bases, API. Il joue le rôle d'un port universel entre un assistant et son environnement, ce qui évite de recoder une intégration par outil. Claude, Cursor et plusieurs IDE IA le prennent en charge.

Voir aussiAgent IA IDE IA Fiche outil : Claude Code Fiche outil : Cursor

Modèles & architecture

Multimodal

Un modèle multimodal traite plusieurs types de données : texte, image, son, parfois vidéo. Il peut décrire une photo, lire un graphique ou répondre à une question vocale. La plupart des grands modèles récents sont multimodaux par défaut, mais leur niveau varie fortement d'un format à l'autre.

Voir aussiLLM (grand modèle de langage)Génération d'images

Usage & pratique

No-code et générateurs d'applications IA

Le no-code permet de construire un logiciel sans écrire de code, via des interfaces visuelles. Les générateurs d'applications IA, comme Lovable, Bolt ou v0, en sont une évolution : on décrit l'application en langage naturel et l'outil produit une interface fonctionnelle. La limite reste la même que pour le vibe coding : passé le prototype, la maîtrise du code généré redevient nécessaire.

Voir aussiVibe coding IDE IA Fiche outil : Lovable Fiche outil : Bolt

Modèles & architecture

Open source et poids ouverts

Un modèle à poids ouverts est un modèle dont les paramètres sont publiés et téléchargeables, ce qui permet de l'exécuter soi-même, de l'auditer et de l'affiner. La nuance compte : poids ouverts ne signifie pas toujours open source au sens strict, car les données et le code d'entraînement ne sont pas forcément fournis, et la licence peut restreindre l'usage commercial. Llama, Mistral et DeepSeek diffusent des modèles de ce type.

Voir aussiLLM (grand modèle de langage)Fine-tuning (affinage)Fiche outil : Le Chat Fiche outil : DeepSeek

Usage & pratique

Prompt et prompt engineering

Un prompt est l'instruction en langage naturel envoyée à un modèle d'IA. Le prompt engineering désigne la pratique consistant à formuler ces instructions pour obtenir un résultat fiable : préciser le rôle, le format attendu, donner des exemples, fixer des contraintes. Ce n'est pas de la programmation, mais une compétence de cadrage qui change nettement la qualité des réponses.

Voir aussiLLM (grand modèle de langage)Agent IA Jailbreak

Concepts

RAG (génération augmentée par récupération)

Le RAG, retrieval-augmented generation, est une technique qui va chercher des documents pertinents dans une base externe, puis les fournit au modèle pour qu'il fonde sa réponse dessus. Cela permet de répondre sur des données récentes ou privées sans réentraîner le modèle, et de citer des sources. La qualité du RAG dépend autant de la recherche documentaire que du modèle lui-même.

Voir aussiEmbedding (vecteur sémantique)Contexte (fenêtre de contexte)Hallucination LLM (grand modèle de langage)

Modèles & architecture

Raisonnement (reasoning)

Les modèles de raisonnement génèrent une suite d'étapes intermédiaires avant de donner leur réponse finale, une forme de brouillon interne. Cette approche améliore les résultats sur les problèmes de logique, de mathématiques et de code. Elle augmente le temps de réponse et le coût, et ne supprime pas les erreurs : un raisonnement détaillé peut rester faux.

Voir aussiLLM (grand modèle de langage)Agent IA Inférence Benchmark

Vocabulaire Joute

Risque d'obsolescence

Le risque d'obsolescence est l'indicateur signature de Joute : une note sur 10, distincte de la note de qualité, qui estime la probabilité qu'un outil perde son intérêt à mesure que les grands modèles progressent. Un outil dont la fonction peut être absorbée par ChatGPT, Claude ou Gemini reçoit un risque élevé. L'objectif est concret : éviter de payer un abonnement pour une couche d'interface vouée à disparaître.

Voir aussiLLM (grand modèle de langage)Benchmark Notre méthode

Modèles & architecture

Token

Un token est l'unité de base que manipule un modèle de langage : un morceau de mot, un mot court ou un signe de ponctuation. En français, un mot vaut souvent un à trois tokens. La tarification des API et la taille de la fenêtre de contexte se comptent en tokens, pas en mots ni en caractères.

Voir aussiLLM (grand modèle de langage)Contexte (fenêtre de contexte)Inférence

Concepts

Vibe coding

Le vibe coding désigne une façon de programmer où l'on décrit en langage naturel ce que l'on veut et où l'on accepte le code généré par l'IA sans toujours le relire en détail. L'expression a été popularisée par Andrej Karpathy. Cette approche permet de prototyper très vite, mais reporte la dette technique : le code produit reste à comprendre et à vérifier avant toute mise en production.

Voir aussiAgentic engineer (ingénieur agentique)No-code et générateurs d'applications IA IDE IA Agent IA

Un terme à ajouter ?

Le glossaire évolue avec le domaine. Pour comprendre comment Joute note les outils et pourquoi le risque d'obsolescence compte, passe par la méthode.

Lire la méthode