Joute
Référence

Glossaire de l'IA

Les termes de l'IA expliqués en français, sans jargon inutile ni promesse marketing. 23 définitions, à jour et vérifiables, pour suivre les comparatifs de Joute sans rester sur le bord.

Concepts

Agent IA

Un agent IA est un système qui ne se contente pas de répondre : il décompose un objectif en étapes, choisit des outils, exécute des actions et observe les résultats avant de continuer. Un agent de code peut ainsi lire des fichiers, lancer des tests et corriger le code en boucle. L'autonomie a un revers : une erreur de raisonnement peut se propager sur plusieurs étapes sans contrôle humain.

Vocabulaire Joute

Agentic engineer (ingénieur agentique)

L'agentic engineer est un profil de développeur qui pilote des agents IA tout en gardant la maîtrise de l'architecture, des tests et de la qualité du code. À la différence du vibe coder, il lit ce que l'IA produit, sait l'évaluer et reprendre la main. Chez Joute, c'est l'un des deux profils de référence pour situer un outil. La devise associée : déléguer l'exécution, pas la compréhension.

Usage & pratique

Benchmark

Un benchmark est un jeu de tests standardisé servant à comparer les modèles sur une tâche : code, mathématiques, compréhension. Il donne un repère chiffré, utile mais limité. Un modèle peut être optimisé pour bien figurer sur un benchmark sans être meilleur en usage réel, et certains jeux de test finissent par fuiter dans les données d'entraînement.

Modèles & architecture

Contexte (fenêtre de contexte)

La fenêtre de contexte est la quantité maximale de texte qu'un modèle peut prendre en compte en une seule fois : la consigne, l'historique de conversation et les documents fournis. Elle se mesure en tokens. Au-delà de cette limite, le modèle oublie le début de l'échange. Une fenêtre large permet d'analyser un long document, mais ne garantit pas que le modèle exploite bien chaque partie.

Concepts

Embedding (vecteur sémantique)

Un embedding est la représentation d'un texte, d'une image ou d'un son sous forme de liste de nombres, un vecteur, qui capture son sens. Deux contenus proches en sens ont des vecteurs proches dans l'espace. Les embeddings rendent possibles la recherche sémantique, les recommandations et le RAG.

Modèles & architecture

Fine-tuning (affinage)

Le fine-tuning consiste à poursuivre l'entraînement d'un modèle déjà existant sur un jeu de données spécifique, pour l'adapter à un ton, un domaine ou un format précis. Il modifie les poids du modèle, contrairement au prompt ou au RAG. C'est utile pour spécialiser un comportement, mais coûteux et vite dépassé quand un nouveau modèle de base sort.

Usage & pratique

Génération d'images

La génération d'images crée des visuels à partir d'une description textuelle, le plus souvent au moyen de modèles de diffusion qui partent d'un bruit aléatoire et le débruitent étape par étape. Midjourney, Flux et Ideogram en sont des exemples. Les points sensibles restent le rendu du texte dans l'image, la cohérence d'un personnage d'une image à l'autre et les questions de droits d'auteur sur les données d'entraînement.

Infrastructure

GPU

Le GPU, processeur graphique, est le matériel qui exécute les calculs massivement parallèles dont l'IA a besoin, à l'entraînement comme à l'inférence. Sa disponibilité et son prix conditionnent le coût des modèles. La dépendance du secteur à un petit nombre de fabricants de GPU est un facteur économique majeur de l'IA.

Usage & pratique

IDE IA

Un IDE IA est un environnement de développement où l'assistance par intelligence artificielle est native : complétion, génération de code, agents, conversation sur le projet. Cursor et Windsurf en sont des exemples, là où GitHub Copilot s'ajoute à un éditeur existant. L'IDE IA déplace le travail du développeur vers la relecture et le cadrage plutôt que la frappe.

Infrastructure

Inférence

L'inférence est la phase d'utilisation d'un modèle déjà entraîné : on lui envoie une entrée, il produit une sortie. Elle s'oppose à l'entraînement, qui crée le modèle. Chaque réponse d'un assistant IA est une inférence, dont le coût se mesure en calcul et en tokens. C'est là que se joue la vitesse perçue d'un outil.

Concepts

Jailbreak

Un jailbreak est une manipulation de prompt visant à contourner les garde-fous d'un modèle pour lui faire produire un contenu normalement bloqué. Les techniques exploitent souvent un jeu de rôle ou des consignes contradictoires. Les éditeurs corrigent ces failles en continu, mais la sécurité d'un LLM reste un domaine ouvert plutôt qu'un problème résolu.

Modèles & architecture

LLM (grand modèle de langage)

Un LLM, pour large language model, est un réseau de neurones entraîné à prédire le mot suivant sur d'immenses quantités de texte. De cette tâche simple émergent des capacités de rédaction, de traduction et de raisonnement partiel. GPT, Claude et Gemini sont des LLM. Un LLM ne consulte pas de base de connaissances en direct : il restitue ce que ses paramètres ont encodé pendant l'entraînement.

Infrastructure

MCP (Model Context Protocol)

Le MCP, Model Context Protocol, est un standard ouvert qui décrit comment un modèle d'IA se connecte à des outils et des sources de données externes : fichiers, bases, API. Il joue le rôle d'un port universel entre un assistant et son environnement, ce qui évite de recoder une intégration par outil. Claude, Cursor et plusieurs IDE IA le prennent en charge.

Modèles & architecture

Multimodal

Un modèle multimodal traite plusieurs types de données : texte, image, son, parfois vidéo. Il peut décrire une photo, lire un graphique ou répondre à une question vocale. La plupart des grands modèles récents sont multimodaux par défaut, mais leur niveau varie fortement d'un format à l'autre.

Usage & pratique

No-code et générateurs d'applications IA

Le no-code permet de construire un logiciel sans écrire de code, via des interfaces visuelles. Les générateurs d'applications IA, comme Lovable, Bolt ou v0, en sont une évolution : on décrit l'application en langage naturel et l'outil produit une interface fonctionnelle. La limite reste la même que pour le vibe coding : passé le prototype, la maîtrise du code généré redevient nécessaire.

Modèles & architecture

Open source et poids ouverts

Un modèle à poids ouverts est un modèle dont les paramètres sont publiés et téléchargeables, ce qui permet de l'exécuter soi-même, de l'auditer et de l'affiner. La nuance compte : poids ouverts ne signifie pas toujours open source au sens strict, car les données et le code d'entraînement ne sont pas forcément fournis, et la licence peut restreindre l'usage commercial. Llama, Mistral et DeepSeek diffusent des modèles de ce type.

Usage & pratique

Prompt et prompt engineering

Un prompt est l'instruction en langage naturel envoyée à un modèle d'IA. Le prompt engineering désigne la pratique consistant à formuler ces instructions pour obtenir un résultat fiable : préciser le rôle, le format attendu, donner des exemples, fixer des contraintes. Ce n'est pas de la programmation, mais une compétence de cadrage qui change nettement la qualité des réponses.

Concepts

RAG (génération augmentée par récupération)

Le RAG, retrieval-augmented generation, est une technique qui va chercher des documents pertinents dans une base externe, puis les fournit au modèle pour qu'il fonde sa réponse dessus. Cela permet de répondre sur des données récentes ou privées sans réentraîner le modèle, et de citer des sources. La qualité du RAG dépend autant de la recherche documentaire que du modèle lui-même.

Modèles & architecture

Raisonnement (reasoning)

Les modèles de raisonnement génèrent une suite d'étapes intermédiaires avant de donner leur réponse finale, une forme de brouillon interne. Cette approche améliore les résultats sur les problèmes de logique, de mathématiques et de code. Elle augmente le temps de réponse et le coût, et ne supprime pas les erreurs : un raisonnement détaillé peut rester faux.

Vocabulaire Joute

Risque d'obsolescence

Le risque d'obsolescence est l'indicateur signature de Joute : une note sur 10, distincte de la note de qualité, qui estime la probabilité qu'un outil perde son intérêt à mesure que les grands modèles progressent. Un outil dont la fonction peut être absorbée par ChatGPT, Claude ou Gemini reçoit un risque élevé. L'objectif est concret : éviter de payer un abonnement pour une couche d'interface vouée à disparaître.

Modèles & architecture

Token

Un token est l'unité de base que manipule un modèle de langage : un morceau de mot, un mot court ou un signe de ponctuation. En français, un mot vaut souvent un à trois tokens. La tarification des API et la taille de la fenêtre de contexte se comptent en tokens, pas en mots ni en caractères.

Concepts

Vibe coding

Le vibe coding désigne une façon de programmer où l'on décrit en langage naturel ce que l'on veut et où l'on accepte le code généré par l'IA sans toujours le relire en détail. L'expression a été popularisée par Andrej Karpathy. Cette approche permet de prototyper très vite, mais reporte la dette technique : le code produit reste à comprendre et à vérifier avant toute mise en production.

Un terme à ajouter ?

Le glossaire évolue avec le domaine. Pour comprendre comment Joute note les outils et pourquoi le risque d'obsolescence compte, passe par la méthode.

Lire la méthode