L'essentiel en 20 secondes
- Base vectorielle open source, en-mémoire ou persistante, pour applications RAG
- Zéro configuration pour démarrer :
pip install chromadbet c'est prêt - SDK Python et JavaScript officiel
- Prix : gratuit open source, Chroma Cloud à 50 €/mois
Verdict : Chroma est la base vectorielle la plus facile à prendre en main pour prototyper. Pour la production à grande échelle, passer à Pinecone ou Weaviate.
Chroma, c'est quoi
Chroma est une base de données vectorielle open source conçue pour les développeurs qui construisent des applications RAG ou de recherche sémantique. L'objectif : permettre à n'importe quel développeur de commencer en 5 minutes sans configuration.
Tu peux l'utiliser en-mémoire pour les tests, ou avec persistance locale pour des projets plus sérieux. La version cloud est disponible pour la production.
Points forts
Démarrage en 5 minutes
import chromadb
client = chromadb.Client()
collection = client.create_collection("docs")
collection.add(documents=["..."], ids=["1"])
results = collection.query(query_texts=["recherche"], n_results=2)
C'est tout. Pas de serveur à lancer, pas de configuration Docker.
Intégration LangChain et LlamaIndex native
Chroma est le premier vectorstore recommandé dans la plupart des tutoriels LangChain et LlamaIndex. La documentation et les exemples sont abondants.
Filtrage par métadonnées
Les filtres sur les métadonnées (where={"source": "documentation"}) permettent de combiner recherche sémantique et filtrage structuré.
Limites
Pas conçu pour la production à grande échelle
Au-delà de quelques millions de vecteurs, les performances se dégradent. Pour des applications avec de grands volumes de données, Pinecone, Weaviate ou Qdrant sont plus adaptés.
Chroma Cloud encore en beta
La version cloud managée est disponible mais reste moins mature que Pinecone ou Weaviate Cloud.
Prix
- Open source : gratuit
- Chroma Cloud : 50 €/mois pour la version managée
Alternatives
- Pinecone pour la production à grande échelle managée
- Weaviate pour du vectordb open source plus scalable
- Qdrant pour les performances en Rust
Verdict
Chroma est le point d'entrée recommandé pour tout développeur qui veut construire un premier RAG. La DX est excellente. Pour les prototypes et les petits projets, c'est parfait. Pour la production à fort volume, migrer vers Pinecone.
FAQ
Chroma supporte-t-il les embeddings d'OpenAI ?
Oui. Tu peux utiliser text-embedding-3-small ou large d'OpenAI, ou n'importe quelle autre fonction d'embedding.
Peut-on persister les données Chroma entre les redémarrages ?
Oui. chromadb.PersistentClient(path="./db") pour stocker les données sur disque.
Chroma est-il utilisable avec des modèles locaux ?
Oui. Tu peux utiliser des embeddings générés par des modèles locaux (sentence-transformers, Ollama).
Quelle est la limite pratique de vecteurs dans Chroma ?
En local, environ 1 million de vecteurs reste gérable. Au-delà, les temps de requête commencent à grimper selon la machine.
Chroma est open source et gratuit. Joute peut percevoir une commission sur Chroma Cloud. En savoir plus sur notre politique d'affiliation.
Chroma : 0/10.
Chroma est la base vectorielle la plus simple à utiliser pour prototyper un RAG en Python. Open source, locale, zéro config. Moins scalable que Pinecone ou Weaviate en production..
Teste Chroma par toi-même
Un essai gratuit est disponible. Compte trente minutes pour te faire ton propre avis.
Lien affilié. Joute touche une commission sans surcoût pour toi. Notre avis reste indépendant.
Duels liés
Wordtune vs Grammarly
Wordtune et Grammarly face à face : forces, faiblesses, ticket d'entrée (10 €/mois vs 27 €/mois) et pour qui chacun est fait, par Joute.
Windsurf vs GitHub Copilot
Comparatif Windsurf contre GitHub Copilot : 18 €/mois contre 9 €/mois, plus la vraie différence sur l'usage quotidien. Windsurf gagne ce duel.
Veo vs Runway
Veo vs Runway en 2026 : on a opposé Via abo Gemini contre 12 €/mois. Verdict Runway, scores Joute, et lequel choisir selon ton profil.
