📊 Sizing & Dimensionnement¶
Ce guide vous permet de dimensionner l'application selon le nombre d'utilisateurs et de connecteurs.
1️⃣ Matrice de dimensionnement¶
| Profil | Utilisateurs | Connecteurs | CPU | RAM | Stockage |
|---|---|---|---|---|---|
| S – POC | ≤ 10 | ≤ 3 | 1 vCPU | 1–2 Go | 5 Go |
| M – Standard | 10–50 | 3–10 | 2 vCPU | 4 Go | 10–20 Go |
| L – Intensif | 50–200 | 10–30 | 4 vCPU | 8 Go | 50 Go |
| XL – Entreprise | 200+ | 30+ | 8 vCPU | 16 Go | 100+ Go |
Matrice de Configuration (RAM / CPU / DISK)¶
Ce tableau présente les configurations recommandées en fonction de l’usage de l’application : volume de documents, nombre de chatbots, vectorisation, nombre d’utilisateurs, historique, etc.
| Profil d’usage | Description détaillée | RAM recommandée | CPU recommandée | Disque recommandé |
|---|---|---|---|---|
| A — Léger | - 1 à 3 chatbots - Petits fichiers (< 5 Mo) - Vectorisation faible (< 50k tokens) - Historique faible (< 1k messages) - Peu d’utilisateurs simultanés |
2–4 Go | 1 vCPU | 5–20 Go |
| B — Standard | - 3 à 10 chatbots - Fichiers 5 à 50 Mo - Vectorisation modérée (50k–500k tokens) - Historique moyen (1k–10k messages) - Quelques utilisateurs simultanés |
4–8 Go | 2–4 vCPU | 20–100 Go |
| C — Avancé | - 10+ chatbots - Fichiers volumineux (50–500 Mo) - Vectorisation lourde (500k–1M tokens) - Historique conséquent (10k–100k messages) - Plusieurs utilisateurs simultanés |
8–16 Go | 4–8 vCPU | 100–500 Go |
| D — Intensif / Multi-tenant | - Nombreux chatbots par client - Très gros fichiers (500 Mo – 2 Go) - Vectorisation massive (1M+ tokens) - Historique massif (>100k messages) - Plusieurs clients / forte charge RAG |
16–32 Go | 8–16 vCPU | 500 Go – 2 To |
| E — Plateforme SaaS (scalable) | - Multi-client à grande échelle - Index FAISS multiples - Stockage volumétrique - Analyse RAG intensive - Logging & backups importants |
32–64 Go+ | 16–32 vCPU | 2–10 To+ |
Matrice Technique – Capacités Serveur (RAM / CPU / DISK)¶
Cette matrice correspond aux ressources serveurs recommandées pour héberger la plateforme Hub IA selon le nombre d’utilisateurs et l’usage typique observé (volume documentaire, vectorisation, FAISS, bases SQLite, historique…).
| Utilisateurs | RAM recommandée | CPU recommandée | Stockage recommandé | Usage typique |
|---|---|---|---|---|
| 0 – 30 | 4 Go | 2 vCPU | 20 – 30 Go | Petits volumes documentaires, faible vectorisation, usage interne limité |
| 31 – 100 | 6 – 8 Go | 4 vCPU | 50 – 80 Go | Plusieurs bots, documents courants (5–50 Mo), historique modéré |
| 100 – 500 | 8 – 12 Go | 4 – 6 vCPU | 100 – 200 Go | Vectorisation régulière, FAISS moyen (100k–400k embeddings), plusieurs utilisateurs simultanés |
| < 1000 | 12 – 16 Go | 6 – 8 vCPU | 200 – 500 Go | Gros documents (100–500 Mo), FAISS important, charge RAG active |
| < 2000 | 16 – 32 Go | 8 – 12 vCPU | 500 Go – 1 To | Multi-bots + multi-utilisateurs, vectorisation lourde (>1M tokens) |
| > 2000 | 32 – 64 Go | 12 – 32 vCPU | 1 – 5 To | Plateforme SaaS à forte charge, gros index FAISS, stockage massif, scaling horizontal |
2️⃣ Notes importantes¶
- Si beaucoup de connecteurs, privilégiez plus de RAM.
- Si beaucoup d'utilisateurs, privilégiez CPU et I/O.
- Les logs non compressés peuvent doubler l'espace disque utilisé.
- Ajustez les ressources selon le volume de données traité et le mode de déploiement.