Sizing & Dimensionnement¶
Cette section fournit des indications pour dimensionner SPIE HUB IA.
⚠️ Attention : le dimensionnement réel dépend fortement de l’usage effectif (nombre d’utilisateurs actifs, volume de documents vectorisés, nombre de chatbots, fréquence des requêtes, etc.).
⚠️ Minimum requis
Pour un déploiement très léger (POC / test), il est recommandé d’avoir au minimum : - 2 vCPU - 4 Go RAM - 20 Go disque
Ces valeurs sont suffisantes pour tester l’application ou un usage très limité.
Tout dépassement (plus d’utilisateurs, plus de documents ou de chatbots) nécessitera d’augmenter les ressources.
💡 À adapter selon votre usage
Le dimensionnement réel doit tenir compte de plusieurs facteurs : - Nombre d’utilisateurs simultanés - Volume de documents et fichiers vectorisés - Nombre de chatbots actifs - Fréquence et intensité des appels LLM / embeddings
Pour un usage professionnel ou multi-utilisateur, prévoir : - Plus de CPU pour gérer les utilisateurs simultanés - Plus de RAM pour les embeddings et la vectorisation - Plus d’espace disque pour les fichiers et index FAISS - Monitorer régulièrement l’utilisation et ajuster les ressources
💡 Bonnes pratiques
- Commencer avec le minimum et monitorer l’usage réel
- Adapter CPU/RAM/disque en fonction des observations
- Prévoir une marge pour les pics et la croissance
Exemple indicatif de dimensionnement¶
Pour donner une idée des ressources nécessaires selon l’usage, voici un tableau très simplifié.
⚠️ Les valeurs sont purement indicatives. Le dimensionnement réel doit être ajusté selon l’usage effectif.
| Usage | CPU | RAM | Stockage |
|---|---|---|---|
| Test / POC | 2 vCPU | 4 Go | 20 Go |
| Usage léger | 2–4 vCPU | 4–8 Go | 20–50 Go |
| Usage standard | 4 vCPU | 8–16 Go | 50–100 Go |
| Usage intensif / multi-chatbots | 4–8 vCPU | 16–32 Go | 100–500 Go |
| Usage très volumineux | 8+ vCPU | 32+ Go | 500 Go – 2 To |
⚠️ Attention
Ces chiffres sont des ordres de grandeur.
Le dimensionnement réel dépend du nombre d’utilisateurs actifs, du volume de documents vectorisés et du nombre de chatbots.
Toujours monitorer l’usage réel et ajuster CPU, RAM et stockage en conséquence.