← Retour à la Box IA
Comparer S, M et L
Quelle taille de Box pour quelle organisation ?
Toutes les Box partagent la même stack, le même comportement, les mêmes garanties de souveraineté. Ce qui change : la capacité, les modèles supportés, le prix.
gbox S
Pour équipes 20 à 40 personnes
Le boîtier compact, silencieux, qui se branche sur une prise standard de bureau.
Users simultanés
jusqu'à 40
Débit moyen
≈ 28 tok/s
Time-to-first-token
≈ 800 ms
Conso · bruit
65 W · 22 dB
★ Le plus choisi
gbox M
Pour ETI de 50 à 150 personnes
Le format de référence : assez de puissance pour faire tourner Gemma 4 31B confortablement, sans matériel exotique.
Users simultanés
jusqu'à 150
Débit moyen
≈ 52 tok/s
Time-to-first-token
≈ 450 ms
Conso · bruit
180 W · 32 dB
gbox L
Pour structures 150+ ou multi-sites
Le boîtier maximaliste : RAM unifiée 192 Go pour faire tourner les modèles les plus exigeants ou servir des centaines d'utilisateurs.
Users simultanés
jusqu'à 400
Débit moyen
≈ 85 tok/s
Time-to-first-token
≈ 280 ms
Conso · bruit
350 W · 40 dB
Spécifications complètes
| Critère | gbox S | gbox M ★ | gbox L |
|---|---|---|---|
| Matériel | |||
| Format | Compact desktop · 5 × 19,7 × 19,7 cm | Mac Studio compact · 9,5 × 19,7 × 19,7 cm | Mac Studio M3 Ultra MAX ou Linux 1U rackable |
| Processeur | Apple M4 Pro · 14 cœurs CPU · 20 cœurs GPU | Apple M3 Ultra · 32 cœurs CPU · 80 cœurs GPU | Apple M3 Ultra max ou AMD EPYC 7763 (variante x86) |
| RAM unifiée | 64 Go | 96 Go | 192 Go |
| Stockage | 2 To | 4 To | 8 To |
| Accélérateur IA | Apple Neural Engine 16 cœurs (38 TOPS) | Apple Neural Engine 32 cœurs (60 TOPS) · 80-core GPU | Apple Neural Engine 32 cœurs (Mac) ou 2 × NVIDIA L40S (variante x86) |
| Réseau | 1 × 10 GbE · Wi-Fi 6E · Thunderbolt 4 | 2 × 10 GbE · Wi-Fi 6E · 6 × Thunderbolt 4 | 2 × 10 GbE · 1 × 25 GbE optionnel · IPMI (variante x86) |
| Physique | |||
| Dimensions (h × l × p) | 5 × 19,7 × 19,7 cm | 9,5 × 19,7 × 19,7 cm | Mac Studio compact · ou 1U rack 19" |
| Poids | 1.4 kg | 3.6 kg | 3.6 kg |
| Consommation | 65 W | 180 W | 350 W |
| Niveau sonore | 22 dB | 32 dB | 40 dB |
| Performance | |||
| Users simultanés | 40 users | 150 users | 400 users |
| Débit moyen | ≈ 28 tok/s | ≈ 52 tok/s | ≈ 85 tok/s |
| Time-to-first-token | ≈ 800 ms | ≈ 450 ms | ≈ 280 ms |
| Modèles | |||
| Modèles supportés | Gemma 4 9B · Mistral Small 3 · Llama 3 8B · Qwen 2.5 7B | Gemma 4 31B · Mistral Large 2 · Llama 3 70B (q4) · Qwen 2.5 32B · Codestral 22B | Gemma 4 31B fp16 · Llama 3 70B · Qwen 2.5 72B · Mixtral 8x22B · DeepSeek V3 (q4) |
| Tarification | |||
| CAPEX (one-shot) | 12 000 € | 25 000 € | 38 000 € |
| Support annuel | 4 800 € / an | 9 600 € / an | 14 400 € / an |
Aide à la décision
Comment choisir ?
gbox S
Vous démarrez ou pilotez
POC sur 6 mois, équipe pilote, filiale de 30 personnes, ou cabinet de conseil avec besoin ponctuel. La S coche tout ça à un coût raisonnable.
gbox M
Vous déployez à l'échelle
Le format que nous recommandons par défaut : ETI 50 à 150 collaborateurs, modèles 30B en pleine résolution, latence basse, sans matériel exotique.
gbox L
Vous avez des contraintes fortes
Multi-sites, modèles 70B+, débit > 80 tok/s, intégration baie 1U datacenter (variante Linux x86), ou rapport de force sur des charges très concurrentes.