Gemma 4 26B-A4B (MoE)
Cette page rassemble les resultats observes pour Gemma 4 26B-A4B (MoE) afin de voir quelles cartes s'en sortent le mieux, a quel debit, et dans quelles conditions de test.
Ce qu'il faut regarder pour ce modele
- Paramètres actifs : 4B
- Paramètres totaux : 26B
- Contexte max : 262 144 tokens
Benchmarks GPU disponibles
-
RTX 4090
· 149,56 t/s
en Q4_K_M
· contexte 8 192
-
RTX 4080
· 121,7 t/s
en IQ4_XS
· contexte 19 000
-
RTX 4060 Ti 16GB
· 70 t/s
en Q4_K_M
· contexte 1 024