Qwen3.6 35B-A3B (MoE)
Cette page rassemble les resultats observes pour Qwen3.6 35B-A3B (MoE) afin de voir quelles cartes s'en sortent le mieux, a quel debit, et dans quelles conditions de test.
Ce qu'il faut regarder pour ce modele
- Paramètres actifs : 3B
- Paramètres totaux : 35B
- Contexte max : 262 144 tokens
Benchmarks GPU disponibles
-
RTX 3090
· 101,7 t/s
en Q4_K_XL
· contexte 65 336
-
RTX 3090
· 80,9 t/s
en Q4_K_XL
· contexte 65 336