Qwen 3.5-35B (MoE)
Cette page rassemble les resultats observes pour Qwen 3.5-35B (MoE) afin de voir quelles cartes s'en sortent le mieux, a quel debit, et dans quelles conditions de test.
Ce qu'il faut regarder pour ce modele
- Paramètres actifs : 35B
- Paramètres totaux : 35B
- Contexte max : 128 000 tokens
Benchmarks GPU disponibles
-
RTX 5090
· 194 t/s
-
RTX 3090
· 142,2 t/s
en Q4_K_XL
· contexte 65 336
-
RTX 4080
· 136,4 t/s
en IQ3_S
· contexte 19 000
-
RTX 3090
· 133,1 t/s
en Q4_K_XL
· contexte 65 336
-
Radeon AI PRO R9700
· 127,4 t/s