Llama 4 Scout 17Bx16E
Cette page rassemble les resultats observes pour Llama 4 Scout 17Bx16E afin de voir quelles cartes s'en sortent le mieux, a quel debit, et dans quelles conditions de test.
Ce qu'il faut regarder pour ce modele
- Paramètres actifs : 17B
- Paramètres totaux : 109B
- Contexte max : 10 000 000 tokens
Benchmarks GPU disponibles
-
RTX 4090
· 45 t/s
en Q4_K_M
· contexte 4 096
-
RTX 3090
· 35 t/s
en Q4_K_M
· contexte 4 096
-
RTX 4080
· 35 t/s
en Q4_K_M
· contexte 4 096
-
RTX 4060 Ti 16GB
· 24 t/s
en Q4_K_M
· contexte 4 096