État de l'art des LLM open source pour le code (2025–2026)

Panorama des modèles de génération de code les plus performants en 2025–2026, avec les chiffres VRAM concrets et une explication détaillée des niveaux de quantification pour le code local.

Les quatre modèles de référence

Pourquoi Q4_K_M pour le code local

Le code, plus structuré que le langage naturel, résiste mieux à la compression 4-bit. Q4_K_M offre une réduction de VRAM de ~4x vs FP16 avec des pertes mesurées autour de 3–5 % sur les benchmarks SWE-bench et HumanEval. C'est le meilleur compromis qualité/mémoire pour la génération de code en local.