Un excellent outil pour estimer combien de VRAM vos LLM ont réellement besoin. Modifiez la configuration matérielle, la quantification, etc., il vous informe sur : - Vitesse de génération (tokens/sec) - Allocation mémoire précise - Débit système, etc. Fini les suppositions sur la VRAM !