Een geweldig hulpmiddel om te schatten hoeveel VRAM je LLM's daadwerkelijk nodig hebben. Pas de hardwareconfiguratie, kwantisatie, enz. aan, het vertelt je over: - Generatiesnelheid (tokens/sec) - Nauwkeurige geheugentoewijzing - Systeemdoorvoer, enz. Geen VRAM-gissingen meer!