Ett bra verktyg för att uppskatta hur mycket VRAM dina LLM:er faktiskt behöver. Ändra hårdvarukonfigurationen, kvantiseringen, etc., den berättar om: - Genereringshastighet (tokens/sek) - Exakt minnesallokering - Systemets genomströmning m.m. Inget mer VRAM-gissande!