Et flott verktøy for å estimere hvor mye VRAM LLM-ene dine faktisk trenger. Endre maskinvarekonfigurasjonen, kvantiseringen osv., den forteller deg om: - Generasjonshastighet (tokens/sek) - Nøyaktig minneallokering - Systemgjennomstrømning osv. Ikke mer VRAM-gjetting!