Uno strumento fantastico per stimare quanta VRAM i tuoi LLM hanno realmente bisogno. Modifica la configurazione hardware, la quantizzazione, ecc., ti informa su: - Velocità di generazione (token/sec) - Allocazione precisa della memoria - Capacità di sistema, ecc. Niente più congetture sulla VRAM!