LLM が実際に必要とする VRAM の量を見積もるための優れたツールです。 ハードウェア構成、量子化などを変更すると、次のことがわかります。 - 生成速度(トークン/秒) - 正確なメモリ割り当て - システムスループットなど VRAMを推測する必要はもうありません!