Någon på den lokala llama-subredditen har redan kvantiserat vår modell till gguf q4-format och använder den lokalt för att generera dynamiska 3D-solsystemapplikationer i Java Script Imponerande one-shot-prestanda enligt mig, särskilt för Q4