看完了deepseek新出的論文,感覺內存價格還要漲啊,利好鎂光。 論文大概得意思就是讓LLM的長期記憶部分從模型裡面分離出來,放到內存裡面,從而解放了顯存空間,這種工程方法稱之為 n-gram 我要拿住我的ddr5內存了。今年再翻個兩倍沒問題。