每個人都對那些大人物著迷:我們稱之為 LLM 的萬億參數雲端神明。但在陰影中,發生了一些更奇怪的事情。 微小 AI 模型的非理性有效性 🧵 🪡 1/6
小型語言模型(SLMs)可以在本地運行,離線且免費。 它們可以放在隨身碟上,耗電量小,並且在體積為GPT-3的1/175時,性能超越了這個開創時代的模型。 2/6
LLaMA 3.2(1B 參數)在 MMLU 上得分 53.9% — 高於 GPT-3,並且你可以在 $100 的 Raspberry Pi 上運行它。 給它一個小型參考庫(RAG),它會再次改善。 你正在看一個可以放在隨身碟上的大學教育程度的頭腦。 4/6
3.24K