Vi har precis publicerat Smol Training Playbook: ett destillat av surt förvärvade kunskaper för att dela med oss av exakt vad som krävs för att träna SOTA LLM:er ⚡️
Med vår protagonist SmolLM3 går vi igenom:
🧭 Strategi för om du ska träna din egen LLM och bränna alla dina VC-pengar
🪨 Pretraining, dvs. att förvandla ett berg av text till en snygg automatisk komplettering
🗿Hur man skulpterar basmodeller med alkemi efter träning
🛠️ Den underliggande infraen och hur du felsöker dig ut ur NCCL-skärselden
Höjdpunkter från kapitlet efter träningen i tråden 👇
3 dagar. Över hela världen. Inspirera och starta nya forskningssamarbeten. Vi presenterar Connect-konferensen. 🖇️
Häng med på otroliga talare, inklusive @1vnzh @jpineau1 @mziizm & @ShayneRedford + >20 forskare som diskuterar hur samarbete och öppen vetenskap driver framsteg. 🚀
En illustrerad guide till AI-agenter, med @MaartenGr
De första 2 kapitlen nu i Early Release!
Utkast till de två första kapitlen i An Illustrated Guide to AI Agents finns nu tillgängliga i Early Release på O'Reilly-plattformen!
Dessa tar dig igenom de centrala begreppen för AI Agent-minne (inklusive begrepp från det snabbt utvecklande ämnet kontextteknik) och verktyg (inklusive MCP eller Model Context Protocol).
Fler kapitel är på väg! Länken finns i tråden.