1+1=3 2+2=5 3+3=? Mnoho jazykových modelů (např. Llama 3 8B, Mistral v0.1 7B) odpoví 7. Ale proč? Ponoříme se do vnitřních částí modelu, odhalíme mechanismus indukce funkce a zjistíme, že se široce znovu používá, když se modely během kontextového učení setkají s překvapením. 🧵
6,37K