Nasz zespół w FAIR w Meta poszukuje badacza na stanowisko postdoc! Pracujemy nad tematami Rozumowanie, Dopasowanie i Pamięć/architektury (RAM). Aplikuj tutaj: Lokalizacja: NY, Seattle lub Menlo Park. Niektóre z naszych ostatnich prac, aby dać smak: Współdoskonalenie (stanowisko): SPICE (Self-Play w Środowiskach Korpusu): Agenci Samo-Wyzwania: RL z Interakcji Ludzkiej: AggLM (równoległa agregacja): StepWiser (CoT-PRM RL): DARLING (RL trenowane na różnorodności): J1 (RL trenowane LLM jako Sędzia): CoT-Self-Instruct: Multi-Token Attention: