Echipa noastră de la FAIR la Meta angajează un cercetător postdoctorand! Lucrăm la subiectele Raționamentului, Alinierii și Memoriei/arhitecturilor (RAM). Aplică aici: Locație: NY, Seattle sau Menlo Park. Câteva dintre lucrările noastre recente pentru a da savoare: Co-îmbunătățire (poziție): SPICE (Auto-joc în medii Corpus): Agenți care se provoacă singuri: Viața reală din Interacțiunea Umană: AggLM (agregare paralelă): StepWiser (CoT-PRM RL): DARLING (RL instruit în diversitate): J1 (LLM instruit în RL - ca judecător): CoT-Auto-Instruire: Atenție multi-token: