Il nostro team in FAIR presso Meta sta cercando un ricercatore postdoc! Lavoriamo su temi di Ragionamento, Allineamento e Memoria/architetture (RAM). Candidati qui: Luogo: NY, Seattle o Menlo Park. Alcuni dei nostri lavori recenti per dare un'idea: Co-Improvement (posizione): SPICE (Self-Play in Corpus Environments): Agenti Auto-Sfidanti: RL dall'Interazione Umana: AggLM (aggregazione parallela): StepWiser (CoT-PRM RL): DARLING (RL addestrato alla diversità): J1 (LLM addestrato RL come Giudice): CoT-Self-Instruct: Multi-Token Attention: