Náš tým ve FAIR v Meta najímá postdoktoranda! Pracujeme na tématech uvažování, zarovnání a paměti/architektur (RAM). Přihlaste se zde: Místo: NY, Seattle nebo Menlo Park. Některé z našich nedávných prací, které mají dodat atmosféru: Pozice spoluzlepšování: SPICE (Samohraní v korpusových prostředích): Sebevýzvy vůči agentům: RL z Human Interaction: AggLM (paralelní agregace): StepWiser (CoT-PRM RL): DARLING (RL vyškolený v diverzitě): J1 (RL-trained LLM jako soudce): CoT-Samouč: Pozornost na více tokenů: