Ecco un recente intervento che ho tenuto riassumendo gli ultimi 6-12 mesi di progressi nell'IA, perché ottenere modelli perfetti è difficile, come i laboratori stanno probabilmente affrontando la prossima fase di addestramento (per gli agenti) e altri dettagli interessanti nel panorama del ragionamento. Argomenti: 00:00 Introduzione e stato del ragionamento 05:50 Hillclimbing valutazioni imperfette 09:18 Collo di bottiglia tecnici 13:02 Sycophancy 18:08 La zona di Goldilocks 19:28 Cosa viene dopo? (suggerimento, pianificazione) 26:40 Domande e risposte YouTube ecc. nelle risposte. Grazie @corbtt e @OpenPipeAI per avermi ospitato.
Post (trascrizione + link): YouTube: Diapositive:
67,9K