ha elencato i 6 cambiamenti più importanti di quest'anno dal più grande evento di ricerca sull'AI, NeurIPS 2025. ci dice molto su dove sta andando l'AI nel 2026: 1. il meccanismo di attenzione sta ricevendo un notevole aggiornamento. sta diventando più selettivo utilizzando tecniche come il gating, la sparsità e una migliore gestione del contesto lungo. tra circa 6 mesi vedrai modelli che sono più economici, più intelligenti e più efficienti. 2. i modelli di frontiera stanno convergendo. già lo sapevamo, ma di nuovo, i modelli di punta suonano sempre più simili. la tua scelta di modello di frontiera conta meno di prima, ma anche qualsiasi pregiudizio o punto cieco viene amplificato ovunque contemporaneamente. 3. l'RL sta finalmente scalando per la robotica. è stato in stallo per anni. l'approccio "continua a scalare" che ha funzionato per gli LLM ora funziona per gli agenti. il 2026 sarà l'anno di progressi significativi nei sistemi agentici. 4. i modelli di diffusione non stanno solo memorizzando i dati di addestramento. un importante articolo teorico ha dimostrato che l'addestramento alla diffusione ha effettivamente due fasi: una fase iniziale in cui i modelli imparano a generare campioni di alta qualità e una fase successiva in cui iniziano a memorizzare cose specifiche. più dati di addestramento spingono la fase di memorizzazione e ti danno una finestra più ampia prima del sovradattamento. 5. il sistema di articoli accademici è COOKED (seriosamente). con 20000 sottomissioni NeurIPS sta affogando nei documenti. stanno persino sperimentando con l'AI per rivedere articoli generati da AI. ciò significa che non puoi più fidarti realmente del prestigio delle conferenze e delle pubblicazioni. devi fare affidamento su chi ha scritto l'articolo e sul loro background. 6. i grandi laboratori stanno puntando tutto su ragionamento, efficienza e integrazione. la corsa alla frontiera non riguarda più solo la dimensione del modello. i grandi laboratori stanno ora lavorando su: (1) ragionamento come metrica misurabile, pensiero passo dopo passo, chiamate agli strumenti, utilizzo della ricerca (2) efficienza, eseguire modelli potenti su telefoni e dispositivi edge con bassa latenza (3) integrazione del flusso di lavoro, collegare modelli a strumenti e protocolli come MCP. ti consiglio davvero di guardare questo riassunto di 10 minuti se la ricerca sull'AI ti preoccupa.