Una nuova presentazione di 30 minuti di @aelluswamy, VP di AI di Tesla, è stata rilasciata, dove parla di FSD, AI e dei recenti progressi del team. Punti salienti della presentazione: • La flotta di veicoli di Tesla può fornire 500 anni di dati di guida ogni singolo giorno. Maleficio della dimensionalità: • 8 telecamere ad alta frequenza di fotogrammi = miliardi di token ogni 30 secondi di contesto di guida. • Tesla deve comprimere ed estrarre le giuste correlazioni tra input sensoriali e azioni di controllo. Vantaggio dei dati: • Tesla ha accesso a una "cascata di dati" — centinaia di anni di guida collettiva della flotta. • Utilizza trigger di dati intelligenti per catturare casi rari (ad es., incroci complessi, comportamenti imprevedibili). Qualità ed efficienza: • Estrae solo i dati essenziali necessari per addestrare i modelli in modo efficiente. Debugging e interpretabilità: • Anche se il sistema è end-to-end, Tesla può comunque sollecitare il modello a produrre dati interpretabili: occupazione 3D, confini stradali, oggetti, segnali, semafori, ecc. • Query in linguaggio naturale: chiedere al modello perché ha preso una certa decisione. • Queste previsioni ausiliarie non guidano l'auto ma aiutano gli ingegneri a fare debug e garantire la sicurezza. Splatting Gaussiano Avanzato di Tesla (Modellazione di Scene 3D): • Tesla ha sviluppato un sistema di splatting gaussiano personalizzato e ultra-veloce per ricostruire scene 3D da viste di telecamera limitate. • Produce rendering 3D nitidi e accurati anche da pochi angoli di telecamera — molto meglio degli approcci standard NeRF/splatting. • Consente un rapido debug visivo dell'ambiente di guida in 3D. Valutazione e modelli del mondo: • La valutazione è la sfida più difficile: i modelli possono funzionare bene offline ma fallire in condizioni reali. • Tesla costruisce set di dati di valutazione bilanciati e diversificati concentrandosi su casi limite — non solo su facili percorsi autostradali....