Вийшла нова 30-хвилинна презентація від @aelluswamy, віце-президента Tesla з питань штучного інтелекту, де він розповідає про FSD, AI та останні досягнення команди. Тези з презентації: • Автопарк Tesla може надавати дані про водіння за 500 років щодня. Прокляття розмірності: • 8 камер з високою частотою кадрів = мільярди токенів за 30 секунд водіння. • Тесла повинен стискати і витягувати правильні кореляції між сенсорним введенням і керуючими діями. Перевага даних: • Tesla має доступ до «Ніагарського водоспаду даних» — колективного водіння автопарку протягом сотень років. • Використовує інтелектуальні тригери даних для фіксації рідкісних випадків у кутах (наприклад, складні перехрестя, непередбачувана поведінка). Якість та ефективність: • Витягує лише необхідні дані, необхідні для ефективного навчання моделей. Налагодження та інтерпретація: • Незважаючи на те, що система є наскрізною, Tesla все ще може запропонувати моделі вивести інтерпретовані дані: 3D зайнятість, межі доріг, об'єкти, знаки, світлофори і т.д. • Запит на природну мову: запитайте модель, чому вона прийняла певне рішення. • Ці допоміжні прогнози не керують автомобілем, але допомагають інженерам налагоджувати та забезпечувати безпеку. Удосконалене гаусове розбризкування Tesla (3D-моделювання сцени): • Компанія Tesla розробила спеціальну надшвидку систему розбризкування по Гаусу для реконструкції 3D-сцен з обмеженого огляду камери. • Забезпечує чітке й точне 3D-зображення навіть під кількома кутами камери — набагато краще, ніж стандартні підходи NeRF/розбризкування. • Дозволяє швидко візуально налагоджувати середовище водіння в 3D. Оцінка та моделі світу: • Оцінка є найскладнішим викликом: моделі можуть добре працювати в автономному режимі, але зазнавати невдачі в реальних умовах. • Tesla створює збалансовані, різноманітні оціночні набори даних, зосереджуючись на периферійних випадках, а не лише на легкому водінні по шосе....