$A^3$-Лавка
Новий еталон, який оцінює механізми, керовані пам'яттю, у науковому мисленні. Вона вимірює, як моделі активують «якорі» (основні формули) та «атрактори» (схеми/приклади) під час висновку — виходячи за межі перевірки остаточних відповідей.
Meta щойно випустила бенчмарк MapAnything на Hugging Face
Універсальна оцінка 3D-реконструкції на основі завдань з багатокамерними стерео, глибиною та пози камери. Бенчмаркуйте моделі з прямим походом на різноманітних реальних сценах зі стандартизованими метриками.