$A^3$-Banco
Un nuevo punto de referencia que evalúa los mecanismos impulsados por la memoria en el razonamiento científico. Mide cómo los modelos activan los "anclajes" (fórmulas centrales) y los "atractores" (esquemas/ejemplos) durante la inferencia, yendo más allá de simplemente comprobar las respuestas finales.
Meta acaba de publicar el benchmark de MapAnything en Hugging Face
Evaluación universal de reconstrucción 3D en tareas de estéreo multivista, profundidad y pose de cámara. Modelos de referencia de feed-forward en escenas reales diversas con métricas estandarizadas.