$A^3$-Bench
Nový benchmark, který hodnotí mechanismy založené na paměti ve vědeckém uvažování. Měří, jak modely aktivují "kotvy" (základní vzorce) a "atraktory" (schémata/příklady) během inference – a to přesahuje pouhou kontrolu konečných odpovědí.
Meta právě vydala benchmark MapAnything na Hugging Face
Univerzální hodnocení 3D rekonstrukce napříč vícepohledovými stereo, hloubkovými a kamerovými pozicemi. Benchmarkujte modely s dopředu na různých reálných scénách se standardizovanými metrikami.