$A^3$-Bench
Ett nytt riktmärke som utvärderar minnesdrivna mekanismer i vetenskapligt resonemang. Den mäter hur modeller aktiverar "ankare" (kärnformler) och "attraktorer" (scheman/exempel) under inferensen—och går bortom att bara kontrollera slutgiltiga svar.
Meta har precis släppt MapAnything-benchmarken på Hugging Face
Universell 3D-rekonstruktionsutvärdering över multi-view stereo-, djup- och kameraposeuppgifter. Benchmarka feedforward-modeller på olika verkliga miljöer med standardiserade mätvärden.