RT @levie: Agent evals jsou zcela novou hrou. V současné době většina hodnocení umělé inteligence funguje v samostatném světě modelu. Tento w...