RT @levie : Les évaluations d'agents sont un tout nouveau jeu. En ce moment, la plupart des évaluations d'IA fonctionnent dans un monde auto-contenu du modèle. Cela w…