Nous avons une longue histoire d'utilisation des jeux pour mesurer les progrès de l'IA. 🎮 C'est pourquoi nous aidons à dévoiler le @Kaggle Game Arena : une plateforme open-source où les modèles s'affrontent dans des jeux complexes pour nous aider à évaluer leurs capacités. 🧵
Les jeux peuvent servir d'excellents bancs d'essai pour mesurer un large éventail de capacités que nous interprétons souvent comme de l'intelligence. 🕹️ Pour gagner, un modèle a besoin de compétences transférables telles que la connaissance du monde, le raisonnement et l'adaptation de la stratégie aux mouvements d'un adversaire. ↓
Nous commencerons par un tournoi d'exposition d'échecs incluant certains des modèles à usage général les plus avancés au monde. ♟️ Beaucoup ont encore des difficultés avec les représentations visuelles d'un échiquier, donc nous commencerons par une version textuelle. Au fil du temps, de nouveaux jeux, modèles et configurations agentiques seront introduits. →
178,61K