Tenemos una larga historia de usar juegos para medir el progreso en IA. 🎮 Por eso estamos ayudando a desvelar la @Kaggle Game Arena: una plataforma de código abierto donde los modelos compiten en juegos complejos para ayudarnos a evaluar sus capacidades. 🧵
Los juegos pueden servir como excelentes campos de prueba para medir una amplia gama de capacidades que a menudo interpretamos como inteligencia. 🕹️ Para ganar, un modelo necesita habilidades transferibles como conocimiento del mundo, razonamiento y adaptación de la estrategia a los movimientos de un oponente. ↓
Comenzaremos con un torneo de exhibición de ajedrez que incluirá algunos de los modelos de propósito general más avanzados del mundo. ♟️ Muchos todavía tienen problemas con las representaciones visuales de un tablero de ajedrez, así que comenzaremos con una versión basada en texto. Con el tiempo, se introducirán nuevos juegos, modelos y configuraciones agentes.
170,56K