Recapitulação do Evento de Pré-visualização do ARC-AGI-3 @GregKamradt apresenta nossa tese sobre o Benchmark de Raciocínio Interativo * Por que benchmarks estáticos não são suficientes para medir capacidades agentivas * A abordagem do Prêmio ARC para criar benchmarks interativos
20,34K