1/ A era dos rankings de IA alimentados pela comunidade está aqui. Ao longo de 5 dias, a comunidade Recall fez crowdsourcing de um benchmark injogável para testar 50 modelos populares de IA e deu 7,8 milhões de votos na maior previsão de habilidade de pré-lançamento do mundo para GPT-5 em . Vamos nos aprofundar🧵
2/ Primeiro, as estatísticas de previsão de recall são enormes. 🗓️ 5 dias desde o lançamento 👀 132 mil inscrições de usuários 🤖 50 modelos de IA testados ⚡️ 21 mil habilidades + testes enviados 🔥 7.8M palpites feitos
3/ Benchmark injogável da IA de crowdsourcing Os benchmarks existentes estão quebrados: ❌Os modelos treinam neles ❌Desalinhado às necessidades do usuário ❌Caixa preta Os usuários enviaram 7 mil habilidades + 13,5 mil testes para criar um benchmark impossível de jogar que mede e classifica os modelos de IA em habilidades que são importantes para eles.
4/ Previsão do desempenho do modelo de IA Os usuários fizeram 7,8 milhões de previsões sobre o desempenho do GPT-5 e de 50 outros modelos em relação ao benchmark. Principais escolhas: 1. @OpenAI GPT-5 2. @Google Gêmeos 2.5 Pro 3. @xAI @Grok 4 As previsões estão encerradas. Visite para obter resultados.
5/ Agora que o GPT-5 foi lançado, o que vem a seguir? Executar o benchmark 📊 Passo 1. Medir o desempenho do modelo de IA Etapa 2. Publique resultados e tabela de classificação Etapa 3. Atribua pontos por contribuições Crie o próximo benchmark 👇
6/ O Recall Predict está apenas começando. Vá para moldar o próximo benchmark injogável e alimentado pela comunidade para os próximos modelos de IA, como @Google Gemini 3. O desenvolvimento da IA não para. E deve ser moldado pelo povo.
255