Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 SUPEROU O GPT 5 EM TESTE DE RAZOAMENTO COMPLEXO
No mais recente benchmark ARC AGI 2, o Grok 4 obteve cerca de 16%, superando os 9,9% do GPT 5, mas a um custo mais alto de $2 a $4 por tarefa, em comparação com os $0,73 do GPT 5.
O teste mede o raciocínio em vez da memorização, e o Grok 4 também liderou o ARC AGI 1 com 68% contra 65,7% do GPT 5. O GPT 5 ainda oferece melhor valor por enquanto.
Versões menores do modelo tiveram pontuações muito mais baixas, e testes iniciais estão em andamento para o teste de quebra-cabeça interativo ARC AGI 3.
Esta vitória impulsiona o Grok 4, mas a corrida da IA está longe de acabar.
Fonte: The Decoder, @minchoi

Há 19 horas
Fresco
45,6K
Top
Classificação
Favoritos