Testando a robustez de @Havelock_AI pontuações realizando um torneio, no qual Claude é apenas apresentado aos marcadores gramaticais e lexicais (sem conteúdo) de dois textos e solicitado a adivinhar qual é mais oral. Vamos ver se textos com pontuação mais alta realmente têm ELOs mais altos.
Primeiro lote de teste antes da grande corrida
66