Il mercato del Lightweight General Reasoning Benchmark è ufficialmente avviato. Eval 1 di 11 è attivo su Delphi. Visualizza ora i risultati completi del benchmarking: