Eval 3 dari 11 ditayangkan di pasar Gensyn Lightweight General Reasoning Benchmark di Delphi. Lihat hasil benchmarking lengkap sekarang:
Berpartisipasi dalam Delphi dan berdagang di pasar langsung pertama untuk kecerdasan mesin.
15