PMPP-Eval Uppdatering! Opon release av K2-Thinking, jag har utvärderat den och några andra modeller som efterfrågades såsom R1 och Qwen3 235B över pmpp-eval kodning delmängd. K2-Thinking är nu den bästa öppna modellen som finns, enligt resultat som överträffar sonett 4.5 för cudauppgifter.