私の見解では、SWE-bench と T-bench は、モデルがどれだけ進歩したかという点で良いシグナルを持つ数少ないベンチマークです。このモデルは Qwen3 Coder と同等のパフォーマンスを発揮し、GPT-5 よりも 10% しか劣らず、コードに特化したものではなく汎用 LLM でもあります。
Z.ai
Z.ai8月11日 11:43
GLM-4.5テクニカルレポートを発表! 👇 この研究は、独自の多段階トレーニング パラダイムを通じて、推論、コーディング、エージェント タスクに優れたモデルをどのように開発したかを示しています。 主なイノベーションには、機能を統合するための自己蒸留によるエキスパート モデルの反復、動的な問題解決のためのハイブリッド推論モード、難易度ベースの強化学習カリキュラムなどがあります。
28.15K