トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
私の見解では、SWE-bench と T-bench は、モデルがどれだけ進歩したかという点で良いシグナルを持つ数少ないベンチマークです。このモデルは Qwen3 Coder と同等のパフォーマンスを発揮し、GPT-5 よりも 10% しか劣らず、コードに特化したものではなく汎用 LLM でもあります。

8月11日 11:43
GLM-4.5テクニカルレポートを発表! 👇
この研究は、独自の多段階トレーニング パラダイムを通じて、推論、コーディング、エージェント タスクに優れたモデルをどのように開発したかを示しています。
主なイノベーションには、機能を統合するための自己蒸留によるエキスパート モデルの反復、動的な問題解決のためのハイブリッド推論モード、難易度ベースの強化学習カリキュラムなどがあります。

28.15K
トップ
ランキング
お気に入り