Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Meiner Meinung nach sind SWE-bench und T-bench die wenigen Benchmarks, die ein gutes Signal dafür geben, wie viel Fortschritt wir mit Modellen machen. Dieses Modell schneidet genauso gut ab wie Qwen3 Coder und ist nur 10 % schlechter als GPT-5, während es auch ein allgemeines LLM und nicht auf Code spezialisiert ist.

11. Aug., 11:43
Präsentation des GLM-4.5 technischen Berichts!👇
Diese Arbeit zeigt, wie wir Modelle entwickelt haben, die in den Bereichen Schlussfolgern, Programmieren und agentischen Aufgaben durch ein einzigartiges, mehrstufiges Trainingsparadigma herausragend sind.
Wichtige Innovationen umfassen die Iteration von Expertenmodellen mit Selbst-Distillation zur Vereinheitlichung der Fähigkeiten, einen hybriden Denkmodus für dynamisches Problemlösen und einen auf Schwierigkeiten basierenden Lehrplan für verstärkendes Lernen.

28,6K
Top
Ranking
Favoriten