Cerebras har demonstrert sin evne til å være vert for store MoEs med svært høye hastigheter denne uken, og lanserte Qwen3 235B 2507 og Qwen3 Coder 480B-endepunkter ved >1,500 utgangstokens/s ➤ @CerebrasSystems tilbyr nå endepunkter for både Qwen3 235B 2507 Resonnement og Ikke-resonnement. Begge modellene har 235B totale parametere med 22B aktive. ➤ Qwen 3 235B 2507 Reasoning tilbyr intelligens som kan sammenlignes med o4-mini (høy) og DeepSeek R1 0528. Den ikke-resonnerende varianten tilbyr intelligens som kan sammenlignes med Kimi K2 og godt over GPT-4.1 og Llama 4 Maverick. ➤ Qwen3 Coder 480B har 480B totale parametere med 35B aktive. Denne modellen er spesielt sterk for agentkoding og kan brukes i en rekke kodeagentverktøy, inkludert Qwen3-Coder CLI. Cerebras' lanseringer representerer første gang dette intelligensnivået har vært tilgjengelig med disse utgangshastighetene og har potensial til å låse opp nye brukstilfeller - som å bruke en resonnementmodell for hvert trinn i en agent uten å måtte vente i minutter.
25,02K