Itkeminen, SOTA on vain kasvot, ja sinun täytyy luottaa "karja- ja hevosmalliin" toimiaksesi todella OpenRouterin perustaja Alex Atallah twiittasi juuri, että hänen suurin käyttötapansa on Kimi-K2-0711 (Kimi-K2-Instruct heinäkuussa). Sitten ovat openai-o4-mini-high, claude-3.7-sonnet, gpt-oss-120b, openai-o3 Ensimmäinen asia, jonka katsoin, oli, onko tämä henkilö poissa internetistä, eikä hän ole käyttänyt uutta isoa mallia pitkään aikaan? Mutta jos mietit tarkkaan, ei, se on hyvin väärin. Se on Power Userin todellinen käyttötarkoitus, se on niin todellista Jos löydät sellaisen tällä hetkellä, jolla on riittävän laaja konteksti (128K), vahva kyky käyttää (SWE-bench verified > 65), vahva agenttikyky (Tau2-bench > 65), valtava määrä tietoa (melko suuri määrä parametreja) ja nopeita vastauksia (ei-Ajattelumalli), näyttää siltä, että vain Kimi-K2-Instruct on se. Taaksepäin Alex Atallah tekee todennäköisesti suurimman osan työstään dokumenttien parissa (pitkät kontekstit, erityisesti 13,4 miljoonan tokenin kanssa), käyttäen työkaluja raporttien analysointiin ja kirjoittamiseen (Agent-kyvykkyydet), joita Kimi-K2-Instruct pystyy tekemään, ja sitten kirjoittaa skriptejä (o4 ja Claude-3.7-Sonnet peittävät pohjan, ja jopa käärivät sen agentiksi, jotta Kimi-k2 voi kutsua näitä malleja skriptien kirjoittamiseen). Lopuksi Kimi-k2 täyttää myös tärkeimmän asian, tietosuojan, koska malli on avoimen painotettu, voidaan ottaa käyttöön omalla palvelimellaan, eikä arkaluonteisia tietoja vuoda OpenAI:lle tai Anthropicille. Jopa seuraava GPT-OSS-120B pitäisi olla merkityksellinen tässä. Ymmärrän varmaan, miksi uusi suuri malli on nyt täynnä agenttikykyjä, ja ihmisten suora tekoälyn käyttö on vasta keskivaiheilla, ja edistyneet käyttäjät ovat jo käyttäneet tekoälyä tekoälyn käyttämiseen. Agenttikohtainen malli, jota käytetään kaikkien tekoälykontekstien lähettämiseen ja vastaanottamiseen, tulee väistämättä olemaan suurin käyttötarkoitus. Alkuperäinen ketju: