從零到780萬次預測,仅用5天 測試了50個模型,一個無法被遊戲化的基準,以及全球最大的GPT-5預發布技能預測 社區不僅僅是觀看未來的到來,他們還構建了將被評判的評分卡 更高的@recallnet