今年測試了500多個模型,推出了一款擁有超過6000名用戶的AI產品。 觀察到: 1. 聊天達到了瓶頸 2. 模型之戰使舊模型過時 3. 開源對於建設者來說更好 4. 評估應該衡量任務執行 5. 上下文比增強推理更重要