今年は500+モデルをテストし、+6千ユーザーでAI製品を出荷しました。 観察: 1. チャットが限界に達している 2. モデル戦争:古いモデルを否定する 3. オープンソースはビルダーにとって良いです 4. 評価はタスクの実行を測定すべきです 5. 文脈は強化推論よりも重要である