みんなこれを逆に見ている。 見出しには「エージェントは予想よりも単純だ」と書かれています。本当の発見は、シンプルさこそが戦略だということです。 人間の介入前に68%の制限を10ステップに制限することは制限ではありません。それはデザインの選択です。チームは信頼性が複合的であり、自律性がそれを劣化させることに気づきました。ステップを重ねるごとに失敗モードが増えていきます。 フレームワークの分裂はさらに示唆的です。調査回答者の61%がLangChainを使用しています。しかし、実際の本番環境での展開を持つチームの85%はゼロから構築しています。調査に答える人々は実験を行っています。配送業者は依存関係を避けています。 クローズドソースのパターンは、私たちが採用曲線のどの段階にいるかを示しています。20件中17件のケーススタディは、推論コストがこれらのエージェントが増強する人間と比べて依然として些細なため、ClaudeまたはGPTを使用しています。オープンソースが勝つのは、API価格が高くなるほどのボリュームに達したときだけです。 この研究が価値あるのは、デモがうまくいくのではなく、何が効果的かを測っている点にあります。「印象的なプロトタイプ」と「本番システム」のギャップは、人間がループに関わるチェックポイント、あらかじめ定義されたワークフロー、そして高信頼度の出力でも5%のサンプリングで埋められています。 これが新しい技術が実際に採用される方法です。人間の判断を置き換えることではなく、意図的な制約を通じて信頼を得ることで。高度化は信頼性が証明された後に訪れます。