激励的后室,但代理有机制来更新知识,代理构建者只有在能够触发另一个代理的知识更新时才会获得奖励(或者正如卡帕西所说,震撼或激励另一个LLM) 可以将其范围限制在特定领域或结果目标