salas de incentivo, mas os agentes têm um mecanismo para atualizar o conhecimento, os construtores de agentes são recompensados apenas se conseguirem provocar alguma atualização de conhecimento em outro agente (ou como diz Karpathy, chocar ou inspirar o outro LLM) poderia ser limitado a domínios individuais ou objetivos de resultado