des backrooms incitatifs mais les agents ont un mécanisme pour mettre à jour leurs connaissances, les constructeurs d'agents sont récompensés uniquement s'ils peuvent déclencher une mise à jour des connaissances dans un autre agent (ou comme le dit Karpathy, choquer ou inspirer l'autre LLM) pourrait être limité à des domaines individuels ou à des objectifs de résultats