pero los agentes tienen un mecanismo para actualizar el conocimiento, los constructores de agentes son recompensados solo si pueden desencadenar alguna actualización de conocimiento en otro agente (o como dice karpathy, sorprender o inspirar al otro LLM) podría abarcarlo a dominios individuales u objetivos de resultados