🔒Comment pouvons-nous prévenir les dommages causés par des systèmes d'IA qui poursuivent des objectifs non intentionnels ? Le contrôle de l'IA est un agenda de recherche prometteur cherchant à répondre à cette question critique. Aujourd'hui, nous sommes ravis de lancer ControlArena – notre bibliothèque pour réaliser des expériences de contrôle de l'IA sécurisées et reproductibles🧵