Article intéressant de Meta. Et une autre excellente application des systèmes multi-agents. (enregistrer dans les favoris) Former des modèles d'IA modernes nécessite d'énormes quantités de données de haute qualité. Cependant, le goulot d'étranglement n'est pas seulement la quantité. Les données ne sont tout simplement pas assez diversifiées. Les modèles uniques générant des données synthétiques tendent à produire des sorties homogènes, répétant des motifs et manquant de la variété nuancée que l'on trouve dans les ensembles de données créés par des humains. Cette nouvelle recherche de Meta introduit Matrix, un cadre pair-à-pair où plusieurs agents d'IA génèrent collaborativement des données d'entraînement synthétiques à travers des interactions décentralisées. Matrix atteint un débit de génération de données 2 à 15 fois plus élevé avec des ressources matérielles identiques, sans compromettre la qualité de sortie. TL;DR : Au lieu d'un modèle produisant des données, des agents spécialisés jouent des rôles distincts et interagissent entre eux. L'un pose des questions, un autre répond, un troisième évalue la qualité. Ces conversations multi-tours capturent un raisonnement complexe et des perspectives diverses. Ce qui rend Matrix différent : pas de coordinateur central. Les agents communiquent directement dans une architecture entièrement décentralisée. Cela permet une évolutivité sans goulots d'étranglement d'infrastructure. Le cadre fonctionne à travers des protocoles de conversation basés sur les rôles, des modèles d'interaction multi-tours et un filtrage de qualité intégré à chaque étape. Seules les données répondant aux seuils de qualité intègrent l'ensemble final d'entraînement. La collaboration multi-agents produit des données synthétiques plus diverses que les approches à modèle unique. Les ensembles de données résultants améliorent les performances des modèles en aval sur les benchmarks de raisonnement et de suivi d'instructions.