Interesante artículo de Meta. Y otra excelente aplicación de sistemas multi-agente. (guárdalo en marcadores) Entrenar modelos de IA modernos requiere grandes cantidades de datos de alta calidad. Sin embargo, el cuello de botella no es solo la cantidad. Los datos simplemente no son lo suficientemente diversos. Los modelos únicos que generan datos sintéticos tienden a producir salidas homogéneas, repitiendo patrones y careciendo de la variedad matizada que se encuentra en los conjuntos de datos creados por humanos. Esta nueva investigación de Meta presenta Matrix, un marco de trabajo peer-to-peer donde múltiples agentes de IA generan colaborativamente datos sintéticos de entrenamiento a través de interacciones descentralizadas. Matrix logra un rendimiento de generación de datos de 2 a 15 veces mayor con recursos de hardware idénticos, sin comprometer la calidad de salida. Resumen: En lugar de que un modelo produzca datos, agentes especializados desempeñan roles distintos e interactúan entre sí. Uno hace preguntas, otro responde, un tercero evalúa la calidad. Estas conversaciones de múltiples turnos capturan razonamientos complejos y perspectivas diversas. Lo que hace diferente a Matrix: no hay un coordinador central. Los agentes se comunican directamente en una arquitectura completamente descentralizada. Esto permite la escalabilidad sin cuellos de botella en la infraestructura. El marco opera a través de protocolos de conversación basados en roles, patrones de interacción de múltiples turnos y filtrado de calidad incorporado en cada etapa. Solo los datos que cumplen con los umbrales de calidad entran en el conjunto de entrenamiento final. La colaboración multi-agente produce datos sintéticos más diversos que los enfoques de modelo único. Los conjuntos de datos resultantes mejoran el rendimiento del modelo en las pruebas de razonamiento y seguimiento de instrucciones.