Meta 的一篇很酷的論文。 以及多代理系統的另一個優秀應用。 (收藏它) 訓練現代 AI 模型需要大量高質量的數據。 然而,瓶頸不僅僅是數量。數據的多樣性不足。單一模型生成的合成數據往往會產生同質化的輸出,重複模式,並缺乏人類創建數據集中的細微變化。 Meta 的這項新研究介紹了 Matrix,一個點對點框架,讓多個 AI 代理通過去中心化的互動共同生成合成訓練數據。 在相同的硬體資源下,Matrix 實現了 2–15 倍更高的數據生成吞吐量,而不影響輸出質量。 TL;DR:不是一個模型生成數據,而是專門的代理扮演不同的角色並相互互動。一個提問,另一個回答,第三個評估質量。這些多輪對話捕捉了複雜的推理和多樣的觀點。 Matrix 的不同之處在於:沒有中央協調者。代理在完全去中心化的架構中直接通信。這使得可擴展性不會受到基礎設施瓶頸的影響。 該框架通過基於角色的對話協議、多輪互動模式以及每個階段內建的質量過濾運作。只有符合質量標準的數據才能進入最終的訓練集。 多代理協作生成的合成數據比單一模型方法更具多樣性。生成的數據集提高了下游模型在推理和遵循指令基準上的性能。