一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

⭐️ π₀-FAST 現在在 LeRobot 中 ⭐️ 我很高興能分享我在 @LeRobotHF 的最新工作：將 π₀-FAST 完全整合到堆疊中。原始的 Pi-FAST 實現僅在 JAX 中可用，因此我們在 PyTorch 中重建了它，從 π₀ 開始，包括交叉熵損失目標、FAST 令牌化方案，以及 KV 緩存等推理優化。 π₀-FAST 是迄今為止最先進的自回歸視覺-語言-行動模型，由 @physical_int 提供。它包括一個內建的行動令牌器 FAST，將連續行動轉換為離散令牌（如 JPEG 壓縮）。這意味著 π₀-FAST 可以使用 LLM 風格的下一個令牌預測進行訓練。一旦所有內容都是令牌，社區將開啟許多機會： > 輕鬆地在數據集、實現，甚至新的令牌類型（邊界框、語言、本體感知；這都是令牌）上使用下一個令牌目標預訓練 π₀-FAST。請注意，下一個令牌預測的訓練速度約為擴散或流匹配的 5 倍。 > 重用相同的權重，並在您的目標任務上使用流匹配目標進行微調，以加快推理速度。您還可以使用 `lerobot-train-tokenizer` 命令在任何 LeRobot 數據集上訓練自己的 FAST 令牌器。太酷了。在系統方面，我們在推理中添加了 LLM 風格的 KV 緩存，為自回歸解碼提供了約 5 倍的加速。我們在 LIBERO 上進行了評估，並在 40k 步時達到了 82.5% 的成功率（比去年首次移植時的約 40% 有所提升）。這為混合 AR + 流匹配食譜和 π₀.₅ 風格的知識隔離在 LeRobot 中奠定了基礎。 👉 文檔： 🤖 Pi0Fast 基礎檢查點：