熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
⭐️ π₀-FAST 現在在 LeRobot 中 ⭐️
我很高興能分享我在 @LeRobotHF 的最新工作:將 π₀-FAST 完全整合到堆疊中。
原始的 Pi-FAST 實現僅在 JAX 中可用,因此我們在 PyTorch 中重建了它,從 π₀ 開始,包括交叉熵損失目標、FAST 令牌化方案,以及 KV 緩存等推理優化。
π₀-FAST 是迄今為止最先進的自回歸視覺-語言-行動模型,由 @physical_int 提供。它包括一個內建的行動令牌器 FAST,將連續行動轉換為離散令牌(如 JPEG 壓縮)。
這意味著 π₀-FAST 可以使用 LLM 風格的下一個令牌預測進行訓練。
一旦所有內容都是令牌,社區將開啟許多機會:
> 輕鬆地在數據集、實現,甚至新的令牌類型(邊界框、語言、本體感知;這都是令牌)上使用下一個令牌目標預訓練 π₀-FAST。請注意,下一個令牌預測的訓練速度約為擴散或流匹配的 5 倍。
> 重用相同的權重,並在您的目標任務上使用流匹配目標進行微調,以加快推理速度。
您還可以使用 `lerobot-train-tokenizer` 命令在任何 LeRobot 數據集上訓練自己的 FAST 令牌器。太酷了。
在系統方面,我們在推理中添加了 LLM 風格的 KV 緩存,為自回歸解碼提供了約 5 倍的加速。
我們在 LIBERO 上進行了評估,並在 40k 步時達到了 82.5% 的成功率(比去年首次移植時的約 40% 有所提升)。
這為混合 AR + 流匹配食譜和 π₀.₅ 風格的知識隔離在 LeRobot 中奠定了基礎。
👉 文檔:
🤖 Pi0Fast 基礎檢查點:
熱門
排行
收藏
