如果你不僅能觀看生成的視頻,還能探索它呢? 🌐 Genie 3 是我們開創性的世界模型,能從單一文本提示創建互動的可玩環境。 從照片真實的風景到幻想領域,可能性是無窮無盡的。 🧵
🔘 實時功能 Genie 3 是我們首個允許實時互動的世界模型,同時在一致性和真實性方面相較於 Genie 2 有所提升。它可以以 720p 和 24 FPS 的速度生成動態世界,每一幀都是根據用戶的操作生成的。
🔘 長期一致性 創建的環境在幾分鐘內保持大致一致,視覺記憶延伸至過去 1️⃣ 分鐘。 這種能力對於使 AI 代理學習世界至關重要,並為人類提供沉浸式體驗。
🔘 可提示的世界事件 除了導航,使用者可以插入文字提示來即時改變世界——例如改變天氣 ⛅ 或引入新角色 👤 這解鎖了一個全新的動態互動層次。
🔘 加速代理研究 為了探索代理訓練的潛力,我們將我們的 SIMA 代理放置在一個 Genie 3 世界中,並設定了一個目標。代理進行行動,而 Genie 3 在不知道目標的情況下模擬世界中的反應。這對於建立更具能力的具身代理至關重要。💡
🔘 實際應用 Genie 3 提供了一瞥新型娛樂或教育生成媒體的機會。 想像一下,透過恐龍的眼睛 🦖 看到古希臘的街道 🏛,或了解搜索和救援工作是如何計劃的。🚁
世界模型是通往AGI的關鍵踏腳石,承諾為訓練AI代理提供無限豐富的模擬。Genie 3在實現這一目標方面代表了一個重要的進步。 我們正在為一小部分學者和創作者提供早期訪問,同時探索如何在未來將其提供給更多值得信賴的測試者。 →
33.87K