如果你不仅可以观看生成的视频,还可以探索它呢?🌐 Genie 3 是我们开创性的世界模型,它可以从单一的文本提示中创建互动、可玩环境。 从逼真的风景到幻想领域,可能性是无穷无尽的。🧵
🔘 实时功能 Genie 3 是我们第一个允许实时交互的世界模型,同时在一致性和真实感方面相较于 Genie 2 有所提升。它可以以 720p 和 24 FPS 的速度生成动态世界,每一帧都是根据用户的操作生成的。
🔘 长期一致性 创建的环境在几分钟内保持基本一致,视觉记忆可以延伸到过去的 1️⃣ 分钟。 这种能力对于使 AI 代理了解世界至关重要,并为人类提供沉浸式体验。
🔘 可提示的世界事件 除了导航,用户可以插入文本提示以实时改变世界——例如改变天气 ⛅ 或引入新角色 👤 这开启了动态互动的新层次。
🔘 加速代理研究 为了探索代理训练的潜力,我们将我们的SIMA代理放置在一个Genie 3世界中,并设定了一个目标。代理进行操作,而Genie 3在不知道目标的情况下模拟世界中的响应。这对于构建更强大的具身代理至关重要。💡
🔘 现实世界的应用 Genie 3 提供了对新形式的娱乐或教育生成媒体的展望。 想象一下,通过一只恐龙的眼睛 🦖 看到古希腊的街道 🏛,或者了解搜索和救援工作是如何计划的。🚁
世界模型是通往AGI的重要基石,为训练AI代理提供了无限丰富的模拟。Genie 3在实现这一目标上代表了一个重要的飞跃。 我们正在为一小部分学者和创作者提供早期访问,同时探索如何在未来向更多可信的测试者开放。→
34K