生成されたビデオを見るだけでなく、探索もできたらどうなるでしょうか?🌐 Genie 3 は、単一のテキスト プロンプトからインタラクティブでプレイ可能な環境を作成する画期的なワールド モデルです。 フォトリアリスティックな風景からファンタジーの世界まで、可能性は無限大です。🧵
🔘 リアルタイム機能 Genie 3 は、Genie 2 と比較して一貫性とリアリズムを向上させながら、ライブ インタラクションを可能にする最初のワールド モデルです。720p と 24 FPS でダイナミックな世界を生成でき、各フレームはユーザーのアクションに応じて作成されます。
🔘 長期にわたる一貫性 作成された環境は、数分間にわたってほぼ一貫しており、視覚記憶は過去の ⃣ 分まで1️拡張されます。 この機能は、AI エージェントが世界について学習できるようにするために重要であり、人間に没入型のエクスペリエンスを提供します。
🔘 迅速な世界イベント ナビゲーション以外にも、ユーザーはテキスト プロンプトを挿入して、天気⛅の変更や新しいキャラクター👤の紹介など、リアルタイムで世界を変えることができます これにより、新しいレベルの動的なインタラクションが解き放たれます。
🔘 薬剤研究の加速 エージェントトレーニングの可能性を探るために、私たちは目標を持ってSIMAエージェントをGenie 3の世界に配置しました。エージェントが行動し、Genie 3 は目的を知らずに世界の応答をシミュレートします。これは、より有能な具現化されたエージェントを構築するための鍵です。 💡
🔘 実際のアプリケーション Genie 3 は、新しい形のエンターテイメントまたは教育的なジェネレーティブ メディアを垣間見ることができます。 恐竜🦖の目を通して人生を見たり、古代ギリシャ🏛の街路を探索したり、捜索救助活動がどのように計画されているかを学んだりすることを想像してみてください。🚁
ワールド モデルは AGI への道のりにおける重要な足がかりであり、AI エージェントをトレーニングするための無制限の豊富なシミュレーションを約束します。Genie 3 は、これを実現するための大きな進歩を表しています。 私たちは、少数の学者やクリエイターに早期アクセスを提供すると同時に、将来的にはより信頼できるテスターが利用できるようにする方法を模索しています。→
34K