Điều gì sẽ xảy ra nếu bạn không chỉ có thể xem một video được tạo ra, mà còn có thể khám phá nó nữa? 🌐 Genie 3 là mô hình thế giới đột phá của chúng tôi, tạo ra các môi trường tương tác, có thể chơi được từ một lời nhắc văn bản duy nhất. Từ những cảnh quan chân thực đến các vương quốc huyền bí, khả năng là vô tận. 🧵
🔘 Khả năng tương tác thời gian thực Genie 3 là mô hình thế giới đầu tiên của chúng tôi cho phép tương tác trực tiếp, đồng thời cải thiện tính nhất quán và thực tế so với Genie 2. Nó có thể tạo ra các thế giới động ở độ phân giải 720p và 24 FPS, với mỗi khung hình được tạo ra để phản hồi các hành động của người dùng.
🔘 Tính nhất quán dài hạn Các môi trường được tạo ra vẫn giữ được tính nhất quán trong suốt vài phút, với trí nhớ hình ảnh kéo dài đến 1️⃣ phút trong quá khứ. Khả năng này rất quan trọng để cho phép các tác nhân AI học hỏi về thế giới, và mang đến cho con người một trải nghiệm sống động.
🔘 Sự kiện thế giới có thể điều chỉnh Ngoài việc điều hướng, người dùng có thể chèn các lời nhắc văn bản để thay đổi thế giới theo thời gian thực - như thay đổi thời tiết ⛅ hoặc giới thiệu các nhân vật mới 👤 Điều này mở ra một cấp độ tương tác động mới.
🔘 Tăng tốc nghiên cứu tác nhân Để khám phá tiềm năng cho việc đào tạo tác nhân, chúng tôi đã đặt tác nhân SIMA của mình vào một thế giới Genie 3 với một mục tiêu. Tác nhân hành động, và Genie 3 mô phỏng một phản ứng trong thế giới mà không biết mục tiêu. Điều này rất quan trọng để xây dựng những tác nhân thể hiện có khả năng hơn.💡
🔘 Ứng dụng trong thế giới thực Genie 3 mang đến cái nhìn về những hình thức truyền thông sáng tạo mới có tính giải trí hoặc giáo dục. Hãy tưởng tượng việc nhìn cuộc sống qua đôi mắt của một con khủng long 🦖 khám phá các con phố của Hy Lạp cổ đại 🏛 hoặc tìm hiểu về cách mà các nỗ lực tìm kiếm và cứu hộ được lên kế hoạch. 🚁
Các mô hình thế giới là một bước đệm quan trọng trên con đường đến AGI, hứa hẹn những mô phỏng phong phú không giới hạn để đào tạo các tác nhân AI. Genie 3 đại diện cho một bước tiến đáng kể trong việc biến điều này thành hiện thực. Chúng tôi đang cung cấp quyền truy cập sớm cho một nhóm nhỏ các học giả và người sáng tạo, trong khi khám phá cách chúng tôi có thể làm cho nó có sẵn cho nhiều người thử nghiệm đáng tin cậy hơn trong tương lai. →
33,92K