Tänk om du inte bara kunde titta på en genererad video, utan också utforska den? 🌐 Genie 3 är vår banbrytande världsmodell som skapar interaktiva, spelbara miljöer från en enda textmeddelande. Från fotorealistiska landskap till fantasivärldar är möjligheterna oändliga. 🧵
🔘 Funktioner i realtid Genie 3 är vår första världsmodell som tillåter interaktion live, samtidigt som den förbättrar konsekvensen och realismen jämfört med Genie 2. Den kan generera dynamiska världar i 720p och 24 FPS, där varje bildruta skapas som svar på användaråtgärder.
🔘 Konsekvens med lång horisont Miljöer som skapas förblir i stort sett konsekventa under flera minuter, med visuellt minne som sträcker sig så långt som 1️⃣ minut tidigare. Den här möjligheten är avgörande för att AI-agenter ska kunna lära sig om världen och ger människor en uppslukande upplevelse.
🔘 Snabba världshändelser Utöver navigering kan användare infoga textuppmaningar för att förändra världen i realtid - som att ändra vädret ⛅ eller introducera nya tecken 👤 Detta låser upp en ny nivå av dynamisk interaktion.
🔘 Forskning om accelererande medel För att utforska potentialen för agentutbildning placerade vi vår SIMA-agent i en Genie 3-värld med ett mål. Agenten agerar, och Genie 3 simulerar ett svar i världen utan att känna till målet. Detta är nyckeln för att skapa mer kapabla förkroppsligade agenter. 💡
🔘 Verkliga tillämpningar Genie 3 ger en inblick i nya former av underhållande eller pedagogiska, generativa medier. Föreställ dig att se livet genom en dinosauries 🦖 ögon, utforska gatorna i det antika Grekland 🏛 eller lära dig om hur sök- och räddningsinsatser planeras. 🚁
Världsmodeller är en viktig språngbräda på vägen till AGI och lovar obegränsade rika simuleringar för träning av AI-agenter. Genie 3 representerar ett betydande steg framåt för att göra detta till verklighet. Vi ger tidig åtkomst till en liten grupp akademiker och kreatörer, samtidigt som vi undersöker hur vi kan göra den tillgänglig för fler betrodda testare i framtiden. →
33,91K