E se potessi non solo guardare un video generato, ma esplorarlo anche? 🌐 Genie 3 è il nostro modello di mondo innovativo che crea ambienti interattivi e giocabili a partire da un singolo prompt testuale. Da paesaggi fotorealistici a regni fantastici, le possibilità sono infinite. 🧵
🔘 Capacità in tempo reale Genie 3 è il nostro primo modello mondiale che consente interazioni dal vivo, migliorando al contempo la coerenza e il realismo rispetto a Genie 2. Può generare mondi dinamici a 720p e 24 FPS, con ogni fotogramma creato in risposta alle azioni dell'utente.
🔘 Coerenza a lungo termine Gli ambienti creati rimangono per lo più coerenti per diversi minuti, con la memoria visiva che si estende fino a 1️⃣ minuto nel passato. Questa abilità è fondamentale per consentire agli agenti AI di apprendere sul mondo e offre agli esseri umani un'esperienza immersiva.
🔘 Eventi mondiali modificabili Oltre alla navigazione, gli utenti possono inserire prompt testuali per alterare il mondo in tempo reale - come cambiare il meteo ⛅ o introdurre nuovi personaggi 👤 Questo sblocca un nuovo livello di interazione dinamica.
🔘 Accelerare la ricerca sugli agenti Per esplorare il potenziale per l'addestramento degli agenti, abbiamo posizionato il nostro agente SIMA in un mondo Genie 3 con un obiettivo. L'agente agisce e Genie 3 simula una risposta nel mondo senza conoscere l'obiettivo. Questo è fondamentale per costruire agenti incarnati più capaci.💡
🔘 Applicazioni nel mondo reale Genie 3 offre uno sguardo su nuove forme di media generativi divertenti o educativi. Immagina di vedere la vita attraverso gli occhi di un dinosauro 🦖 che esplora le strade dell'antica Grecia 🏛 o di apprendere come vengono pianificati gli sforzi di ricerca e soccorso. 🚁
I modelli del mondo sono un passo fondamentale verso l'AGI, promettendo simulazioni ricche e illimitate per l'addestramento degli agenti AI. Genie 3 rappresenta un significativo passo avanti per rendere tutto ciò una realtà. Stiamo fornendo accesso anticipato a un piccolo gruppo di accademici e creatori, mentre esploriamo come possiamo renderlo disponibile a più tester fidati in futuro. →
33,87K