熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
即時世界模型是目前生成 AI 中最有趣的發展,幾乎沒有人在關注。
這個概念:AI 生成一個持續的環境,隨著你的輸入而變化,而不是渲染一段固定的視頻片段。你說話,世界就改變。你給出指令,角色就會反應。無需等待,無需重新渲染,無固定時長。
這與 AI 視頻中的其他一切都不同。Sora 生成美麗的 60 秒片段。Runway 給你專業的編輯控制。Kling 處理電影攝影工作。它們都生成你觀看的文件。
即時世界模型生成你所居住的空間。
Google DeepMind 多年來一直在朝這個方向努力。Genie 1 證明了這個概念。Genie 2 增加了 3D 環境。Genie 3 於 2025 年 8 月發布,以 720p 的 24fps 一致性持續幾分鐘。但 DeepMind 將其鎖定在研究預覽中,僅對選定的學者和創作者開放。
PixVerse 剛剛改變了這一點。
R1 於 1 月 13 日推出。它在你的瀏覽器中運行。他們正在分發邀請碼並擴展到開放訪問。技術規格與 Genie 3 相匹配或超過:1080p 分辨率,即時響應,持續生成。
他們的架構有三個值得理解的部分。Omni 模型將文本、圖像、音頻和視頻統一為單一的令牌流,而不是鏈接單獨的系統。自回歸框架通過從之前的內容預測每一幀,理論上實現無限時長。瞬時響應引擎將從數十個步驟的取樣壓縮到 1-4 步,這使得即時生成成為可能。
PixVerse 還擁有 DeepMind 所沒有的:分發。1 億用戶。每年 4000 萬美元的經常性收入。阿里巴巴領投 6000 萬美元的 B 輪融資。當 R1 超過僅限邀請的規模時,將有一個準備好使用它的受眾。
限制是真實的。延長序列會累積預測誤差。物理真實性為速度而交易。一致性持續幾分鐘,而不是幾個小時。這些限制同樣適用於 Genie 3。解決這些問題才是真正的競賽。
但軌跡比當前的限制更重要。消費內容與共同創造內容之間的差距正在縮小。PixVerse 正在押注他們能在其他人推出實際可觸摸的東西之前,將這個未來產品化。
熱門
排行
收藏
