AI 日報: AI 造世主登場?Project Genie 讓你創造無限世界,Grok 影片 API 強勢來襲
本週 AI 圈大事不斷,Google DeepMind 推出能創造無限互動世界的 Project Genie,讓使用者體驗如同造世主般的樂趣;xAI 則開放了強大的 Grok Imagine 影片生成 API,要在視覺生成領域佔有一席之地。另一方面,OpenAI 宣布將於二月停用 GPT-4o 等舊模型,全力轉向更具個性化的新一代系統,而 Google Maps 的導航功能現在也能用 Gemini 像朋友般聊著天走路了。 Google DeepMind Project Genie:每個人都能創造世界 想像一下,如果不只是玩遊戲,而是能隨手「畫」出一個能互動的世界,那會是什麼感覺?Google DeepMind 最近發布的 Project Genie 正是這樣一個令人興奮的實驗性計畫。這不單單是一個遊戲生成器,更是一個通用的「世界模型」。 這背後運作的核心是 Genie 3 引擎。與傳統那些靜態的 3D 場景不同,Genie 是即時生成的。這意味著當你在這個虛擬世界中移動或互動時,系統會即時預測並產生接下來的路徑和物理反應。這聽起來是不是有點科幻?透過這個 Project Genie 實驗性原型,美國的 Google AI Ultra 訂閱用戶現在可以親自嘗試創造、探索,甚至「混音」不同的世界。 它具備三大核心能力: 世界素描 (World Sketching): 這就像是給你的想像力裝上了翅膀。你可以透過文字提示,或者上傳圖片來創建一個不斷擴展的環境。想要一個充滿飛龍的奇幻大陸,還是一個賽博龐克的未來都市?只需簡單描述,系統就會為你生成。更酷的是,搭配 Nano Banana Pro 功能,你還能在進入這個世界前,微調視角和細節。 世界探索 (World Exploration): 這裡的世界不是死的背景板。當你操控角色移動時,Genie 會根據你的動作即時運算前方會發生什麼,彷彿路是在你腳下長出來的。 世界混音 (World Remixing): 這是最有趣的部分。如果你看到別人創造的世界很有趣,你可以直接在這個基礎上進行「二創」,用新的提示詞去改變它的風格或規則,甚至在畫廊中尋找靈感。 如果你對這個技術感興趣,可以到 Google Labs 或是 DeepMind 的展示頁面 看看更多範例。雖然目前的生成長度限制在 60 秒,且物理反應偶爾會不自然,但這確實展示了 AI 理解真實世界物理運作的一大步。


