拋棄傳統神經網路架構?解析 Un-0 如何用「模擬物理振盪器」生成圖像,挑戰千倍節能願景
AI 算力危機日益嚴重,我們還能依賴耗電的 GPU 走到多遠?Unconventional AI 團隊近期開源了全新的 Un-0 圖像生成模型。這項技術跳脫傳統神經網路框架,巧妙運用「耦合振盪器」進行物理運算。這篇文章帶您一探其背後的節拍器原理,以及它如何為未來的硬體節能革命鋪路。
您知道嗎?過去十幾年來,幾乎所有具突破性的 AI 模型,背後都靠著堆積如山的 GPU 在默默燃燒電力。隨著模型越來越龐大,耗電量與冷卻成本已經逼近物理極限。這幾天矽谷的熱門話題,無非是科技巨頭們開始精打細算地限制算力資源。這不禁讓人思考一個非常現實的問題:目前的運算方式真的能永續發展嗎?
就在 2026 年 6 月,Unconventional AI 團隊推出了一個用耦合振盪器生成圖像的模型,名為 Un-0。這聽起來很像大學物理課本裡的東西,對吧?沒錯。這個團隊未來的目標是打造出直接利用物理法則運算的新型電腦,期望未來能減少大約 1,000 倍的能源消耗。這項技術不僅顛覆了現有的硬體思維,更為業界提供了一個極具想像力的解方。
當物理法則變成一台超級電腦
傳統的 AI 運算依賴數位位元 (0 與 1) 來執行龐大的矩陣相乘。Un-0 則代表了一種全新的思維邏輯,也就是將運算任務遷移至「物理運算底層」(Physical Computing Substrate)。簡單來說,就是讓物理系統的自然演化來幫我們算數學。
說實話,這聽起來有點抽象。讓我們用一個非常生活化的比喻來解釋:節拍器。
想像您把幾十個獨立的節拍器放在同一張具有彈性的桌子上。剛開始,每一個節拍器都按照自己的節奏隨意擺動。這叫做「漂移」狀態,大家各做各的,毫無交集。但神奇的事情很快就會發生。因為桌子會傳遞震動,這些節拍器會開始互相影響。根據它們之間的互動強度,系統會自動演化出幾種不同的狀態。如果互動是正向的,它們最終會整齊劃一地進入「同步」擺動。如果互動是負向的,它們則會走向完全相反的「反相同步」狀態。
這正是 Un-0 的運算核心,科學界稱之為「倉本模型」(Kuramoto Oscillators)。
在 Un-0 的世界裡,運算過程其實就是成千上萬個振盪器互相拉扯的過程。每一個振盪器都有自己的瞬時相位角度與固有轉速。研究團隊透過設定一個「耦合矩陣」(Coupling Matrix) 來決定這些振盪器之間要怎麼互相牽引。這個耦合矩陣,就等同於傳統神經網路中需要學習的權重參數。
畫出一張圖的五個神奇步驟
那麼,這堆互相拉扯的節拍器,到底是怎麼畫出一隻貓或是一座火山的?Un-0 的推論過程將物理演化與極輕量的數位解碼完美結合。整個生成過程可以拆解為五個清晰的步驟。
- 從隨機混亂開始 系統一開始,會將所有振盪器的相位設定為一個隨機角度。您可以把這當作是擴散模型裡面的初始雜訊,這就是生成這張圖片的專屬種子。
- 輸入類別條件引導 接著,如果您想畫一座「火山」,系統會加入一組比較小的「條件振盪器」。這些特定條件會產生單向的偏置力,就像是在混亂的節拍器群體中安插了幾個領唱員,引導整個群體朝著火山的特徵去演化。
- 讓物理法則接管一切 放開雙手,讓系統自行運轉。振盪器會根據耦合矩陣開始產生互動。這個過程不需要外部的人工干預,完全依照非線性的物理定律去碰撞、融合、自我組織。
- 拍下決定性的一瞬間 在一個特定的時間點 (例如時間 T=1),系統會為所有振盪器的狀態拍下一張「快照」。這組數據會透過數學轉換,形成一個類似圖像特徵的潛在網格。
- 輕量化解碼渲染 最後一步,需要把這些潛在特徵變成我們肉眼看得懂的像素。這裡會動用到一個非常小型的傳統解碼器。仔細想想,這個解碼器在整體模型參數中佔比連 15% 都不到。它不負責創造內容,只負責把物理層算出來的結果「洗出來」。
等等,這是一台真正的物理電腦嗎?
讀到這裡,很多人可能會問:所以 Unconventional AI 已經造出一台不會發熱的超級物理機器了嗎?
這裡必須做一個非常重要的釐清。Un-0 的終極目標確實是開發專屬的實體晶片,但目前它仍處於軟體模擬階段。為了向世人證明「物理動力系統真的可以生成圖像」,團隊暫時寫了一套軟體程式,並放在傳統的 Nvidia GPU 上進行訓練與模擬。
舉例來說,針對 ImageNet 64x64 解析度的最大型模型 (包含 16,384 個振盪器,約 3 億參數),團隊動用了 8 張 B200 GPU,花費了 640 個小時才訓練完成。目前的效能瓶頸在於,訓練過程中使用的「漂移損失」(Drifting Loss) 函數,仍需要藉助 DINOv2 特徵提取器來評估生成品質,這部分還是得仰賴數位 GPU 的龐大算力。
雖然還沒完全擺脫傳統硬體,但這一步意義非凡。它證明了這套基於物理演化的演算法是完全可行的。一旦演算法確立,未來將這套邏輯燒錄到低功耗的 CMOS 或光學物理晶片上,就不再是遙不可及的科幻小說了。
效能揭秘與意想不到的分工合作
除了節能潛力,大家最關心的肯定還是畫質。Un-0 的表現到底如何?
在嚴格的 ImageNet 64x64 基準測試下,最大型的 Un-0 模型達到了 FID 6.74 的好成績 (FID 數值越低代表品質越好)。這是什麼概念?這個表現已經可以直接媲美早期幾款經典的傳統生成模型,例如 NCSN、DCGAN 或是 BigGAN 剛發表時的水準。雖然目前還追不上最新一代的主流模型,但對於一個剛起步的全新架構來說,無疑是一劑強心針。
有趣的是,團隊在進行系統消融實驗 (Ablation Study) 時,發現了一個非常迷人的科學現象。
他們發現,物理振盪器和那個小巧的傳統解碼器,在系統中扮演著截然不同的角色。物理動態演化分為兩個階段:第一階段是快速分離,不同類型的圖像軌跡會迅速拉開距離。第二階段則是慢速精煉,慢慢形成穩定的特徵。
在這個過程中,物理振盪器負責的是「多樣性」(Recall)。它們透過同步與發散,確保模型能畫出各種不同姿態的貓狗,而不是只會死板地重複同一張圖。相對地,傳統解碼器負責的是「品質」(Precision)。它處理那些低階的空間映射細節,把輪廓修飾得更漂亮。如果不依靠前面的物理振盪器先打好草稿,光靠這個小解碼器是絕對畫不出好東西的。兩者各司其職,形成了一個完美的混血系統。
開源精神引領下一代硬體革命
回顧 AI 發展史,傳統生成模型也是經歷了多年的架構疊代與演算法優化,才達到今天的驚人畫質。Un-0 目前展現出來的實力,僅僅是這條物理運算道路的起點。
為了加速這場革命,Unconventional AI 團隊選擇了一條最開放的路。他們已經在 GitHub 上完整開源了所有的模型權重、訓練腳本以及消融測試程式碼。
如果您剛好是一位對動力系統有興趣的開發者,或者您正在尋找突破當前算力天花板的解藥,這絕對是一個值得關注的專案。當物理定律本身就能直接拿來算數學時,AI 推論將不再受到傳統架構的功耗束縛。這場追求千倍節能的硬體革命才剛揭開序幕,而 Un-0 已經為我們指明了方向。
問與答
Q1:Un-0 模型與傳統的 AI 生成模型在核心運作原理上有何根本差異? A1: 傳統 AI 模型主要依賴數位硬體(如 GPU)執行龐大的矩陣相乘運算,而 Un-0 則揚棄了傳統神經網路架構,轉而採用「模擬耦合振盪器系統」(Kuramoto oscillators)作為運算核心。它的運算過程如同成千上萬個互相連結的節拍器,透過物理動力學的自然演化與互相牽引,最終自我組織並收斂出圖像的潛在特徵。
Q2:Un-0 已經是一台不需要依賴 GPU、不會發熱的「物理電腦」了嗎? A2: 目前還不是。雖然 Unconventional AI 團隊的終極願景是將這套演算法部署在專屬的物理底層硬體上,以期未來能減少約 1,000 倍的能源消耗,但現階段的 Un-0 仍是寫成軟體程式,並在傳統的 GPU 上進行訓練與模擬。例如,其最大型的 ImageNet 64x64 模型便是在 8 張 B200 GPU 上,消耗了 640 個運算小時才訓練完成。
Q3:在生成圖像時,物理振盪器與傳統解碼器是如何分工合作的? A3: 根據研究團隊的消融實驗(Ablation Study)發現,這兩者在系統中扮演著截然不同的角色。物理動態演化(振盪器)主要負責圖像的「多樣性(Recall)」,確保模型能生成不同姿態的變化;而傳統解碼器(參數佔比不到 15%)則專注於提升「圖像品質(Precision)」,將物理層算出的特徵渲染成清晰的像素。若沒有物理振盪器先打好基礎,單靠解碼器是無法產出高品質圖像的。
Q4:Un-0 目前的生成畫質表現如何?能和現在的主流模型競爭嗎? A4: 在嚴格的 ImageNet 64x64 基準測試下,最大型的 Un-0 模型取得了 FID 6.74 的成績。雖然這項數據尚無法匹敵當今最先進的主流生成模型(如 EDM),但其表現已經達到並媲美早期幾款經典生成模型(如 NCSN、DCGAN-TTUR、BigGAN 等)剛發表時的水準。對於一個全新的架構而言,這證明了物理動力系統生成圖像的潛力。
Q5:開發者或研究人員如果想深入研究這項技術,可以取得相關資源嗎? A5: 可以的。為了加速物理運算與硬體節能革命的發展,Unconventional AI 團隊已經在 GitHub 上全面開源了該專案。開發者可以自由取得包含 CIFAR-10 與 ImageNet 64x64 的模型權重、重現訓練結果的腳本,以及完整的消融測試程式碼,讓任何人都能在自己的環境中測試這套物理動力系統。



