news

AI 日報: SpaceX 收購 xAI,OpenAI 推桌面指揮中心

February 3, 2026
Updated Feb 3
1 min read

在這個充滿驚奇的科技圈,每天早上醒來似乎都有新的大事發生。如果說以前我們還在討論 AI 如何聊天,那麼現在的焦點已經轉移到了 AI 如何「接管」工作,甚至是如何飛向太空。

今天的內容非常豐富,不僅有 SpaceX 與 xAI 的重磅合併,OpenAI 也推出了全新的開發者工具,甚至 Google 都在教 AI 怎麼在撲克桌上騙人。讓我們來看看這些正在改變未來的技術進展。

1. 為了算力飛向太空?SpaceX 正式收購 xAI

這可能是近期最瘋狂也最合乎邏輯的消息了。SpaceX 宣布正式收購 xAI,這不僅僅是一次商業併購,更像是馬斯克對於未來人類文明架構的一次豪賭。

為什麼要這麼做?原因很簡單也很殘酷:地球上的電力不夠用了。目前的 AI 發展極度依賴龐大的地面數據中心,這些設施對電力和冷卻系統的需求簡直是無底洞。如果在地面上無法解決能源問題,那就往天上看吧。

SpaceX 提出了一個名為「軌道數據中心」的概念。這聽起來很科幻,但邏輯卻很通順:太空中有接近恆定的太陽能,沒有大氣層的阻擋,能源幾乎是取之不盡的。透過 SpaceX 的最新計畫,他們打算利用 Starship 這種能載運百噸級載荷的巨型火箭,將數據中心發射到軌道上。

想像一下,數百萬個運作在軌道上的衛星伺服器,利用太陽能進行高強度的 AI 運算,這不僅解決了散熱和供電問題,更是邁向 Kardashev II 型文明(能利用恆星全部能量)的第一步。這場收購將 xAI 的模型能力與 SpaceX 的發射能力垂直整合,目標直指一個能夠理解宇宙的超級智能。

2. 不只是寫代碼:OpenAI 發布 Codex App

如果說 SpaceX 在仰望星空,那麼 OpenAI 就正在低頭解決開發者手邊最實際的問題。OpenAI 剛剛推出了適用於 macOS 的 Codex 桌面應用程式

這不僅僅是另一個聊天視窗。開發者們都知道,現在的挑戰已經從「讓 AI 寫這段代碼」變成了「如何管理這群 AI 幫我完成整個專案」。Codex App 更像是一個指揮中心,它允許開發者同時管理多個 AI Agent(代理人)。

這裡有個很棒的細節:你可以讓這些 Agent 平行工作。比如一個 Agent 負責修復 Bug,另一個負責寫測試,而你只需要像個指揮官一樣審視結果。它甚至內建了對 worktrees 的支援,這意味著每個 Agent 可以在不干擾你主分支的情況下,在獨立的環境中修改代碼。

此外,OpenAI 還引入了「技能(Skills)」的概念。你可以把常用的工作流程打包成技能,讓 Codex 在需要時自動調用。无论是自動化生成文件,還是連接本地的終端機執行指令,這款 App 都在試圖填補「模型能力」與「實際生產力」之間的鴻溝。

3. 小而強悍:階躍星辰開源 Step 3.5 Flash 模型

開源社群今天也迎來了一個強力的挑戰者。階躍星辰(StepFun)發布並開源了他們的 Step 3.5 Flash 模型

這個模型的亮點在於它的「智慧密度」。雖然它擁有 196B 的總參數,但它採用了混合專家架構(MoE),每次推理時只會激活 11B 的參數。這意味著什麼?意味著它跑得飛快,而且對硬體的要求大幅降低,非常適合在本地部署。

這款模型特別針對推理速度進行了優化,在程式編寫和數學運算上的表現尤為突出。根據官方的數據,它在多項基準測試中甚至能與 GPT-4 級別的模型掰手腕,同時保持極高的響應速度。對於那些想要建立私有 AI 應用,或者不想把數據傳上雲端的開發者來說,這絕對是個好消息。

如果你對此感興趣,可以直接去他們的 GitHub 頁面 或是 Hugging Face 下載權重來試試看。

4. AI 學會爾虞我詐?Game Arena 新增狼人殺與撲克測試

還記得以前我們只測試 AI 下西洋棋嗎?那是因為西洋棋是「完美信息博弈」,棋盤上的一切雙方都看得到。但現實世界可不是這樣,現實充滿了隱藏信息、謊言和不確定性。

Google DeepMind 顯然也意識到了這一點,他們的 Kaggle Game Arena 最近新增了兩個非常有意思的基準測試:狼人殺(Werewolf)和德州撲克。

這對 AI 來說難度直接拉滿。在狼人殺裡,模型必須學會說謊、結盟、甚至在對話中察言觀色來隱藏身分;在撲克桌上,它則需要計算風險,學會詐唬(Bluffing)。這實際上是在測試 AI 的「軟實力」——溝通技巧、談判能力以及在模糊情境下的決策力。

目前在排行榜上,Gemini 3 系列模型表現相當搶眼,這顯示出新一代模型不僅僅是計算機,它們開始懂得如何處理「人類」層面的複雜互動了。

可以直接前往Kaggle Game arena查看

5. 文件處理神器:GLM-OCR 視覺理解模型

最後,我們來看一個實用型工具。智譜 AI 團隊發布了 GLM-OCR,這是一個專門為 OCR(光學字元識別)設計的輕量級模型。

在處理 PDF、掃描件或是那種排版亂七八糟的表格時,傳統的 OCR 往往會掉鍊子。GLM-OCR 雖然只有 0.9B 的參數量,但在解析複雜版面、手寫文字甚至是數學公式時,表現達到了 SOTA(當前最佳)水平。

對於需要大量數位化紙本文件的企業或個人來說,這是一個性價比極高的選擇。它能直接輸出結構化的 Markdown 或 JSON 格式,讓後續的數據處理變得輕鬆許多。有興趣的朋友可以參考他們的 GitHubHugging Face 頁面。


常見問題解答 (FAQ)

Q:SpaceX 把數據中心發射到太空,真的能解決能源問題嗎? A:理論上是可行的。地球上的數據中心消耗大量電力且需要冷卻,而太空擁有幾乎無限的太陽能且環境溫度極低(利於散熱)。雖然發射成本高昂,但 Starship 的目標就是將運輸成本降到極低,加上太空中不需要維護人員和土地租金,長期來看這是解決 AI 能源瓶頸的一條潛在路徑。

Q:OpenAI 的 Codex App 和現在的 ChatGPT 有什麼不同? A:ChatGPT 主要是對話式的互動,而 Codex App 是一個專為開發設計的「工作環境」。它能直接讀取你電腦上的文件,允許你指揮多個 AI Agent 同時進行不同的編碼任務,甚至在本地運行終端命令。它更像是一個擁有 AI 員工的虛擬辦公室,而不僅僅是一個聊天機器人。

Q:Step 3.5 Flash 這種 MoE 架構的模型有什麼好處? A:MoE(混合專家)架構的最大優勢是「效率」。雖然模型總參數量很大(包含很多知識),但處理每個字時只動用其中一小部分最相關的參數(專家)。這讓模型既能保持聰明(知識廣博),又能跑得很快(推理成本低),非常適合在資源受限的設備上運行。

分享至:
Featured Partners

© 2026 Communeify. All rights reserved.