AI 日報: Google 理性思考再進化，MiniMax 與 OpenAI 掀起速度戰，Anthropic 估值衝破天際

這是一個瘋狂的週末，AI 領域的新聞簡直像雪崩一樣湧來。如果您覺得之前的模型更新速度已經夠快了，那這兩天的發展可能會讓您重新定義什麼叫「效率」。這次我們不談那些虛無縹緲的概念，直接來看看這四家巨頭到底端出了什麼牛肉。

從 Google 讓 AI 像科學家一樣思考，到 MiniMax 和 OpenAI 在編碼速度上的正面對決，再到 Anthropic 那個令人瞠目結舌的估值數字，每一項更新都暗示著同一個趨勢：AI 不再只是陪聊的玩具，它正在成為解決複雜科學問題和工程難題的實戰工具。

Google Gemini 3 Deep Think：不只是寫程式，它開始搞科研了

還記得 Google 之前的模型在數學競賽上的表現嗎？這次他們不僅僅是為了拿獎牌，而是真的想讓 AI 解決現實世界中的科學難題。Google 剛剛宣佈了 Gemini 3 Deep Think 的重大更新，這是一個專門為了推理而生的模式。

老實說，這次的升級讓人有點起雞皮疙瘩。它不再只是單純地處理數據，而是學會了像科學家一樣「思考」。

像諾貝爾獎得主那樣推理

Gemini 3 Deep Think 這次在科學領域的表現簡直是統治級的。它在 2025 年國際物理奧林匹亞和化學奧林匹亞的筆試部分都拿到了金牌水準的成績。更誇張的是，它在一個叫做「人類最後的考試」（Humanity’s Last Exam）的基準測試中，在不使用任何工具的情況下拿到了 48.4% 的分數。要知道，這個測試可是專門設計來探測模型極限的。

這裡有個很棒的例子：羅格斯大學的數學家 Lisa Carbone 利用 Deep Think 審查了一篇關於高能物理的技術論文。結果這傢伙居然找出了一個連人類同行評審都沒發現的邏輯漏洞。這說明了它已經具備了協助頂尖科研人員的潛力。

從草圖到 3D 列印

除了抽象的理論，它在工程應用上也變聰明了。您現在可以在紙上隨手畫個草圖，Deep Think 就能分析這個圖形，建立複雜的幾何模型，甚至直接生成可以拿去 3D 列印的檔案。這對於那些腦子裡有想法但懶得畫 CAD 的工程師來說，絕對是一大福音。

MiniMax M2.5：這位「虛擬架構師」比你想像的更便宜

如果說 Google 在追求科學的極致，那麼 MiniMax 則是在追求極致的生產力與性價比。他們剛剛發布了 MiniMax M2.5 模型，這個版本的核心理念非常明確：為真實世界的生產力而生。

先寫規格書，再寫程式碼

這大概是 M2.5 最有趣的地方。很多 AI 寫程式是想到哪寫到哪，但 M2.5 在訓練過程中展現出了一種「架構師」的特質。在敲下任何一行代碼之前，它會先像個經驗豐富的軟體架構師一樣，把功能、結構和 UI 設計規劃得清清楚楚。

這種「謀定而後動」的策略讓它在 SWE-Bench Verified（一個軟體工程基準測試）中拿下了 80.2% 的高分。這意味著它不只是在修 bug，而是真的能處理從系統設計到功能迭代的完整開發週期。對於開發者來說，您可以去 HuggingFace 試試看它的能耐。

快到不可思議，便宜到像免費

這裡有個瘋狂的數據：M2.5 的推理速度達到了每秒 100 個 token，這幾乎是其他前沿模型的兩倍。更扯的是它的價格，如果你讓它以這個速度連續跑一個小時，成本只要 1 美元。如果是每秒 50 token 的速度，成本甚至降到 0.3 美元。這意味著什麼？意味著我們離「智慧太便宜而不必計量」的未來又近了一大步。

OpenAI GPT-5.3-Codex-Spark：與硬體晶片的極速聯姻

OpenAI 這邊也沒有閒著，他們顯然意識到「速度」在即時協作中的重要性。於是他們推出了 GPT-5.3-Codex-Spark。注意這個「Spark」，它代表這是一個專為即時編碼設計的超快模型。

軟硬體整合的勝利

這次發布最值得關注的其實不是模型本身，而是 OpenAI 與晶片新創公司 Cerebras 的合作。Codex-Spark 運行在 Cerebras 的 Wafer Scale Engine 3 上，這是一種專門為 AI 推理設計的硬體。

結果就是，這玩意兒的生成速度超過了每秒 1000 個 token。沒錯，是 1000。這讓編碼體驗幾乎變成了「瞬間完成」。這解決了一個很大的痛點：當你在寫程式時，你不想等 AI 轉圈圈，你要的是它能跟上你的思緒。

專注於「當下」的微調

與擅長長程推理的模型不同，Codex-Spark 被設計成輕量級的助手。它適合做那些針對性的修改、重構邏輯或是調整介面。它雖然目前只有純文字功能和 128k 的上下文窗口，但對於那種需要快速迭代的開發場景來說，這種低延遲的體驗才是開發者最需要的。

Anthropic：企業級 AI 的王者地位

最後，我們得談談錢。雖然 Anthropic 這次沒有發布新模型，但他們剛剛宣布了一個震驚業界的消息：完成 300 億美元的 G 輪融資。

3800 億美元的背後

這輪融資讓 Anthropic 的估值來到了驚人的 3800 億美元。這筆錢是為了什麼？當然是為了更強大的算力和基礎設施。投資者名單由 GIC 和 Coatue 領投，並包含微軟與 NVIDIA 的投資，陣容堪稱豪華全明星，其模型更全面進駐 Amazon 和 Google 的雲端平台。

這反映出一個事實：企業界非常信任 Claude。Anthropic 的年營收運轉率（run-rate revenue）已經達到了 140 億美元，而且在過去三年裡每年都增長 10 倍以上。特別是 Claude Code 這種能夠自主完成編碼任務的 Agent，正在被越來越多的企業採用。這不僅僅是融資，這是市場對「安全且強大的企業級 AI」投下的信任票。

常見問題解答 (FAQ)

Q：對於一般的程式設計師來說，MiniMax M2.5 和 OpenAI Codex-Spark 哪個更好用？

這取決於您的使用場景。如果您需要 AI 幫您從零開始規劃整個系統，或者處理非常複雜、需要長時間思考的架構問題，MiniMax M2.5 的「架構師思維」和極低的成本可能更適合您，它擅長把大任務拆解清楚。但如果您是在寫代碼的當下，需要一個能跟上您手速、瞬間給出補全建議或進行小範圍重構的助手，OpenAI Codex-Spark 那每秒 1000 token 的速度會讓您感覺更流暢，完全不會打斷心流。

Q：Google 的 Deep Think 模式現在可以用到了嗎？

是的，新的 Deep Think 模式現在已經在 Gemini App 中向 Google AI Ultra 的訂閱用戶開放了。如果您是開發者或企業用戶，Google 也首次透過 Gemini API 開放了 Deep Think 的早期訪問權限。不過要注意，這是一個專門為了深度推理設計的模式，處理日常閒聊可能有點大材小用。

Q：Anthropic 融了這麼多錢，對普通用戶有什麼影響？

短期內，這意味著 Anthropic 有足夠的銀彈去購買更多 GPU (如 AWS Trainium 和 Google TPU) 並訓練下一代模型（比如傳說中的 Claude 4 或 5）。這保證了 Claude 系列模型在未來的幾年內仍將是市場上最強大的競爭者之一，特別是在處理長文本和複雜邏輯方面。這也暗示了他們會繼續強化 Claude 在企業端的應用，比如更強大的安全性和隱私保護。

分享至:

Featured Partners

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

Recommended for You

A …

news

AI 日報: Google地圖結合Gemini、Sora 2 API正式釋出！6大AI更新總整理

科技日報：Google 地圖全面升級與 Sora 2 帶來全新視覺體驗今天的科技圈充滿驚喜。從日常使用的導航工具大幅躍進，到影音生成技術邁入下一個階段，各家大廠都端出了令人眼睛一亮的更新。不僅一般大眾能享受到更便利的介面，開發者社群也迎來了更穩定的工具與預算控制方案。一起來看看這些新技術如何改變大家的生活與工作模式。 OpenAI Sora 2 影片 API 釋出：畫面不再只靠想像老實說，影片生成的技術進展總讓人感到不可思議。OpenAI 開發團隊這次釋出了由Sora 2 驅動的全新 Video API。這代表開發者現在能直接透過介面精準控制影片內容，不再單純仰賴隨機生成的運氣。先釐清一件事，這回的更新支援自訂角色與物件。也就是說，創作者可以維持影片主角的連貫性。輸出格式方面，無論是適合手機觀看的 9:16 或是傳統 16:9 比例都完全支援。或許有些人會問，影片長度有限制嗎？目前單次可以生成長達 20 秒的片段。若需要更長的故事線，還能使用影片接續功能來擴展場景。加上批次處理作業的支援，大規模生成素材變得相當輕鬆。這對影像工作者來說，確實解決了過去片段無法連貫的痛點。 Google 地圖結合 Gemini：找路也能像跟朋友聊天一樣大家日常生活中最常使用的導航工具，剛剛完成了十多年來最大規模的改版。沒錯，Google 地圖正式整合了 Gemini 模型。找路這件事從此變得相當直覺。以前找餐廳總是要自己滑評論比較半天。現在只要透過 Ask Maps 功能，就像跟朋友對話一樣直接提問。例如問它「附近哪裡有氣氛好又提供素食的餐廳」，系統就能結合即時資訊給出量身打造的建議。除了搜尋方式改變，導航介面也帶來了沉浸式導航。立體的 3D 視角結合真實世界影像，讓路口、車道和斑馬線都清晰可見。甚至在出發前，還能提前預覽目的地的停車場與建築物入口。這種結合空間影像運算的設計，確實讓駕駛過程減少了許多焦慮感，出門在外也更有安全感。 Claude 圖表直接產出：資料視覺化變得超直覺整理報表有時候真的很折磨人。不過Claude 最新的更新直接解決了這個困擾。現在使用者可以在聊天介面中，直接生成互動式圖表與示意圖。這項功能目前已經進入 Beta 測試階段。大家最關心的問題通常是：只有付費會員能用嗎？最棒的一點是，所有方案的使用者都能體驗，完全包含免費版用戶。想像一下，只要丟入一堆繁瑣的數據，AI 就能立刻畫出精美的折線圖或圓餅圖。不需要額外開啟試算表軟體，也不用去學那些讓人頭痛的繪圖語法。這種隨想隨用的直覺操作，確實讓工作效率大幅提升，任何人都能輕鬆解讀數據背後的意義。免費資源的代價：GitHub Copilot 學生方案調整享受免費資源的同時，有時候也得接受一些限制。GitHub 稍早更新了方案說明，針對 GitHub Copilot 的學生方案進行了調整。這聽起來有些可惜，因為高階模型選擇權限有了變化。根據最新文件顯示，GPT-5.4 以及 Claude Opus、Claude Sonnet 等進階模型，目前已取消對學生方案的支援。那麼學生方案到底還有哪些功能？經過驗證的學生依然享有無限次的程式碼補全功能，也能存取 Copilot Chat 與代理功能。付費的 Pro 或是企業版用戶則依然可以自由選擇所有頂級模型。對於正在學習寫程式的學生而言，現有包含的模型其實已經相當夠用，依舊是個不可多得的開發好幫手。開發者的除錯救星：OpenRouter 智慧路由預設啟動 API 路由選擇一直都是個棘手的問題。開發者總是在效能與成本之間來回測試。為了解決這個困擾，OpenRouter 正式將 Auto Exacto 針對包含工具呼叫（tool-calling）的請求預設開啟。對於其他的非工具呼叫請求，使用者仍然需要手動在模型名稱後加上 :exacto 才能啟用此功能

Mar 13, 2026 Read →

A …

news

AI 日報: NVIDIA 開源巨型模型與 Google 訂閱爭議

探索最新人工智慧動態：NVIDIA 開源巨型模型與 Google 訂閱方案引發的社群熱議科技圈的發展步調總是讓人目不暇給。每天都有新的工具問世，試圖改變人類與數位世界互動的模式。說實話，要在這波浪潮中保持敏銳度並不簡單。今天就為各位整理近期最值得關注的幾項重大發表，從底層架構的革新到日常辦公軟體的進化，涵蓋了各種令人驚豔的技術細節。突破效能瓶頸的開源巨作訓練語言模型的成本高昂是業界公認的痛點。為了解決這個難題，NVIDIA 釋出了Nemotron 3 Super 混合架構大模型。NVIDIA 這次的舉動確實相當大膽。這款擁有一千二百億參數的模型，特別採用了混合專家架構。這代表著它在進行推論時，只會啟動其中一小部分的參數。這種設計大幅度提升了運作效率，據說吞吐量足足提高了五倍之多。仔細想想，當系統需要處理多步驟的自主代理任務時，常常會遇到上下文過載的瓶頸。大量的歷史紀錄不斷來回傳輸，導致運算變得異常遲緩。Nemotron 3 Super 具備一百萬個 token 的龐大上下文窗口，正好能妥善保留完整的工作流程狀態。這不僅降低了花費，也避免了系統在複雜任務中迷失方向。平台改版引發的社群波瀾然而，新政策未必總能獲得滿堂彩。近期 Google Antigravity 全新服務架構與訂閱方案的改版，就在社群中引爆了熱烈討論。這個平台原本的立意相當良好，試圖透過點數機制，把市場上頂尖的模型整合在一起，讓開發者能在一個介面下自由切換使用。使用者可以依照需求選擇 Pro 或 Ultra 計畫。如果點數用完了，理論上只要額外付費購買即可。可是問題就出在具體的限制條款上。許多用戶在社群媒體上大吐苦水，指出新設定的模型配額嚴苛到不合常理。有人甚至抱怨，只是進行了一個小時的專案測試，帳號就被限制了整整一週。過長的刷新週期讓許多重度使用者感到十分無奈，這也凸顯了平台在資源分配與用戶體驗之間，還有很大的調整空間。神祕新星展現驚人潛力有時候，最具震撼力的驚喜往往來得很低調。就在市場為訂閱配額爭論時，OpenRouter 平台上悄悄現身了兩款神祕的新模型。這兩款被命名為 Hunter Alpha 與 Healer Alpha 的模型，目前還不知道具體的開發團隊背景，但其展現出的規格已經引起廣泛關注。 Hunter Alpha 是一款參數規模達到一兆的巨獸，同樣具備一百萬 token 的上下文能力。它專門針對代理工作流程打造，特別擅長處理需要長期規劃和複雜推理的任務。另一款 Healer Alpha 則展現了全模態的強大潛力。它結合了視覺、聽覺、推理以及行動能力，彷彿擁有了真實世界的感知器官。這代表它可以直接接收聲音和影像，並據此精準地執行多個步驟的動作。這種等級的穩定性與精確度，絕對是未來發展的重要指標。辦公室生產力的無縫升級技術的進步最終還是要回歸到實際應用層面。對於無數每天與報表和簡報奮戰的上班族而言，Claude 針對 Excel 與 PowerPoint 推出的更新無疑是個極好的消息。過去在處理這類文書工作時，總免不了要在不同的視窗間頻繁切換，複製貼上的過程既枯燥又缺乏效率。現在，Claude 帶來了跨檔案的上下文共享功能。這意味著人工智慧可以將同一個對話脈絡延伸到不同的軟體中。舉例來說，系統可以直接讀取 Excel 裡面的財務數據，理解其中的邏輯後，幫忙整理成一目了然的圖表，接著再無縫將這些重點寫入 PowerPoint 簡報裡。一切就像是有個極度聰明的助理在旁協助，將原本繁雜的流程化繁為簡。網頁資料抓取變得異常簡單資料蒐集一直是許多技術團隊面臨的一大挑戰。想要建立優秀的檢索系統或訓練模型，就必須從網路上抓取大量乾淨的資料。Cloudflare 似乎聽到了開發者的心聲，推出了極具實用價值的 Browser Rendering 爬蟲服務。只要發送一個簡單的 API 請求，這個工具就能自動去探索並抓取整個網站的內容。它會在後台利用無頭瀏覽器來處理那些複雜的動態網頁渲染，然後把結果轉換成乾淨的 Markdown 或是結構化的 JSON 格式。這幫開發者省去了處理反爬蟲機制或解析複雜網頁結構的麻煩事，大幅提升了建構資料庫的效率。重新定義個人電腦的未來看完了現有的工具更新，接著來展望一下未來。電腦作業系統的運作邏輯已經維持了相當長的一段時間，基本架構始終是人類輸入指令，機器被動執行。不過，Perplexity 正在醞釀一個被稱為 Personal Computer 的全新構想。

Mar 12, 2026 Read →

A …

news

AI 日報: 提升生產力必看！掌握 ChatGPT、Gemini 與 Fish Audio 與最新 AI 應用

科技脈動：ChatGPT 視覺化學習指南與 Fish Audio 語音開源震撼彈，一次掌握 AI 最新進展你知道嗎？科技的發展總是出人意料，每天都有新的工具試圖讓生活變得更輕鬆。老實說，面對大量且複雜的資訊，要隨時保持敏銳並不容易。今天整理了幾項備受矚目的科技進展，涵蓋了教育工具、辦公室生產力、社群網路佈局，以及專業開發者不可錯過的語音與程式碼助理更新。讓我們一起看看這些技術如何默默改變大家的日常。讓數學與科學不再抽象：ChatGPT 的視覺互動魔法許多成年人直到現在依然覺得數學與科學概念相當難懂。一項 Gallup 調查顯示，超過一半的美國成年人對數學感到吃力。面對密密麻麻的公式，確實很容易讓人退縮。為了解決這個痛點，ChatGPT 推出了全新的視覺互動學習方式。這項功能涵蓋了超過 70 個核心數學與科學概念。使用者不僅能獲得純文字的解答，還能直接在介面上調整變數。當變數改變時，圖表和結果會即時更新。這種視覺化的互動設計，讓原本死板的方程式瞬間變成可以動手實驗的工具。教育工作者也認為，理解事物背後的運作原理，遠比死背公式來得有效。這項新功能目前已向所有登入方案的使用者全球開放，讓學習過程變得更加生動有趣。告別閃爍的游標：Google Workspace 全新辦公幫手面對空白的文件或試算表，萬事起頭難絕對是多數人的心聲。不過，Google Workspace 帶來了最新的 Gemini 更新，專門針對這個問題提供解方。這些功能首先開放給 Google AI Ultra 與 Pro 的訂閱者使用。在 Docs 中，Gemini 可以根據會議記錄直接生成初稿，還能統一整篇文章的語氣。如果手邊有一份喜愛的旅遊行程範本，它甚至能自動抓取電子郵件中的航班與飯店資訊來填寫。至於 Sheets 則變得更加聰明。只需輸入一段簡單的描述，它就能建立完整的專案清單。這聽起來似乎需要大量手動操作。其實不然。系統會自動填寫遺漏的數據，大幅節省四處搜尋資料的時間。Slides 與 Drive 也迎來了升級，讓簡報設計與跨檔案搜尋變得像和真人對話一樣自然。 Meta 的社群新佈局：招募 Moltbook 核心團隊社群網路的發展總是充滿驚喜。事情是這樣的，Meta 最近招募了 Moltbook 的幕後核心雙人組 Matt Schlicht 與 Ben Parr。他們將正式加入由 Alexandr Wang 帶領的 Meta 超級智慧實驗室。

Mar 11, 2026 Read →