AI 日報: Excel 終於迎來 AI 大腦，OpenAI 揭密 8 億用戶背後的資料庫架構

老實說，這週的 AI 圈子發生了一些非常「接地氣」的大事。

我們習慣了看到那些飄在雲端的模型更新，但這一次，Anthropic 直接把手伸進了我們最熟悉的辦公軟體 Excel 裡，這可能會徹底改變我們處理報表的方式。另一方面，OpenAI 也罕見地公開了他們的工程細節，告訴大家他們是如何用傳統的資料庫扛住 8 億用戶的流量。

不管是你每天面對的試算表，還是後端工程師頭痛的擴展問題，今天的內容都很有料。我們甚至還有一個開源音樂模型要介紹給你。準備好了嗎？我們開始吧。

Claude 正式進駐 Excel：這不僅僅是聊天機器人

你是否也有過這種經驗？看著一份充滿複雜公式的 Excel 表格，完全不知道前手同事到底在算什麼，或者因為一個 #REF! 錯誤搞得焦頭爛額。

Anthropic 剛剛發布了 Claude in Excel 的預覽版，這對許多整天與數據為伍的人來說，簡直是救星。

這不是那種掛在旁邊只能回答通用問題的聊天視窗。Claude 現在能理解你的「整個工作簿」。它看得懂那些巢狀公式，也明白不同分頁之間的數據依賴關係。

這意味著什麼？

當你問它「這個單元格的數字是怎麼算出來的？」它不會給你一段模糊的廢話，而是會提供精確到單元格的引用解釋。你可以要求它更新某些假設條件，Claude 會在保留原始公式結構的前提下，幫你調整模型。

對於財務分析師或數據專員來說，這功能非常強大。它甚至能幫你除錯。那些讓人崩潰的 #VALUE! 或循環參照錯誤，Claude 能在幾秒鐘內找出源頭並教你修復。

目前這個功能已經針對 Claude Pro、Max、Team 和 Enterprise 用戶開放 Beta 測試。如果你是重度 Excel 用戶，去 Claude in Excel 看看，這可能會是你今年最值得安裝的插件。

OpenAI 的工程奇蹟：用 PostgreSQL 支撐 8 億用戶

聊完前端應用，我們來看看後端的硬核工程。

你想過 ChatGPT 背後的資料庫是怎麼運作的嗎？要支撐全球 8 億用戶，還要應對從 ChatGPT 到 API 的海量請求，你可能會以為他們用了什麼神祕的黑科技資料庫。

結果 OpenAI 告訴我們：他們用的是 PostgreSQL。

在 OpenAI 最新的工程部落格中，他們詳細記錄了這段擴展之路。這真的是一場與流量的搏鬥。他們的 Postgres 負載在過去一年增長了 10 倍以上。

為了扛住這種壓力，他們並沒有急著把所有東西都拆分（Shard）。相反，他們將單個主節點（Primary）的效能榨到了極致，並搭配了將近 50 個唯讀副本（Read Replicas）。

這聽起來很瘋狂，對吧？單一寫入節點怎麼可能撐得住？

OpenAI 的策略非常聰明。他們發現雖然讀取量巨大，但寫入量相對可控。於是他們做了大量的查詢優化，比如抓出那些不僅慢還會吃光 CPU 的複雜 Join 查詢，強迫將邏輯移到應用層處理。

還有一個關鍵技術叫做「連線池」（Connection Pooling）。他們使用 PgBouncer 來管理資料庫連線，把平均連線時間從 50 毫秒壓到了 5 毫秒。這就像是在高速公路收費站前設了 ETC，車流瞬間順暢了。

當然，他們也並非完全不拆分。對於那些寫入量特別大的工作負載，他們確實遷移到了 Azure CosmosDB。但這個案例告訴我們，傳統關聯式資料庫的潛力遠比我們想像的要大，只要你的工程架構足夠紮實。

揭開 Agent 的神秘面紗：Codex 是如何思考的？

既然談到了 OpenAI 的工程實力，他們最近還開啟了一個新的技術解析系列，專門講解 Codex 的運作原理。

第一篇文章 Unrolling the Codex agent loop 其實非常有趣，它解釋了所謂的「AI Agent」（代理人）到底是如何在你的電腦上執行任務的。

我們常說 AI 能幫你寫程式、改檔案，但這中間發生了什麼？

核心在於一個「迴圈」（Loop）。當你給 Codex 一個指令，例如「幫我把這個圖表加到 README 裡」，模型並不是一次就做完。它會進入一個推理階段，決定是否需要呼叫工具（比如執行一個 Shell 指令來讀取檔案）,,。

如果有必要，它會執行工具，然後把工具執行的結果（比如檔案內容或錯誤訊息）再餵回給模型。這個「觀察 -> 思考 -> 行動」的過程會不斷重複，直到模型認為任務完成，最後給你一個回應,。

HeartMuLa：開源音樂生成的全能選手

最後，讓我們從嚴肅的程式碼切換到創意領域。

現在市面上有 Suno 和 Udio 這樣的音樂生成巨頭，但它們都是閉源的。如果你想自己掌控模型，或者做更細緻的調整呢？

這時候你需要關注一下 HeartMuLa。這是一個剛剛開源的音樂基礎模型家族，它的野心很大，試圖在音樂理解和生成上建立一個完整的生態系。

HeartMuLa 不僅僅是生成音樂，它由四個核心部分組成：

HeartCLAP：負責聽懂你對音樂的文字描述，建立文字與音訊的關聯。
HeartCodec：一個高保真度的音樂解碼器，能捕捉音樂的細節。
HeartTranscriptor：專門用來辨識歌詞的模型。
HeartMuLa：最後才是這個負責生成的大腦。

最讓我感興趣的是它的「可控性」。你可以針對歌曲的不同段落（如前奏、主歌、副歌）分別下達風格指令，這比單純輸入一段文字然後聽天由命要實用得多。它甚至支援多種語言，包括中文、英文和日文、韓文以及西班牙文。

對於創作者或研究人員來說，這是一個很好的起點。你可以到他們的 GitHub 去下載模型權重，自己架設來玩玩看。

HeartMuLa Huggingface space HeartMuLa Github 論文

常見問題解答 (FAQ)

Q：Claude in Excel 安全嗎？我的數據會被拿去訓練嗎？ A：這取決於你的訂閱方案。Claude in Excel 是針對 Enterprise 和 Team 等付費計畫推出的。根據 Anthropic 的政策，企業版的數據通常不會被用於訓練模型，且享有較高的隱私保護。但建議在使用前詳閱你的公司合約或 Anthropic 的隱私條款。

Q：OpenAI 為什麼不直接一開始就對資料庫進行分片（Sharding）？ A：分片雖然能擴展寫入能力，但會帶來巨大的維護複雜度。OpenAI 在文章中提到，分片需要修改數百個應用程式端點，可能耗時數月甚至數年。對於以讀取為主的負載，優化單一主節點配合讀取副本（Read Replicas）是更具成本效益且穩定的短期策略。

Q：HeartMuLa 可以在一般的家用電腦上運行嗎？ A：可以。HeartMuLa 提供了 3B 參數版本。若您的顯卡記憶體有限，HeartMuLa 官方提供了一個 –lazy_load（懶加載）功能，可以讓模組「按需加載」並在使用後釋放記憶體，這讓單張 GPU 的用戶也能更順暢地運行。

Q：什麼是 AI Agent 的「迴圈」（Loop）？以及如何管理記憶體？ A：迴圈是「觀察 -> 思考 -> 行動」的過程。為了管理記憶體，OpenAI 使用了兩種策略：一是 Prompt Caching，透過快取不變的指令來加速運算；二是 Compaction（壓縮），當對話過長時，會自動將舊的對話歷史壓縮成摘要，以釋放上下文視窗空間。

分享至:

Featured Partners

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

Recommended for You

A …

news

AI 日報: OpenAI GPT-5.4 輕量版發布，Google、微軟與開源模型最新動態一次看

今日 AI 焦點解析：GPT-5.4 輕量雙雄問世，解析微軟新戰略與隱藏資安陷阱大家有注意到嗎？最近科技界的新聞幾乎每天都在刷新大眾的認知。人工智慧的發展腳步從未停歇，各種新模型與新應用如雨後春筍般湧現。老實說，要跟上這些資訊確實有點吃力。今天這篇文章整理了幾項最具影響力的業界動態，帶領讀者仔細檢視這些改變未來的關鍵時刻。從 OpenAI 推出效能驚人的輕量級模型，到 Google 針對個人化體驗與通用人工智慧的全面佈局，再到隱藏在網頁字體中的駭客陷阱。每一項進展都牽動著未來的科技走向。讓我們馬上來看看今天的重點精華。輕巧卻力大無窮：GPT-5.4 mini 與 nano 震撼登場提到大型語言模型，許多人腦海中浮現的往往是運算成本高昂、反應稍微遲鈍的龐然大物。雖然體積龐大通常意味著知識淵博，但事實恰好相反，有時候小巧靈活的系統反而能發揮更大的價值。 OpenAI 剛剛正式宣佈GPT-5.4 mini 和 nano 登場。這兩款全新模型專為高流量與需要極低延遲的工作任務量身打造。GPT-5.4 mini 在寫程式、邏輯推理與多模態圖片理解上的表現非常驚人。它在多項專業評測中的成績，幾乎已經逼近了更大型的 GPT-5.4 模型。最棒的是什麼呢？它的運行速度提升了超過兩倍。開發者現在可以用極低的成本，讓這個模型處理複雜的程式碼除錯或是前端生成任務。另一個引起廣泛討論的是 GPT-5.4 nano。這是整個系列中最輕量、反應最敏捷的版本。對於那些只要求極致速度與成本控制的簡單任務，例如資料擷取、排序或是基本的客服回應，nano 絕對是首選。想像一下，一個大型企業可以讓 GPT-5.4 擔任發號施令的主管，並將繁雜的基礎工作分配給成千上萬個 mini 或 nano 智慧體同時處理。這種架構無疑會大幅提升整體運作效率。 Google 的雙重攻勢：量身打造的個人體驗與 AGI 終極評估接下來看看科技巨頭 Google 的最新動態。他們目前正採取雙管齊下的策略，一方面優化消費者的日常體驗，另一方面則積極探索人工智慧的終極目標。針對一般使用者，Google 正在大幅擴展其生態系中的客製化能力。根據最新公佈的 Bringing the power of Personal Intelligence to more people 計畫，系統將能夠把 Gmail、Google 相簿等應用程式串聯起來，提供專屬於使用者的精準解答。個人智慧功能目前已在美國推出，可用於搜尋中的 AI 模式，並且正在Gemini 應用程式和Chrome 瀏覽器中逐步推出免費用戶。這些連網體驗僅適用於個人 Google 帳戶，不適用於 Workspace 企業版、公司版或教育版使用者。另一方面，學術與研發領域也迎來了重大突破。Google DeepMind 發布 AGI 評估框架，這份報告提出了一個極具指標意義的認知分類系統。該框架涵蓋了感知、記憶、問題解決等十項關鍵認知能力。為了讓理論付諸實踐，Google 甚至與 Kaggle 聯合舉辦了一場獎金豐厚的黑客松，邀請全球頂尖好手共同設計評估機制。這代表著業界正在努力找出一把客觀的尺，用來衡量機器到底距離真正的「通用人工智慧」還有多遠。

Mar 18, 2026 Read →

A …

news

AI 日報: Nemotron 聯盟、Manus 桌面 AI 與 DLSS 5 介紹

老實說，每天看著科技圈的新消息不斷彈出，真的會讓人感到一陣目眩神迷。你知道嗎？就在大家還在適應各種新工具時，整個產業的遊戲規則又再度被改寫了。從開源基礎模型的跨國大結盟，到人工智慧直接接管個人電腦桌面，甚至是遊戲畫面的革命性突破，各項技術正以驚人的節奏互相交織。這裡整理了近期最具影響力的科技進展，帶領各位透徹了解這些將徹底改變日常工作與娛樂的新工具。開源力量大集結，Nemotron 聯盟重磅登場 NVIDIA 最近宣布成立 Nemotron 聯盟，這絕對是近期最引人注目的重頭戲。這是一個匯集了各大頂尖實驗室的全球合作計畫。眾人決定把各自的專業知識、運算資源和數據拿出來共享，共同推進開源基礎模型的發展。這個聯盟的誕生意義非凡。各大廠牌以往總是各自為政，現在卻選擇攜手合作。Mistral AI 順勢宣布成為創始成員，將自家擅長的模型架構與多模態能力貢獻出來。與此同時，Perplexity 同樣加入了這個陣營，其他還有Black Forest Labs、Cursor、LangChain、Reflection AI、Sarvam 和 Thinking Machines Lab，目標是把這套由 NVIDIA DGX 雲端訓練出來的全新模型，打造成所有人都能靈活運用的強大基礎。這意味著未來的技術發展將更加透明且普及，任何人都能藉此打造專屬的應用程式。那些讓你不用再做選擇的全能模型參與聯盟的同時，Mistral 的動作可沒停下來。他們剛推出了 Mistral Small 4，這款模型可以說是集大成之作。以往處理不同任務時，總得在推理、視覺分析或程式碼生成模型之間來回切換。現在這款新模型把 Magistral 的推理能力、Devstral 的代理寫碼功能，以及 Mistral Small 的指令處理能力（instruct）全部打包在一起，同時更原生支援了強大的多模態視覺分析。使用者可以透過全新的參數設定，隨時決定模型要給出輕量快速的回應，還是進行複雜的逐步推理。對於開發者來說，Hugging Face 上也已經準備好了 Mistral Small 4 的專屬合集，隨時可以拿來測試。不過，程式開發的瓶頸往往卡在人工代碼審查上。為了解決這個痛點，Mistral 同步推出了專為 Lean 4 設計的開源程式碼代理 Leanstral。這套工具能夠精準處理複雜的數學驗證與軟體規格測試。開發者現在只需要告訴 AI 想要什麼結果，Leanstral 就會負責生成並完美證明這些邏輯的正確性。想嘗鮮的人，可以直接前往 Hugging Face 下載Leanstral 的開源權重模型，或者透過他們提供的 labs-leanstral-2603 API 端點直接測試。當人工智慧直接接管個人裝置雲端工具固然方便，但許多人最核心的工作檔案依然躺在本地電腦裡。為了解決這個落差，Manus 推出了全新的桌面整合功能，直接讓 AI 代理走進使用者的本機環境。透過終端指令，Manus 能夠讀取、分析甚至編輯本地檔案。想像一下，花店老闆電腦裡塞滿了幾千張未分類的照片，只要下達一句「幫忙整理花店照片」，系統就會自動掃描內容並建立分類資料夾。這聽起來很神奇對吧？這時可能會有人好奇：讓 AI 隨意控制個人電腦，難道不會有安全疑慮嗎？其實系統設計了非常嚴格的授權機制。每一個終端指令都需要經過明確批准才能執行。使用者始終是發號施令的指揮官，而 AI 只是個乖巧的執行者。另一方面，手機端的競爭也進入了白熱化階段。Perplexity 宣布將他們最強大的 Computer 平台引入 Android 系統。這款工具簡直就是一個萬能的數位員工。它整合了超過 19 種頂尖模型，會根據任務自動分配工作。需要強大邏輯運算時召喚 Claude Opus 4.6，做複雜研究時派 Gemini 上場，甚至還能用 Veo 3.1 處理影片生成。它具備持久記憶功能，可以同時平行處理多項任務，幾乎不需要人類在一旁緊迫盯人。

Mar 17, 2026 Read →

A …

news

AI 日報: Claude 百萬上下文開放與限時雙倍用量！OpenAI 自動化上線、字節跳動 AI 影片爭議

最新 AI 動態解析：Claude 百萬上下文全面開放，OpenAI 推出自動化工作流每天都有新的工具與技術問世，人工智慧的發展步伐總是令人目不暇給。想要掌握最新的產業脈絡，只要抓住幾個關鍵重點就好。本篇文章整理了今日最重要的三則動態。Claude 全面開放百萬上下文窗口，更加碼贈送台灣時段專屬的雙倍用量。OpenAI 則針對開發者推出實用的 Automations 功能。另外，字節跳動的影片生成模型因好萊塢版權爭議被迫暫停全球發布計畫。 Claude 誠意升級：百萬上下文與離峰雙倍用量大放送重點來了，Anthropic 宣布 Claude Opus 4.6 與 Sonnet 4.6 的百萬上下文 (1M context) 功能已正式全面開放。一百萬個 token 到底是什麼概念？使用者可以直接把整個程式碼庫、成千上萬頁的合約，或是長時間運行的代理 (Agent) 完整追蹤紀錄全部塞進去。模型可以輕鬆讀完這些龐大的資料。最棒的是這項升級完全不需要額外付費。標準計價現在適用於整個一百萬上下文窗口。不管請求包含九千個還是九十萬個 token，每 token 的費率都一模一樣。媒體檔案的限制也大幅放寬。現在每個請求最多可以包含 600 張圖片或 PDF 頁面。處理龐雜文件的過程因此變得無比輕鬆。除了功能升級，Claude 還同步推出了非常實用的限時雙倍用量優惠。活動期間從 2026 年 3 月 13 日持續到 3 月 27 日。只要是在非尖峰時段使用，每五小時的用量限制就會自動翻倍。這裡特別幫台灣使用者換算一下時間。官方公告的非尖峰時段是美東時間早上八點到下午兩點之外的時間。換算成台灣時間，正好是每週一至週五的凌晨兩點到晚上八點（週末則全天適用）。老實說，這個時段幾乎涵蓋了亞洲地區正常的上班與作息時間，可以說是相當划算。大家可能會好奇，參加這個活動需要手動設定什麼嗎？其實什麼都不用做。只要帳號符合免費版、Pro 版、Max 版或 Team 版方案的資格，系統就會自動套用雙倍額度。企業版則不包含在這次的優惠範圍內。另外，有些人會擔心這額外贈送的用量是否會扣除每週的整體額度？答案是不會。額外的紅利用量完全獨立計算。等到 3 月 27 日活動結束後，所有用量限制就會恢復正常水準，完全不會對現有的帳單產生任何影響。減輕開發者負擔：OpenAI Automations 自動化流程上線開發者總是在尋找減少重複性勞動的解方。不可否認地，繁瑣的日常維護往往會消耗掉大量寫程式的精力。現在OpenAI Automations 已經正式上線 (GA)，剛好精準解決了這個痛點。這套自動化工具讓軟體工程師能將寶貴的時間花在更有價值的地方。透過這項新功能，開發團隊可以自訂許多執行細節。工程師能夠根據特定任務的需求，自由設定要使用的模型以及邏輯推理水平。這提供了極大的靈活性。系統甚至允許選擇讓這些自動化流程在獨立的工作樹 (worktree) 中單獨執行，或者直接套用到現有的分支 (branch) 裡。如果某個流程特別好用，還能透過範本 (templates) 功能將其儲存起來，方便日後在其他專案中重複使用。

Mar 16, 2026 Read →