AI日報：OpenAI Jalapeño 推理晶片｜GPT-5.5 Instant 升級｜Gemini 3.5 電腦操控｜Qwen-AgentWorld 語言世界模型｜GitHub Copilot 按需計費

AI 科技焦點速報：OpenAI 推出推理晶片與模型升級，Google 助理正式學會操控電腦

每天早晨，科技圈總有新鮮事。最近這幾天的軟硬體發展，簡直像裝了火箭推進器。各大企業不約而同推出了重磅更新。OpenAI 團隊不僅升級了大家最常用的語言模型，還悄悄聯手硬體大廠推出專屬晶片。Google 則讓自家的 AI 擁有直接操作電腦的能力。接著就來看看今天為各位讀者整理的重要焦點。

OpenAI 聯手 Broadcom 出擊：專為語言模型打造的 Jalapeño 推理晶片

說到運算晶片，許多人第一時間想到的可能是 Nvidia。不過，OpenAI 這次決定親自下場參與硬體戰局。這家公司剛剛宣佈與 Broadcom 合作，推出名為 Jalapeño 的 AI 推理晶片。這項計畫可毫不馬虎，**從初始設計到交付製造（流片，tape-out）**竟然只花了短短九個月。硬體開發能有這種速度，確實相當驚人。

讀者或許會好奇，Jalapeño 到底厲害在哪？原因很簡單，OpenAI 想要徹底掌控硬體底層架構。這款晶片專門針對大型語言模型的推理需求量身打造。根據官方公佈的細節內容，目前在實驗室運行的工程樣本顯示，Jalapeño 能夠在功耗表現上大幅超越現有的旗艦產品。它未來將與微軟等資料中心夥伴合作，預計 2026 年底開始初步部署。可以想像，未來的聊天機器人回應速度將會快到讓人完全感覺不到延遲。這塊晶片儼然成為推動平民化運算的重要一環。

GPT-5.5 Instant 迎來全新升級：更懂你的心，還能搞定複雜指令

既然提到了 OpenAI，當然不能漏掉軟體端的消息。使用者最常接觸的語言模型，現在變得更聰明且貼心了。GPT-5.5 Instant 迎來了全新版本升級。大家一定想問，這次到底有哪些實質改進？

這次更新的重點放在「理解意圖」。有時候人們隨口問一句話，字面上的意思跟心裡想的可能不太一樣。新版本的模型現在更能精準抓到問題背後的真正想法，並給出更符合期待的回答。除此之外，它在處理多重條件限制時也變得更可靠。如果使用者想找附近的好吃餐廳，或者需要一連串的購物推薦，新版本給出的建議將會更加具體實用。付費用戶今天就能立刻體驗到這些新功能，免費用戶明天也會陸續收到更新。

讓 AI 自己動手！Gemini 3.5 Flash 內建「電腦使用」功能

讓 AI 幫忙寫稿或是畫圖已經不稀奇了。要是它能直接幫忙點擊滑鼠與操作軟體呢？Google 剛剛宣布，Gemini 3.5 Flash 正式內建了「電腦使用」這項全新功能。這聽起來有點像科幻電影的情節，但它現在已經成為現實。

過去，這項技術只存在於少數獨立的特定模型中。現在，Google 直接把它整合進主力模型裡。開發者可以藉此打造出能夠跨瀏覽器、跨手機甚至桌面環境操作的虛擬助理。舉例來說，以前工程師要親自一步步測試軟體，現在只要交代一聲，Gemini 就能自動完成那些繁瑣的滑鼠點擊和鍵盤輸入。

或許大家會擔心，讓 AI 隨意操作電腦真的安全嗎？其實 Google 早就想到了這點。為了確保系統安全，開發團隊加入了多重防護機制，例如執行敏感動作前必須經過使用者親自確認。畢竟，沒有人希望系統助理擅自把重要的檔案給刪掉。

通用智慧體大躍進：阿里開源 Qwen-AgentWorld 語言世界模型

接下來這則新聞稍微偏向專業領域，但絕對值得科技愛好者關注。阿里千問團隊發布了 Qwen-AgentWorld 語言世界模型。到底什麼是語言世界模型？簡單來說，就是讓系統在一個虛擬的「沙盒」裡進行訓練。不過官方強調，這不是為了替代真實環境，也不是為了降低成本，而是為了拓展能力前沿。

這個模型涵蓋了七大互動領域，包括搜尋引擎、終端機命令列，甚至是 Android 和作業系統的圖形介面。過往訓練虛擬助理，單靠真實環境交互難以覆蓋所有的極端場景。Qwen-AgentWorld 透過提供超越真實環境的可擴展性與精確的可控性（例如注入定向擾動來暴露智慧體的弱點），讓智慧體在裡面盡情試錯。令人驚豔的是，這個模型在相關評分標準上，竟然超越了許多當紅的前沿模型。對於開發者來說，這絕對是個好消息。對技術細節感興趣的讀者，可以直接前往其 GitHub 頁面或是 Hugging Face 集合探索更多資源。

程式設計師也瘋狂！計費方式改變讓 GitHub 迎來史上最棒的一個月

說到寫程式，幾乎多數開發者都認識 GitHub 這個平台。最近，這家微軟旗下的開發者社群度過了有史以來最棒的一個月。背後的原因相當有趣，竟然是因為他們改變了收費方式。根據外媒報導，GitHub Copilot 把原本針對固定數量的請求向單一用戶收取固定費用的計費方式，改成了按使用量計費的模式。

表面上看，這僅是一個商業模式的微調，但卻帶來了驚人的流量成長。這背後的動機，其實是因為市場競爭實在太激烈。面對 Cursor 和 Anthropic 的 Claude Code 等強勁對手，GitHub 必須做出改變來留住用戶。按需付費讓許多輕度使用者更願意嘗試，進而帶動了整體使用率的飆升。當然，流量暴增也伴隨著伺服器當機的小插曲，據說開發團隊現在正尋求其他雲端平台的協助來解決容量問題。這也側面證明了輔助寫程式的市場需求有多麼龐大。

Google Flow 結合街景服務：讓虛擬創作更貼近現實

最後，來看一個好玩的視覺應用。想像一下，把自己最喜歡的動漫角色直接放在自家樓下的街道上，會是什麼畫面？Google Flow 結合 Google 地圖街景服務，現在就能幫創作者實現這個願望。

透過這項新功能，創作者生成的圖片或影片，可以直接對應到真實世界的街景。只要在提示詞中輸入特定的地點，系統就會參考該地點的真實影像來進行創作。目前這項服務僅限於美國街景，但已經足以讓人期待它未來的發展潛力。無論是想要重新設計城市地標，還是單純搞怪把發光的水母放在大馬路上飄浮，這項工具都讓創作過程變得更有趣。

問與答(Q&A)

Q1：OpenAI 最近在「軟體」與「硬體」上有什麼重大突破？ A1：

軟體方面：推出了 GPT-5.5 Instant 的全新升級版，該版本大幅提升了理解使用者真實意圖的能力，且在處理複雜條件限制及提供購物與在地推薦時變得更為精準實用。
硬體方面：OpenAI 聯手 Broadcom 推出了專為大型語言模型推理量身打造的 Jalapeño 晶片。該晶片從初始設計到交付製造（流片）僅花了 9 個月，目前工程樣本正在實驗室運行，預計於 2026 年底開始初步部署，將能大幅提升運算效能並降低延遲。

Q2：Google 的 Gemini 模型學會了什麼新技能？對圖像創作有何幫助？ A2：

Google 宣佈 Gemini 3.5 Flash 正式內建了「電腦使用（Computer use）」功能。這讓開發者能打造跨瀏覽器、行動裝置與桌面環境操作的虛擬助理，甚至能處理連續性的軟體測試等複雜任務。
在圖像創作上，Google Flow 結合了美國地區的 Google 地圖街景服務，讓創作者生成的圖片與影片可以直接對應並融合真實世界的街道細節。

Q3：阿里千問團隊推出的「Qwen-AgentWorld」是什麼？是為了取代真實環境測試嗎？ A3： Qwen-AgentWorld 是首個原生「語言世界模型（Language World Model）」，能在單一模型內模擬涵蓋終端機、搜尋引擎、作業系統與 Android 等七大領域的智能體交互環境。官方強調，這不是為了替代真實環境或降低成本，而是為了「拓展智能體的能力前沿」。透過提供超越真實環境的可擴展性與精確的可控性（例如注入定向擾動來暴露智能體的弱點），它能幫助智能體應對真實世界中難以覆蓋的邊緣情況。

Q4：為什麼 GitHub 迎來了有史以來表現最好的一個月？ A4： 為了應對 Cursor 等強勁對手的競爭，GitHub 改變了旗下 AI 寫程式輔助工具 Copilot 的收費模式。他們將原本「針對固定數量的請求向單一用戶收取固定費用」的模式，改為「按使用量計費（按需付費）」。這項改變大幅降低了輕度使用者的門檻，帶動了整體使用率的暴增，但也因此在 2026 年引發了數次伺服器當機的容量挑戰。

分享至:

Featured Partners

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

Recommended for You

A …

news

AI日報：GPT-5.6受限、Claude訂閱飆升、AI代理重塑職場與Google版權角力

AI日報：GPT-5.6受限、Claude訂閱飆升、AI代理重塑職場與Google版權角力說真的，每天打開新聞總會看到各式各樣的科技進展。各大企業與政府機構之間的角力越來越明顯。人工智慧的發展已經不再僅限於實驗室裡的測試，它切切實實地影響著現代社會的工作與生活。從白宮對頂尖模型的監管，到開源社群的技術突破，這一切都充滿了不可預測的驚喜。以下將帶領讀者一探究竟，整理今日不容忽視的重大產業消息。白宮出手干預，這會是 GPT-5.6 面臨的最大挑戰嗎？近期科技圈最熱門的話題，莫過於政府對人工智慧的管控力道正在逐漸加強。根據 CNN 的最新報導，白宮已經正式要求 OpenAI 限制其即將推出的 GPT-5.6 模型，該模型目前僅能提供給少數經過政府批准的合作夥伴。這項決定的背後原因究竟是什麼？主要關鍵在於新一代模型強大的網路安全能力。這類先進技術的潛在風險讓華盛頓與華爾街都感到相當擔憂。事實上，美國政府先前才剛對 Anthropic 的 Mythos 和 Fable 模型實施了嚴格的出口管制。OpenAI 執行長 Sam Altman 在內部備忘錄中提到，目前的發布策略將採取逐一審批客戶的方式進行。政府機構與科技巨頭正在努力摸索一條安全的紅線，這或許會讓未來頂尖人工智慧模型的問世過程變得更加崎嶇。告別單純聊天，AI 代理正在重塑現代辦公室日常聊完政府的監管政策，來看看科技是如何實質改變人們的工作方式。傳統的聊天機器人通常只能處理短暫且單一的互動。不過，根據 OpenAI 發布的經濟研究報告顯示，AI 代理已經開始接管需要耗時數小時甚至更長的複雜任務。這份報告指出了一個非常有趣的現象。原本這類工具主要由軟體工程師使用，但現在已經全面跨足到非技術部門。財務、法律與招募團隊紛紛將 Codex 視為主要的日常生產力工具。數據顯示，非開發人員的採用率正在急遽上升，許多耗時超過一小時的任務現在都交由系統獨立完成。試想一下，有一個超級助理能連續工作八小時且毫無怨言，這項進展確實相當吸引人。這也宣告了未來的辦公室日常將會高度依賴自動化代理程式。逆勢成長的黑馬，為什麼消費者越來越偏愛 Claude？雖然 ChatGPT 依然擁有龐大的整體市場佔有率，但消費者市場的風向似乎出現了微妙的轉變。近期 TechCrunch 的報導引述了信用卡交易分析公司 Indagari 的龐大數據庫，指出越來越多願意付費的消費者選擇了 Anthropic 的 Claude 模型。這背後的數據成長相當驚人。自 2026 年 1 月以來，Claude 的付費消費者和相關營收成長了約 75%。值得一提的是，當該公司在今年三月明確拒絕讓川普政府將模型用於美國民眾的大規模監控後，消費者的訂閱人數出現了極為顯著的攀升。此外，線上教育平台 DataCamp 的資料也顯示，消費者對於 Claude 課程的需求正以三倍的速度超越 ChatGPT。這充分顯示出消費者不僅看重運算力，也非常在意企業的道德標準與隱私保護承諾。

Jun 26, 2026 Read →

A …

news

AI日報：從 Claude 團隊代理身分、Meta 智慧眼鏡，到 MaineCoon 即時社交影音與 Krea 2 影像生成的最新突破

AI日報：從 Claude 團隊代理身分、Meta 智慧眼鏡，到 MaineCoon 即時社交影音與 Krea 2 影像生成的最新突破最新 AI 趨勢解析：從智慧穿戴設備到團隊協作助理每天都有令人驚豔的新技術問世。這篇文章將帶領讀者了解近期值得關注的科技焦點，包含智慧眼鏡的進化、自動化團隊助理的全新權限架構，以及即時影音生成的最新突破。了解這些創新工具，將有助於大眾在數位環境中找到更順暢的工作與生活節奏。讀者們可能也發現了，科技圈的發展步調總是充滿各種驚喜。近期的幾項技術發表涵蓋了日常穿戴、團隊協作以及前衛的影音與圖像模型。這些新工具試圖讓機器自然融入人類的運作邏輯。接下來將逐一探討這些令人興奮的新進展。 Claude Tag 與全新代理身分：虛擬同事該聽誰的？場景先來到辦公室，團隊協作軟體近期迎來了有趣的演進。Anthropic 推出了 Claude Tag 功能，讓 AI 直接化身為 Slack 頻道裡的一員。只要在群組中標註 Claude，它就能協助處理各種任務。這聽起來很方便對吧？不過當 AI 進入多人協作環境時，權限管理就成了一個大問題。如果一個頻道裡有工程師和專案經理，虛擬同事該聽從誰的指令？企業最關心的資安問題該如何解決？為了解答這些疑惑，Anthropic 提出了 Agent Identity（代理身分）的概念。Claude 擺脫了代表單一使用者執行動作的限制，改採獨立的帳號與權限運作。管理員可以針對不同頻道設定存取範圍，確保軟體只能讀取被授權的資料。老實說，這是一個相當聰明的做法，大幅降低了資安風險，也讓企業能夠安心導入跨部門的自動化協助。 Meta Glasses：讓智慧科技成為穿搭的一部分關注完辦公軟體，來看看硬體設備的創新。智慧眼鏡向來被視為隨身助理的理想載具。全新亮相的 Meta Glasses 帶來了相當吸睛的更新，這款由 Meta 與 EssilorLuxottica 聯手打造的產品，定價落在親民的 299 美元起跳。設計上強調了科技感與日常佩戴的美觀平衡。系列中甚至包含了與 Kylie Jenner 合作的專屬款式。外觀升級之外，設備搭載了全新的 Muse Spark 模型，具備處理多模態任務的能力。無論是尋找附近餐廳的推薦，還是進行語音翻譯，這款眼鏡支援多達 20 種語言的即時對話功能。這對經常出國旅行的人來說絕對是一大福音。人們或許會好奇，這款眼鏡能配有度數的鏡片嗎？答案是肯定的，使用者完全可以搭配處方鏡片使用。這項設計確實完美展示了科技無縫接軌日常情境的可能性。

Jun 24, 2026 Read →

A …

news

AI日報：OpenAI 資安端到端修補｜ Fugu 多代理人 API ｜ Google Interactions 狀態管理｜ Moebius 輕量圖像修復

AI日報：OpenAI 資安端到端修補｜ Fugu 多代理人 API ｜ Google Interactions 狀態管理｜ Moebius 輕量圖像修復這是一份為開發者與科技愛好者準備的詳細解析。本文將帶領大家了解近期引人注目的技術進展。內容涵蓋 OpenAI 針對資訊安全與開源生態的最新支援，Google 提升開發體驗的實用 API 介面，以及多個極具潛力的視覺與多代理人編排系統。 OpenAI 的資安防禦與長期任務輔助軟體安全一直是一項極具挑戰性的工作。雖然 AI 大幅加快了發現系統漏洞的速度，但現在防禦方面臨的新痛點是：被海量的漏洞報告淹沒，修補速度遠遠跟不上。針對「修補」這個瓶頸，OpenAI 正式推出 Daybreak 計畫。這是一套專門用來保護全球組織的強大工具組合。這項計畫的核心在於全面釋出具有強大修補能力的 GPT-5.5-Cyber 模型。該模型搭配 Codex Security 外掛程式，自動化執行尋找並修復現有系統漏洞的工作。這項功能顯著減輕了防禦方的壓力。保護開源專案同樣刻不容緩。你知道嗎？許多極為重要的開源軟體其實只仰賴極少數的志工在維持。為提供實質協助，OpenAI 偕同 Trail of Bits 與 HackerOne 等知名機構啟動了 Patch the Planet 倡議。這項倡議提供專屬的安全專家審查資源，並結合先進模型的分析能力。這讓繁雜的漏洞修補過程變得更加順暢，大幅減輕開源維護者的日常負擔。處理繁冗的程式碼專案時，單靠一次指令往往無法奏效。針對這個情況，官方釋出了一份名為 Codex-maxxing 的長期任務指南。這份白皮書詳細解說如何把 Codex 當作一個具備記憶功能的持續工作區。開發團隊可以藉此學習如何將遠大的目標拆解成可驗證的細小步驟。這份文件也指導開發者如何在交由系統自動執行與人工介入之間取得完美平衡。

Jun 23, 2026 Read →

AI日報：OpenAI Jalapeño 推理晶片｜GPT-5.5 Instant 升級｜Gemini 3.5 電腦操控｜Qwen-AgentWorld 語言世界模型｜GitHub Copilot 按需計費