news

AI日報:OpenAI Jalapeño 推理晶片|GPT-5.5 Instant 升級|Gemini 3.5 電腦操控|Qwen-AgentWorld 語言世界模型|GitHub Copilot 按需計費

June 25, 2026
Updated Jun 25
1 min read

AI日報:OpenAI Jalapeño 推理晶片|GPT-5.5 Instant 升級|Gemini 3.5 電腦操控|Qwen-AgentWorld 語言世界模型|GitHub Copilot 按需計費

AI 科技焦點速報:OpenAI 推出推理晶片與模型升級,Google 助理正式學會操控電腦

每天早晨,科技圈總有新鮮事。最近這幾天的軟硬體發展,簡直像裝了火箭推進器。各大企業不約而同推出了重磅更新。OpenAI 團隊不僅升級了大家最常用的語言模型,還悄悄聯手硬體大廠推出專屬晶片。Google 則讓自家的 AI 擁有直接操作電腦的能力。接著就來看看今天為各位讀者整理的重要焦點。

OpenAI 聯手 Broadcom 出擊:專為語言模型打造的 Jalapeño 推理晶片

說到運算晶片,許多人第一時間想到的可能是 Nvidia。不過,OpenAI 這次決定親自下場參與硬體戰局。這家公司剛剛宣佈與 Broadcom 合作,推出名為 Jalapeño 的 AI 推理晶片。這項計畫可毫不馬虎,**從初始設計到交付製造(流片,tape-out)**竟然只花了短短九個月。硬體開發能有這種速度,確實相當驚人。

讀者或許會好奇,Jalapeño 到底厲害在哪?原因很簡單,OpenAI 想要徹底掌控硬體底層架構。這款晶片專門針對大型語言模型的推理需求量身打造。根據官方公佈的細節內容目前在實驗室運行的工程樣本顯示,Jalapeño 能夠在功耗表現上大幅超越現有的旗艦產品。它未來將與微軟等資料中心夥伴合作,預計 2026 年底開始初步部署。可以想像,未來的聊天機器人回應速度將會快到讓人完全感覺不到延遲。這塊晶片儼然成為推動平民化運算的重要一環。

GPT-5.5 Instant 迎來全新升級:更懂你的心,還能搞定複雜指令

既然提到了 OpenAI,當然不能漏掉軟體端的消息。使用者最常接觸的語言模型,現在變得更聰明且貼心了。GPT-5.5 Instant 迎來了全新版本升級。大家一定想問,這次到底有哪些實質改進?

這次更新的重點放在「理解意圖」。有時候人們隨口問一句話,字面上的意思跟心裡想的可能不太一樣。新版本的模型現在更能精準抓到問題背後的真正想法,並給出更符合期待的回答。除此之外,它在處理多重條件限制時也變得更可靠。如果使用者想找附近的好吃餐廳,或者需要一連串的購物推薦,新版本給出的建議將會更加具體實用。付費用戶今天就能立刻體驗到這些新功能,免費用戶明天也會陸續收到更新。

讓 AI 自己動手!Gemini 3.5 Flash 內建「電腦使用」功能

讓 AI 幫忙寫稿或是畫圖已經不稀奇了。要是它能直接幫忙點擊滑鼠與操作軟體呢?Google 剛剛宣布,Gemini 3.5 Flash 正式內建了「電腦使用」這項全新功能。這聽起來有點像科幻電影的情節,但它現在已經成為現實。

過去,這項技術只存在於少數獨立的特定模型中。現在,Google 直接把它整合進主力模型裡。開發者可以藉此打造出能夠跨瀏覽器、跨手機甚至桌面環境操作的虛擬助理。舉例來說,以前工程師要親自一步步測試軟體,現在只要交代一聲,Gemini 就能自動完成那些繁瑣的滑鼠點擊和鍵盤輸入。

或許大家會擔心,讓 AI 隨意操作電腦真的安全嗎?其實 Google 早就想到了這點。為了確保系統安全,開發團隊加入了多重防護機制,例如執行敏感動作前必須經過使用者親自確認。畢竟,沒有人希望系統助理擅自把重要的檔案給刪掉。

通用智慧體大躍進:阿里開源 Qwen-AgentWorld 語言世界模型

接下來這則新聞稍微偏向專業領域,但絕對值得科技愛好者關注。阿里千問團隊發布了 Qwen-AgentWorld 語言世界模型。到底什麼是語言世界模型?簡單來說,就是讓系統在一個虛擬的「沙盒」裡進行訓練。不過官方強調,這不是為了替代真實環境,也不是為了降低成本,而是為了拓展能力前沿

這個模型涵蓋了七大互動領域,包括搜尋引擎、終端機命令列,甚至是 Android 和作業系統的圖形介面。過往訓練虛擬助理,單靠真實環境交互難以覆蓋所有的極端場景。Qwen-AgentWorld 透過提供超越真實環境的可擴展性與精確的可控性(例如注入定向擾動來暴露智慧體的弱點),讓智慧體在裡面盡情試錯。令人驚豔的是,這個模型在相關評分標準上,竟然超越了許多當紅的前沿模型。對於開發者來說,這絕對是個好消息。對技術細節感興趣的讀者,可以直接前往其 GitHub 頁面 或是 Hugging Face 集合 探索更多資源。

程式設計師也瘋狂!計費方式改變讓 GitHub 迎來史上最棒的一個月

說到寫程式,幾乎多數開發者都認識 GitHub 這個平台。最近,這家微軟旗下的開發者社群度過了有史以來最棒的一個月。背後的原因相當有趣,竟然是因為他們改變了收費方式。根據外媒報導,GitHub Copilot 把原本針對固定數量的請求向單一用戶收取固定費用的計費方式,改成了按使用量計費的模式。

表面上看,這僅是一個商業模式的微調,但卻帶來了驚人的流量成長。這背後的動機,其實是因為市場競爭實在太激烈。面對 Cursor 和 Anthropic 的 Claude Code 等強勁對手,GitHub 必須做出改變來留住用戶。按需付費讓許多輕度使用者更願意嘗試,進而帶動了整體使用率的飆升。當然,流量暴增也伴隨著伺服器當機的小插曲,據說開發團隊現在正尋求其他雲端平台的協助來解決容量問題。這也側面證明了輔助寫程式的市場需求有多麼龐大。

Google Flow 結合街景服務:讓虛擬創作更貼近現實

最後,來看一個好玩的視覺應用。想像一下,把自己最喜歡的動漫角色直接放在自家樓下的街道上,會是什麼畫面?Google Flow 結合 Google 地圖街景服務,現在就能幫創作者實現這個願望。

透過這項新功能,創作者生成的圖片或影片,可以直接對應到真實世界的街景。只要在提示詞中輸入特定的地點,系統就會參考該地點的真實影像來進行創作。目前這項服務僅限於美國街景,但已經足以讓人期待它未來的發展潛力。無論是想要重新設計城市地標,還是單純搞怪把發光的水母放在大馬路上飄浮,這項工具都讓創作過程變得更有趣。

問與答(Q&A)

Q1:OpenAI 最近在「軟體」與「硬體」上有什麼重大突破? A1:

  • 軟體方面:推出了 GPT-5.5 Instant 的全新升級版,該版本大幅提升了理解使用者真實意圖的能力,且在處理複雜條件限制及提供購物與在地推薦時變得更為精準實用。
  • 硬體方面:OpenAI 聯手 Broadcom 推出了專為大型語言模型推理量身打造的 Jalapeño 晶片。該晶片從初始設計到交付製造(流片)僅花了 9 個月,目前工程樣本正在實驗室運行,預計於 2026 年底開始初步部署,將能大幅提升運算效能並降低延遲。

Q2:Google 的 Gemini 模型學會了什麼新技能?對圖像創作有何幫助? A2:

  • Google 宣佈 Gemini 3.5 Flash 正式內建了「電腦使用(Computer use)」功能。這讓開發者能打造跨瀏覽器、行動裝置與桌面環境操作的虛擬助理,甚至能處理連續性的軟體測試等複雜任務。
  • 在圖像創作上,Google Flow 結合了美國地區的 Google 地圖街景服務,讓創作者生成的圖片與影片可以直接對應並融合真實世界的街道細節。

Q3:阿里千問團隊推出的「Qwen-AgentWorld」是什麼?是為了取代真實環境測試嗎? A3: Qwen-AgentWorld 是首個原生「語言世界模型(Language World Model)」,能在單一模型內模擬涵蓋終端機、搜尋引擎、作業系統與 Android 等七大領域的智能體交互環境。官方強調,這不是為了替代真實環境或降低成本,而是為了「拓展智能體的能力前沿」。透過提供超越真實環境的可擴展性與精確的可控性(例如注入定向擾動來暴露智能體的弱點),它能幫助智能體應對真實世界中難以覆蓋的邊緣情況。

Q4:為什麼 GitHub 迎來了有史以來表現最好的一個月? A4: 為了應對 Cursor 等強勁對手的競爭,GitHub 改變了旗下 AI 寫程式輔助工具 Copilot 的收費模式。他們將原本「針對固定數量的請求向單一用戶收取固定費用」的模式,改為「按使用量計費(按需付費)」。這項改變大幅降低了輕度使用者的門檻,帶動了整體使用率的暴增,但也因此在 2026 年引發了數次伺服器當機的容量挑戰。

分享至:
Featured Partners

© 2026 Communeify. All rights reserved.