news

AI日報|Cursor 行動寫程式、LongCat 大模型、Claude 企業佈局、Rampart 隱私防護、Gemini 個人化 AI、Meta 腦波打字

June 30, 2026
Updated Jun 30
2 min read

AI日報|Cursor 行動寫程式、LongCat 大模型、Claude 企業佈局、Rampart 隱私防護、Gemini 個人化 AI、Meta 腦波打字

掌握最新的技術脈動,從行動開發工具、大型語言模型架構解析,到企業巨頭間的競爭角力,還有保護隱私的本地端過濾工具與非侵入式腦波解碼技術。本文將帶領讀者全面了解這些影響未來的關鍵發展。

科技圈的發展步調總是讓人目不暇給。說實話,幾個月前大家還在討論的概念,如今早就已經成為日常工具。從開發者手邊的寫程式神器,到企業雲端佈局的明爭暗鬥,甚至連醫療級的腦波解碼都有了全新進展。仔細想想,技術已經悄悄滲透到生活的各個角落。大家準備好跟上這波新浪潮了嗎?接下來,就讓我們把焦點放在近期最值得關注的幾個重要里程碑。

離開電腦也能修 Bug?手機上的開發體驗升級

開發者們都知道,靈感往往來得突然。有時候走在路上突然想到一個解法,手邊卻沒有電腦可以馬上測試。這的確挺讓人焦慮的。不過,現在有了 Cursor 行動應用程式(iOS 版),情況大不相同了。

這款 App 將完整的開發環境搬到了手機上。使用者只要打開手機,選好儲存庫,就能透過語音輸入想法,並使用斜線指令引導 AI 模型。這些運算都跑在隔離的雲端虛擬機器裡。大家可以隨時測試、驗證程式碼。哪怕闔上筆記型電腦,工作階段依然會在雲端持續執行。

更讓人驚豔的是它的 Remote Control 功能。只要電腦保持喚醒狀態,開發者就能用手機遠端接手正在電腦上執行的任務。鎖定畫面上的 Live Activities 也會隨時推播代理狀態,甚至可以直接用手機審查截圖、日誌、差異,並直接在 App 裡面合併 PR 請求。看著辛苦寫出的程式碼能隨時隨地被修改,這種成就感難以言喻。另外,開源專案 OpenClaw 官方也宣布 正式推出 iOS 與 Android 應用程式,讓開源社群的使用者能在行動裝置上享受便捷的協作體驗。

中國算力的大型實驗:解析 LongCat-2.0 的架構秘密

大型語言模型的軍備競賽從未停歇。大家可能會好奇,目前開源模型的極限在哪裡?LongCat-2.0 給出了一個相當具震撼力的答案。它是一個總參數高達 1.6 兆、每個 token 激活約 480 億參數的 MoE 模型。

這款模型完全仰賴五萬多片中國晶片完成訓練。訓練過程中消耗了超過 35 兆個 tokens,而且全程沒有遇到回滾或無法恢復的損失突刺。這證明了前沿級距的龐大運算完全有能力在特定硬體平台上穩定運行。

架構方面,開發團隊針對長篇文本的處理提出了 LongCat Sparse Attention (LSA) 機制。這個機制包含了三個互相正交的優化策略。流感知索引將原本碎片化的記憶體存取轉化為有順序的讀取,大幅增加頻寬效益。跨層索引則利用相鄰注意力層的特性來分攤運算開銷。層級化索引則是先粗略篩選再細部挑選,有效縮減處理空間。為了讓模型更聰明,團隊還加入了 N-gram Embedding 模組,將表示空間擴展了 100 倍以上。當然,為了維持模型穩定,這部分的參數比例被嚴格控制在 10% 以內。

這裡帶出一個常見問題:LongCat-2.0 適合用在哪些場景?答案非常廣泛。它全面支援 Claude Code、OpenClaw、Hermes 等主流框架,特別擅長處理程式碼理解、倉庫層級的自動修改以及複雜的智慧體任務。開發者如果想親自測試,可以直接前往其 GitHub 專案 或是 HuggingFace 頁面 下載使用。

企業版圖的暗潮洶湧:Anthropic、微軟與亞馬遜的角力遊戲

AI 市場的競爭從來就不只是技術比拚,背後的商業角力往往更像是一齣精彩的連續劇。先來看看 Anthropic 的新佈局。Claude 模型目前已經在 Microsoft Foundry 全面可用。這意味著企業可以透過 Azure 環境,使用原有的身分驗證和計費系統來執行 Opus 4.8 和 Haiku 4.5 模型。配合 NVIDIA GB300 晶片的強大算力,企業能輕易建構高規格的專屬 AI 助理。

為了解決企業內部管理多個開發者帳號的痛點,Anthropic 也推出了 Claude Apps Gateway。這個針對 Amazon Bedrock 和 Google Cloud 設計的本地端控制平面,能讓企業透過單一登入 (SSO) 來統一管理權限、設定花費上限,並且精準追蹤每個使用者的消耗。

然而,商場上沒有永遠的盟友。亞馬遜與 Anthropic 之間的關係近期似乎降到了冰點。根據報導指出,雙方重新談判的合約將迫使亞馬遜明年開始依據 token 數量來支付龐大費用。考量到亞馬遜內部的 Kiro 程式設計助理、Quick 辦公助理以及 Alexa 購物功能全數仰賴 Claude,這筆開銷絕對是個天文數字。

有趣的是,亞馬遜隨即轉向 OpenAI 承諾了 500 億美元的基礎設施投資。更戲劇化的是,當 Anthropic 推出號稱極度安全的 Fable 5 模型時,正是亞馬遜向美國政府通報了潛在的安全疑慮,導致該模型被官方限制。巧合的是,亞馬遜剛好正在準備推出自家專注於資安防護的 AI 產品。這種種跡象顯示,科技巨頭間的利益拉扯遠比我們想像的還要激烈。

隱私不出門:Rampart 如何在瀏覽器內擋下機密資訊

大家平常使用聊天機器人時,有沒有不小心輸入過自己的身分證字號或地址?這些含有個人識別資訊 (PII) 的文字一旦送出,就會傳送到遠端伺服器,使用者根本無從得知這些資料會被如何處理。這的確是個令人擔憂的安全漏洞。

為了解決這個問題,National Design Studio 開發了名為 Rampart 的開源工具(模型可至 HuggingFace 下載)。它的核心理念非常直白:只有永遠不離開裝置的資訊,才是真正安全的。Rampart 完全在瀏覽器內部運行,攔截並替換掉敏感文字後,才會把乾淨的訊息發送出去。

相較於市面上動輒好幾 GB 的隱私過濾模型,Rampart 的大小僅有 14.7MB。它結合了傳統的正規表達式規則與 MiniLM 語言模型,能精準判斷上下文。透過 WebGPU 加速,它的執行延遲只有短短的 3.9 毫秒,隱私詞彙召回率卻高達 98.42%。

有讀者可能會問:Rampart 真的能完全阻擋個資外洩嗎?它目前屬於早期的 Alpha 版本,主要作為第一道強而有力的防線。它支援英文、西班牙文等七種語言,雖然不能保證百分之百無懈可擊,但對於防範日常對話中的無心之失,已經提供了卓越的防護力。

貼近生活的專屬畫家:Gemini 懂你要的影像

科技不該只服務於冰冷的企業後台,也應該為一般人的生活帶來樂趣。Google 最近宣佈 Gemini 應用程式在美國推出基於個人偏好的免費圖像生成功能

透過授權,Personal Intelligence 系統會連結 Gmail、YouTube 或是 Google Photos 等工具。結合 Nano Banana 技術,Gemini 就像是一個認識你很久的老朋友。使用者再也不用繁瑣地上傳個人照片來當作參考圖。只要輸入一句「設計我的夢想房屋」或是「畫一張我跟最愛物品的插圖」,系統就會自動擷取相簿裡的元素,產生出極具個人風格的圖像。這讓創作過程變得無比流暢自然,大大減少了文字描述的溝通成本。

科幻情節成真:不用動刀也能讓大腦打字

把大腦的想像直接變成螢幕上的文字,這聽起來像是科幻電影的情節對吧?Meta 最新公佈的 Brain2Qwerty v2 研究,正式將這項技術往前推進了一大步。

過去,要讓大腦訊號與 AI 連結,患者通常需要接受侵入式的手術,在大腦植入電極。這種做法雖然有效,但風險極高且難以普及。Brain2Qwerty v2 則採用了完全非侵入式的做法。參與測試的志願者只需戴上腦磁圖 (MEG) 裝置進行打字,系統便會記錄大腦活動。

有別於以往繁瑣的人工特徵提取,這次團隊採用了多層神經網路模型,直接從原始腦波訊號中解碼出完整的句子。實驗結果令人振奮,單字準確率達到了 61%,遠超其他非侵入式方法的 8%。表現最好的受試者甚至達到了 78% 的準確率。

數據顯示,隨著訓練資料量增加,解碼準確率呈現對數線性的提升。這意味著未來只要收集更多資料,就能進一步縮小與侵入式手術之間的效能差距。為了加速科學界的進展,Meta 開源了完整的訓練程式碼,他們的合作夥伴也釋出了 SpanishBCBL 測試資料集。對於因腦部病變而無法順利溝通的患者來說,這項技術帶來了無比的希望。

回頭看看這些技術的躍進,從掌中手機的程式編譯,到捕捉大腦深處的微弱訊號,AI 正在以前所未有的姿態重塑各種可能性。未來的科技輪廓,已經在我們眼前逐漸清晰。

問與答(Q&A)

📱 開發工具與行動體驗

Q1:開發者現在可以如何離開電腦繼續寫程式或除錯? A: 透過 Cursor 新推出的 iOS 行動應用程式,開發者能在手機上啟動雲端虛擬機器中的代理(Agent)來測試和驗證程式碼。利用其 Remote Control 功能,甚至能用手機遠端接手正在電腦上執行的任務,並直接在 App 裡審查日誌與合併 PR 請求。此外,開源專案 OpenClaw 也已正式推出 iOS 與 Android 雙平台的應用程式,進一步擴展了行動裝置的協作體驗。

🧠 大型語言模型架構

Q2:LongCat-2.0 在架構上採用了哪些機制來提升長文本的處理效率? A: LongCat-2.0 針對長篇文本引入了 LongCat 稀疏注意力 (LSA) 機制,該機制包含了三種優化策略:流感知索引(將零碎的存取轉為順序讀取)、跨層索引(分攤連續層的運算開銷),以及層級化索引(先粗篩再細挑,縮減處理空間)。同時,它採用了 N-gram Embedding 來將表示空間擴展 100 倍以上,並嚴格將此模組的參數比例控制在 10% 以內以維持穩定優勢。

🏢 科技巨頭商業角力

Q3:為什麼亞馬遜 (Amazon) 與 Anthropic 之間的合作關係近期出現緊張? A: 雙方關係降溫主要源於計費方式的改變與利益衝突。新合約預計明年將迫使亞馬遜改依 token 數量向 Anthropic 支付費用,這對極度仰賴 Claude 模型的亞馬遜內部工具(如 Kiro、Quick 與 Alexa)將是一筆天文數字的開銷。此外,亞馬遜隨即轉向投資 OpenAI 高達 500 億美元,且在 Anthropic 推出號稱極安全的 Fable 5 模型時,亞馬遜還向美國政府通報了安全疑慮導致該模型受限,而此舉恰逢亞馬遜準備推出自家資安 AI 產品的時機。

🔒 隱私與資安防護

Q4:Rampart 如何在不犧牲隱私的情況下過濾使用者的個人資訊 (PII)? A: Rampart 的核心理念是**「資料不離開裝置」。這款僅有 14.7MB 的開源工具完全在瀏覽器內部運行**,結合了處理格式化資料(如身分證、信用卡)的確定性正規表達式,以及理解上下文(如姓名、地址)的 MiniLM 語言模型。它能在資料發送給遠端伺服器之前,在短短 3.9 毫秒內(透過 WebGPU 加速)精準攔截並替換掉敏感文字。

🎨 AI 圖像生成

Q5:Gemini 推出的個人化圖像生成功能有什麼特別之處? A: Gemini 透過 Personal Intelligence 系統與 Nano Banana 技術,能在取得使用者授權後,自動連結 Gmail、YouTube 與 Google Photos 等應用程式。使用者輸入諸如「畫一張我跟最愛物品的插圖」的提示詞時,系統會自動從相簿中擷取實際照片作為上下文,免去了過去必須手動上傳參考圖片的繁瑣過程,讓生成的圖像直接反映個人品味。

💡 醫療與前沿科技

Q6:Meta 最新的 Brain2Qwerty v2 與過去的腦波解碼技術相比有何重大進展? A: Brain2Qwerty v2 最大的突破在於完全非侵入式的設計。過去往往需要高風險的植入電極手術,現在志願者只需戴上腦磁圖 (MEG) 裝置即可。團隊透過端到端的深度學習直接從原始腦波訊號中解碼出句子,其單字準確率達到 61%,表現最好的受試者高達 78%,遠超其他非侵入式方法僅 8% 的準確率,且數據顯示只要持續增加訓練資料,準確率還能呈對數線性提升。

分享至:
Featured Partners

© 2026 Communeify. All rights reserved.