AI日報： Gemini 支援文件！騰訊離線量化翻譯模型，AWS 桌面秘書

慣。這正是 AWS 最新推出的

Teams、Google Works

別複製貼上：Gemini 現在能直接

端得力助手：Mistral Vibe

還能直接與 GitHub、Jira、

模型說實話：Anthropic 的自省適配

news

AI日報： Gemini 支援文件！騰訊離線量化翻譯模型，AWS 桌面秘書

2026-04-30

探索最新 AI 實用工具：從本機桌面助理到程式碼遠端代理的全面升級

每天盯著螢幕，看著散落各處的檔案和無數個應用程式，大家是否覺得尋找資訊的時間比實際工作的時間還要長？說實話，這幾乎是每個上班族的日常痛點。不過，最新的科技進展正悄悄改變這個局面。今天的科技圈帶來了許多令人興奮的消息。從直接整合到桌面的全新助理，到能自動輸出多種格式文件的聊天工具，再到開發者的遠端代理程式，每個更新都相當實用。這裡為大家整理了近期最值得關注的幾個重要科技發展。

辦公桌上的新朋友：Amazon Quick 如何整合所有工作軟體

想像一下，有一個工具可以完全理解使用者的工作習慣。這正是 AWS 最新推出的 Amazon Quick 桌面應用程式帶來的承諾。大多數的軟體都只能在自己的生態系裡運作，但 Quick 打破了這個限制。它直接常駐在電腦桌面上，無縫連結 Slack、Teams、Google Workspace 甚至是 Salesforce 這些日常必備工具。

很多人可能會問，把這麼多資料交給這個應用程式，安全嗎？這點完全不用擔心。這套系統從設計之初就非常注重隱私，絕對不會拿企業的內部資料去訓練別人的模型。它最令人驚豔的地方在於其超前部署的能力。如果行事曆上有兩場會議撞期，或者某個專案快到期了，它會自動發出提醒。

它不僅僅是一個問答機器人。當銷售人員剛談成一筆生意，它還能自動從長期的記憶中撈取相關負責人名單，直接草擬一封恭喜郵件。甚至可以利用自然語言，在短短幾秒鐘內打造出專屬的智慧面板與應用程式。這種將資訊整合在同一個地方的做法，確實大幅減少了切換視窗的麻煩。

告別複製貼上：Gemini 現在能直接產生各種檔案

整理開會重點或者腦力激盪後，把文字複製到 Word 或 Excel 裡重新排版，總是一件稍微煩人的小事。你知道嗎？Gemini 應用程式現在把這個步驟徹底省下來了。

使用者只需要輸入一段提示詞，就能讓它把零散的點子整理成一份完整的預算提案，或是把長篇大論的討論內容濃縮成單頁的 PDF 報告。這項功能完美解決了過去需要手動調整格式的痛點。

究竟支援哪些格式呢？除了大家最熟悉的 Workspace 檔案（包含 Docs、Sheets 和 Slides），還可以直接匯出 .pdf、.docx、.xlsx、.csv，甚至是 LaTeX、TXT、RTF 和 Markdown 等格式。目前這項功能已經向全球所有的 Gemini 應用程式使用者開放。只需要打開聊天視窗，向它說明需要的檔案類型即可，整個過程變得非常直覺。

開發者的雲端得力助手：Mistral Vibe 遠端代理

寫程式有時候就像是在解開一團毛線球。當遇到大型、多步驟的專案時，如果有一個虛擬助手可以在雲端幫忙處理，那該有多好？Mistral AI 剛發布了全新的Mistral Medium 3.5 模型，這是一個擁有 128B 參數的強大語言模型，將理解指令、邏輯推演與撰寫程式的能力完美結合。

伴隨這個模型登場的是 Vibe 中的遠端代理功能。過去，這些代理程式通常只能在個人電腦上運行。現在，開發者可以把繁重的任務丟到雲端，讓它們在背景平行處理。當代理程式完成除錯、重構程式碼或是生成測試時，就會自動發送通知。

它還能直接與 GitHub、Jira、Slack 串接。這意味著什麼呢？這代表開發者只需要在 Le Chat 或 Vibe CLI 裡下達指令，然後就可以安心去喝杯咖啡，把剩下的時間留給更有創造力的工作。所有的工具呼叫和思考邏輯都是完全透明的，使用者可以隨時查看進度並進行干預。

網頁搜尋與多重對話：Google AI Studio 開發體驗升級

對於經常需要查閱最新技術文件的開發者來說，Google AI Studio 帶來了兩個非常實用的更新，分別是網頁搜尋與多重對話功能。

為什麼能即時聯網這麼重要？因為技術更新的速度總是一日千里。過去的模型往往受限於訓練資料的時間點，提供的資訊有時候會略顯過時。現在有了即時聯網的加持，程式開發代理可以直接從網路上抓取最新的官方文件來輔助對話，確保提供的解決方案是最符合現狀的。

此外，多重對話功能讓使用者可以隨時開啟一個全新的對話視窗去測試新想法，然後再輕鬆跳回之前的專案繼續工作。這種流暢的切換體驗，確實大幅減少了開發過程中的摩擦感，讓思路可以更加連貫。

讓模型說實話：Anthropic 的自省適配器研究

隨著大型語言模型變得越來越聰明，了解它們到底學到了什麼變成了一個大難題。這就像是人類很難解釋自己的潛意識一樣。為了解決這個問題，Anthropic 發表了一項名為 Introspection Adapters (自省適配器) 的研究成果。

研究團隊透過微調技術，訓練出一個特殊的 LoRA 適配器。當這個適配器應用到各種不同模型上時，居然能讓這些模型用自然語言「報告」出自己隱藏的行為模式。這在人工智慧安全性審查上是一個巨大的進步。

舉例來說，如果一個模型被惡意植入了某種後門，或者學會了某種不當的行為。有了這個適配器，審查人員只需要直接提問，模型就會誠實地把問題交代出來。這項技術目前在多個審查測試中都達到了最頂尖的表現，也為未來的安全防護提供了一個非常有潛力的方向。

突破硬體限制：Hy-MT1.5 帶來的離線翻譯革命

最後，來聊聊手機上的日常應用。如果要在沒有網路的情況下，進行高品質的即時翻譯，通常會面臨手機記憶體不足的問題。騰訊開源的Hy-MT1.5-1.8B-1.25bit 模型，完美地解決了這個痛點。

這是一個擁有 18 億參數的翻譯模型，支援高達 33 種語言和 1056 個翻譯方向。更厲害的是，開發團隊使用了名為 Sherry 的極端量化技術。這聽起來可能有點艱澀，簡單來說，他們把原本高達 3.3GB 的模型，成功壓縮到了只有 440MB，足足縮小了非常多。

而且，這一切的代價幾乎沒有損失任何準確度。它甚至比許多大型商業翻譯軟體表現得還要好。大家現在就可以去下載 Android 測試版，親自體驗這種完全離線、卻又無比精準的翻譯服務。只需要一支普通的手機，就能讓語言不再是溝通的障礙。

問與答

Q1：Amazon Quick 是什麼？它與一般的 AI 助理有何不同？ A1： Amazon Quick 是一款常駐在電腦桌面的 AI 應用程式，打破了單一軟體生態系的限制，能無縫連結 Slack、Teams、Google Workspace 和 Salesforce 等日常工具。它最大的不同在於具備「主動性（超前部署）」，會在背景監控並主動提醒即將到期的專案或撞期的會議。此外，它注重隱私，絕對不會使用企業資料來訓練別人的模型。

Q2：Gemini 的新功能如何解決「複製貼上」的煩惱？ A2： Gemini 應用程式現在允許使用者直接透過提示詞生成各種檔案，將零散點子直接轉換成完整的報告或提案。它支援匯出多種常見格式，包含 Workspace 檔案（Docs、Sheets、Slides），以及 .pdf、.docx、.xlsx、.csv、LaTeX、TXT、RTF 和 Markdown，使用者甚至不需要離開聊天視窗就能下載檔案。

Q3：Mistral 新發布的 Vibe 遠端代理能為開發者帶來什麼好處？ A3： 藉由擁有 128B 參數的 Mistral Medium 3.5 模型驅動，Vibe 遠端代理讓開發者可以將繁重的寫程式任務移交到雲端背景平行處理。它能直接與 GitHub、Jira 和 Slack 等工具串接，開發者只需在 Le Chat 或 Vibe CLI 下達指令，代理程式便會自動執行除錯、開啟 Pull Request，並在完成時發出通知，大幅釋放開發者的時間。

Q4：Google AI Studio 新增的「網頁搜尋」與「多重對話」功能為何重要？ A4： 由於技術文件更新極快，Google AI Studio 引入的「即時網頁搜尋」功能可以讓程式開發代理直接從網路抓取最新的官方文件，確保提供的解答符合最新現狀。而「多重對話」功能則讓開發者能隨時開啟新對話去測試新想法，並能無縫跳回原先的專案，保持開發思路的連貫性。

Q5：Anthropic 的「自省適配器 (Introspection Adapters)」技術有何突破？ A5： 這項技術解決了人類難以了解 AI 模型潛在行為的問題。研究團隊訓練出一個特殊的 LoRA 適配器，當套用到其他模型上時，能讓這些模型用自然語言誠實地「報告」出自己隱藏的行為模式（例如是否被惡意植入後門或學到不當行為）。這為 AI 的安全性審查提供了強大的防護工具。

Q6：騰訊開源的 Hy-MT1.5 模型如何解決手機離線翻譯的硬體限制？ A6： 騰訊的 Hy-MT1.5-1.8B-1.25bit 模型支援 33 種語言和 1056 個翻譯方向，並使用了名為 Sherry 的極端量化技術（1.25-bit）。這項技術成功將原本高達 3.3GB 的模型大幅壓縮至 440MB，且幾乎沒有損失任何準確度，讓普通手機在沒有網路的情況下也能流暢執行媲美商業水準的即時翻譯。

分享至:

Featured Partners

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

Recommended for You

A …

news

AI 日報｜OpenAI Astra 攻克十項數學難題、AMD 開源 16B MoE 模型

💡 此文章是自動產生，於每天早上九點自動更新。 AI 日報 | 2026-08-02 模型發布/更新 Instella-MoE-16B-A3B — AMD 一言以蔽之：AMD 發布完全開源的混合專家（MoE）大語言模型，專為 Instinct GPU 架構進行硬體最佳化。核心亮點：總引數規模達到 160 億，每個 Token 推理時僅啟用 28 億引數，顯著降低運算資源需求。全程於 AMD Instinct MI300X 及 MI325X GPU 平臺上從零完成訓練。完全開源模型權重與訓練細節，推動開源社群對多元硬體架構的適配。技術規格：16B 總引數（2.8B 啟用引數） / 完全開源 / Hugging Face 託管傳送門：MarkTechPost 報導頁面產品發布/更新 Stacked PRs 堆疊式 Pull Request — GitHub 更新內容：GitHub 正式推出堆疊式 Pull Request 功能，允許開發者將龐大的程式碼變更拆分為數個具相依關係的小型 PR。此功能簡化了團隊審查大型專案的流程，加速版本發布效率。適用人群：軟體工程師 / 開發團隊主管 / 開源專案維護者體驗通道：Large changes are hard to review. Smaller pull requests make them easier to ship. Stacked PRs are now on GitHub.https://t.co/gb5eO9DTDD pic.twitter.com/qrBWa3BAcs

Aug 2, 2026 Read →

A …

news

AI日報｜GPT-5.6 大幅降價、Anthropic 揭 Claude 意外連網事件、Gemini Robotics ER 2 登場

AI日報｜GPT-5.6 大幅降價、Anthropic 揭 Claude 意外連網事件、Gemini Robotics ER 2 登場模型發布/更新 Inkling-Small MoE 開源權重模型 — Thinking Machines Lab 一言以蔽之：Thinking Machines 推出 Inkling-Small 開源 MoE 模型，僅 12B 啟用引數即達到原版 Inkling 近乎同等的智慧表現。核心亮點：總引數 276B，單個 token 僅啟用 12B 引數，原生支援語音、視覺與 1M 上下文視窗。在 Terminal-Bench 2.1、HLE 和 SWE-Bench Verified 等評測上超越 41B 啟用的前代版本，提供 NVFP4 與 GGUF 量化版。技術規格：276B 總引數 (12B 啟用) / 開源 MoE 模型 / NVFP4 & GGUF 傳送門：Thinking Machines 官方新聞 K-EXAONE 2.0 750B 主權 AI 模型 — LG AI Research 一言以蔽之：LG AI Research 開源韓國主權 AI 基座模型 K-EXAONE 2.0，採用 Apache 2.0 協議並支援 10 種語言。核心亮點：總引數達 750B（啟用 37B），比前代擴大 3 倍，長上下文表現登頂 Ko-LongBench。支援 Tau3-Bench 工具呼叫與程式碼生成，安全性評測 ROK-Fortress 取得 94.6 高分。技術規格：750B 總引數 (37B 啟用) / Apache 2.0 開源協議 / 支援多語言傳送門：Hugging Face 儲存庫 P-Image-Ideogram 影像模型家族 — Ideogram & PrunaAI 一言以蔽之：Ideogram 聯合 PrunaAI 推出 P-Image-Ideogram 系列模型，每張生成成本最低僅 $0.003。核心亮點：提供 4 種品質模式，支援原生 1K/2K 影像生成與高品質文字排版（Typography）。支援 JSON 提示詞與版面佈局控制，已在 API、ComfyUI 及 Replicate 等平臺上線。技術規格：商業閉源影像生成模型 / 兼具速度與文字渲染品質傳送門：Today, we're introducing P-Image-Ideogram: a family of Pareto-optimal image models with the best quality-speed-cost trade-off, co-developed with @PrunaAI. Four quality modes. Native 1K and 2K generation. From $0.003 per image. Live now on the API and all our partner platforms.… pic.twitter.com/vcRPMMJy3v

Jul 31, 2026 Read →

A …

news

AI日報｜OpenAI 發布 GPT-5.6 系列模型、Grok Voice Think Fast 2.0 推出語音功能、Replit Design 上線

AI日報｜OpenAI 發布 GPT-5.6 系列模型、Grok Voice Think Fast 2.0 推出語音功能、Replit Design 上線模型發布/更新 Lyria 3.5 — Google DeepMind 一言以蔽之：Google DeepMind 發表新一代音樂生成模型 Lyria 3.5，全方位提升旋律、歌詞、人聲表現力與精確 BPM 創作控制。核心亮點：具備更強的旋律結構意識與歌詞提示詞遵循能力，能生成豐富且具情感層次的真人般人聲。支援精確設定 BPM 節奏並可直接匯出全曲分軌，同步於 Google Flow Music 登場。技術規格：音樂生成多模態模型 / 閉源 API 服務傳送門：Google DeepMind 部落格 Grok Voice Think Fast 2.0 — xAI 一言以蔽之：xAI 推出新一代語音模型 Grok Voice Think Fast 2.0，主打真實複雜場景下的超低延遲對話與抗噪能力。核心亮點：首段音訊平均回應時間僅 0.70 秒，在 Tau Voice AI Agent 測試中取得 56.5% 的業界最高分。專為真實環境打造，能於高雜音環境中精準辨識語音並進行複雜工作流推理。技術規格：語音對語音多模態模型 / API 定價為每小時 $4.80 傳送門：Announcing Grok Voice Think Fast 2.0, our next-generation voice model with improved intelligence, transcription accuracy, and conversational capabilities.https://t.co/XUiX1CouKz pic.twitter.com/Nel3zwzkwY

Jul 30, 2026 Read →

AI日報： Gemini 支援文件！騰訊離線量化翻譯模型，AWS 桌面秘書

探索最新 AI 實用工具：從本機桌面助理到程式碼遠端代理的全面升級

辦公桌上的新朋友：Amazon Quick 如何整合所有工作軟體

告別複製貼上：Gemini 現在能直接產生各種檔案

開發者的雲端得力助手：Mistral Vibe 遠端代理

網頁搜尋與多重對話：Google AI Studio 開發體驗升級

讓模型說實話：Anthropic 的自省適配器研究

突破硬體限制：Hy-MT1.5 帶來的離線翻譯革命

問與答

scribis.app

videoweaver.app

DMflow.chat

DMflow.chat

scribis.app

videoweaver.app

DMflow.chat

DMflow.chat

Recommended for You

AI 日報｜OpenAI Astra 攻克十項數學難題、AMD 開源 16B MoE 模型

AI日報｜GPT-5.6 大幅降價、Anthropic 揭 Claude 意外連網事件、Gemini Robotics ER 2 登場

AI日報｜OpenAI 發布 GPT-5.6 系列模型、Grok Voice Think Fast 2.0 推出語音功能、Replit Design 上線

Leaving Website