騰訊開源 Hy-MT2 翻譯模型：1.25-bit 極限量化技術如何讓終端設備輕鬆搞定多語種翻譯

功拉近了與 Gemini 3.1 P

Pro 與 Kimi 等知名開源

都可以透過 HuggingFace 或 Mod

ace 或 ModelScope 平台輕鬆取

擊敗了微軟（Microsoft）與豆包等多

tool

騰訊開源 Hy-MT2 翻譯模型：1.25-bit 極限量化技術如何讓終端設備輕鬆搞定多語種翻譯

2026-05-25

騰訊 Hy-MT2 翻譯模型全解析：極限量化技術如何顛覆終端多語種交流

語言隔閡一直以來都是國際交流中最棘手的痛點。處理高達 33 種語言的雙向翻譯，聽起來就像是一項需要耗費整座伺服器農場算力才能辦到的超級任務。老實說，過去的情況的確如此。不過現今人工智慧的發展正朝著一個非常有趣的微型化方向前進。大腦變得越來越聰明，體積卻縮減得越來越迷你。

你知道嗎？要在普通大眾的手機上順暢運行複雜的 AI 模型，同時確保設備不會在短短十分鐘內耗盡電量發燙，曾經只是一個遙不可及的夢想。現在，這項技術已經悄悄成為現實。騰訊團隊最新發布的 Hy-MT2 多語種翻譯模型帶來了令人矚目的突破。這是一個主打「快思維」且專注於解決真實應用情境的全新模型家族。接下來我們將仔細拆解這個模型背後的技術細節，看看它是如何兼顧高品質翻譯與極低硬體需求的。

模型規模與混合專家架構的巧妙平衡

大家肯定會好奇，這個新模型到底有什麼特別之處？這得從它極其完整的陣容組合開始說起。Hy-MT2 系列一共包含了 1.8B、7B 以及採用混合專家架構 (MoE) 的 30B-A3B 等多種尺寸。大型語言模型通常會面臨一個難以迴避的兩難局面：模型參數越大越能精準理解複雜的語境，隨之而來的卻是極其高昂的運算成本。

為了解決這個問題，30B-A3B 巧妙地利用了混合專家架構。這就像是一間極具規模的大型綜合醫院。病患只需要掛號尋求特定專科醫生的協助，完全不需要驚動整棟大樓所有的醫療人員來進行會診。這樣的設計讓模型能夠在翻譯效果和推理效率之間取得絕佳平衡。根據社群的實測回饋，這項架構讓 Hy-MT2 成功拉近了與 Gemini 3.1 Pro 以及 GPT-5.5 等頂尖閉源模型之間的效能差距。它能夠在不拖垮硬體資源的前提下，展現出驚人的指令遵循能力。

突破硬體限制的 AngelSlim 1.25-bit 極限量化魔法

接下來要聊聊真正讓人驚豔的部分，也是這次發布會中最具話題性的技術亮點。對於講求極低延遲的邊緣運算設備而言，過去的模型體積實在有點太過笨重。對於講求極低延遲的邊緣運算設備而言，這個體積實在有點太過笨重，運作起來也難以滿足即時翻譯的需求。

為了解決終端設備的部署難題，開發團隊端出了名為 AngelSlim 的 1.25-bit 極限量化技術。聽起來似乎有些生硬複雜對吧？簡單來說，這就像是把一套厚重無比的百科全書，完美濃縮成幾張能夠隨身攜帶的小字卡。最厲害的是，查閱這些字卡時，任何關鍵細節都沒有一絲遺漏。這項技術硬生生地將 1.8B 輕量級模型的儲存需求縮減至區區 440 MB。

只有 440 MB！這個容量甚至比大家手機裡隨便下載的一款休閒遊戲還要小巧。體積雖然大幅縮小，效能表現卻呈現爆發性的反向成長。體積雖然大幅縮小，效能表現卻呈現爆發性的反向成長，它的推論速度足足提升了 1.5 倍。這意味著即使是幾年前的舊款手機，也能毫無壓力地執行專業級別的翻譯任務。

圖解：嚴格遵循複雜指令的卓越表現

許多開發者在實作時常會遇到一個頭痛的問題，那就是模型很容易在翻譯過程中「自作主張」，隨意更改程式碼標籤或是變數名稱。Hy-MT2 特別針對這點進行了強化。

以下圖表源自官方提供的中英文翻譯任務指令範例，從中可以清楚看到模型是如何處理那些帶有嚴格限制條件的結構化數據翻譯任務：

結構化數據 (Structured Data)	中文指令範例 (Source)	英文翻譯對照 (Target)
Structured Data 1	# 任務目標將下方 `{{source.text}}` 中的 `{{format.type}}` 格式數據翻譯為 `{{target.lang}}`。 # 嚴格約束 1. 結構鎖定：絕對保持原有的 `{{format.type}}` 數據結構、縮進和層級完全不變。 2. 選擇性翻譯：僅翻譯向用戶展示的可見文本內容。 3. 禁止修改：嚴禁翻譯或更改任何代碼標籤、鍵名(Key)、變量佔位符(如 `{{var}}` 等)或代碼屬性。 # 數據輸入 `{{source.text}}`	### Task Translate the user-facing text within the following `{{format.type}}` data into `{{target.lang}}`. ### Strict Rules 1. Structure Preservation: You MUST preserve the original `{{format.type}}` data structure, nesting, hierarchy, and indentation exactly as they are. 2. Selective Translation: Translate ONLY the visible, user-facing text content/values. 3. Strict Non-Translation: NEVER translate or alter code tags, keys, properties, object names, or variable placeholders. Leave them exactly in their original English/code form. ### Source Data `{{source.text}}`
Structured Data 2	【背景信息】 `{{background.text}}` 請結合背景信息將以下文本翻譯為 `{{target.lang}}`。【待翻譯文本】 `{{source.text}}`	[Background Information] `{{background.text}}` Please translate the following text into `{{target.lang}}`, taking the provided background information into consideration. [Source Text] `{{source.text}}`

從上方的表格可以發現，無論是面對需要絕對保持縮排不變的 JSON 格式，還是帶有複雜變數佔位符的字串，Hy-MT2 都能夠完美區分「需要翻譯的使用者可見文字」與「必須保留的程式碼結構」。這對於負責軟體在地化或網站多語系切換的工程師來說，簡直是一大福音。

效能評測與超越商業 API 的亮眼成績

許多人可能會懷疑，經過極限壓縮後，翻譯品質肯定會大打折扣吧？結果卻出乎意料。它並未妥協於品質，整體的翻譯表現甚至直接超越了市面上微軟與豆包等多款主流的商業 API。

7B 模型專屬頁面所展示的內部測試數據也表明，較大尺寸的版本同樣擊敗了 DeepSeek-V4-Pro 與 Kimi 等知名開源對手。為了讓社群有更客觀的評估標準，官方團隊同步開源了名為 IFMTBench 的評量基準測試。這套標準專門用來檢驗模型遵循複雜翻譯指令的能力，讓開發者在後續微調時能有明確清晰的參考依據。

開發者資源與國際級賽事挑戰

擁有一款如此輕量又強悍的翻譯工具後，下一步自然是將其推向更廣闊的應用舞台。任何人都可以透過 HuggingFace 或 ModelScope 平台輕鬆取得這些模型檔案。若想要快速將翻譯功能整合到現有的專案中，大家也能前往 ClawHub 與 SkillHub 下載專屬的「Hy-MT2-Translator Skill」模組，整個開發流程變得無比順暢。

騰訊目前也正與國際知名的機器翻譯大會 WMT26 展開密切合作，共同舉辦兩項極具挑戰性的國際賽事。第一項是影片字幕翻譯任務，這需要模型在精準翻譯的同時兼顧畫面時間軸與口語化語氣。第二項則是涵蓋更廣泛情境的通用機器翻譯任務。這兩場賽事正廣泛邀請全球的技術好手共同參與。

常見問題解密：你最想知道的 Hy-MT2 實用細節

看完這麼多技術原理，或許大家心裡還有幾個實務上的疑問。以下整理了關於這個模型最受關注的幾個重點解答：

Q1：什麼是騰訊的 Hy-MT2 模型？支援哪些語言？ A：Hy-MT2 是一個主打「快思維（fast-thinking）」的多語種翻譯模型系列，支援高達 33 種語言的互相翻譯。該系列針對不同的運算需求，提供了 1.8B、7B 以及採用混合專家架構（MoE/MoaE）的 30B-A3B 三種不同尺寸的模型。

Q2：Hy-MT2 在終端設備（如手機）上的部署有什麼突破性進展？ A：為了解決終端設備的硬體限制，團隊運用了「AngelSlim 1.25-bit 極限『量化』技術」。這項技術成功將 1.8B 輕量級模型的儲存空間大幅壓縮至只有 440 MB，同時還讓推論速度提升了 1.5 倍，讓一般設備也能順暢執行專業翻譯。

Q3：與其他開源模型或商業 API 相比，Hy-MT2 的翻譯表現如何？ A：表現非常亮眼。根據官方數據，較大尺寸的 7B 與 30B-A3B 模型超越了 DeepSeek-V4-Pro 與 Kimi K2.6 等知名開源對手；而即便是體積最小的 1.8B 輕量級模型，其整體的翻譯表現也成功擊敗了微軟（Microsoft）與豆包等多款主流商業 API。

Q4：對於開發者來說，官方提供了哪些實用的開源資源？ A：開發者可以透過 HuggingFace 或 ModelScope 平台取得模型檔案。此外，官方也同步開源了名為「IFMTBench」的評量基準，專門用來檢驗模型遵循翻譯指令的能力。若想快速將翻譯功能整合到專案中，開發者還可前往 ClawHub 與 SkillHub 下載專屬的「Hy-MT2-Translator Skill」模組。

Q5：Hy-MT2 接下來有什麼國際賽事或技術挑戰可以關注？ A：騰訊目前正與知名的國際機器翻譯大賽 WMT26 展開官方合作，共同舉辦「通用機器翻譯任務」與挑戰性極高的「影片字幕翻譯任務」。官方也廣泛邀請全球開發者使用 Hy-MT 系列模型參賽，共同推動機器翻譯技術的發展。

分享至:

Featured Partners

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

Recommended for You

語 …

tool

語音翻譯的全新標竿：Gemini 3.5 Live Translate 核心技術與競品深度解析

打破語言隔閡的自然對話：Gemini 3.5 Live Translate 語音翻譯完全解析 Google 最新推出的 Gemini 3.5 Live Translate 讓即時語音翻譯變得前所未有地自然。本文將為您解析這項技術的獨特之處、各種實用情境，以及它與市面上其他主流翻譯工具的詳細差異。想像一下參加一場跨國會議，或是獨自走在異國街頭。當語言成為溝通的障礙時，人們通常會拿出手機，對著螢幕講話，然後尷尬地等待系統把語音轉成生硬的文字與機械音。這種體驗往往讓人感到十分抽離。 2026 年 6 月 9 日，Google 正式對外發布了全新的 Gemini 3.5 Live Translate 語音模型。這項基於 Gemini 3 Pro 構建的新技術，支援超過 70 種語言的即時語音對語音翻譯。它已經完全超越了單純的字義轉換。系統現在能提供近乎真人同聲傳譯的流暢對話感，為跨語系交流帶來了全新的可能性。為什麼這次聽起來這麼像真人？許多人可能會好奇，同樣是語音翻譯，為什麼這款新模型聽起來特別不一樣？老實說，關鍵就在於底層架構的徹底翻新。過去的即時翻譯工具大多採用繁瑣的三步驟流程。系統會先進行語音轉文字，接著翻譯這些文字，最後再利用語音合成技術念出來。這個過程不可避免地會增加延遲，甚至容易累積辨識錯誤。Gemini 3.5 這次採用了一氣呵成的單一音訊處理架構。系統直接接收聲音並輸出聲音，完全省略了中間的文字轉換瓶頸。連續串流處理是另一個亮點。傳統模式往往需要等說話者完全說完並停頓後，系統才開始運算。現在的 Gemini 3.5 能夠在講者還在發言時持續處理資訊。它的延遲時間大幅縮短到大約 1.8 至 3 秒鐘。這種設計在等待上下文語意與即時翻譯之間取得了極佳的平衡，成功告別了過去那種讓人焦躁的尷尬停頓。你知道嗎？它最讓人驚豔的地方其實是語氣的保留。新模型產生的不再是冷冰冰的機器聲。系統能夠精準複製原說話者的語調、節奏與音高。這表示當你帶著激動的情緒說話時，翻譯出來的聲音同樣會充滿熱情，讓整場對話聽起來自然且極具人情味。四種讓人意想不到的實用場景這項技術目前已經同步部署於多個核心平台，滿足了從一般大眾到企業開發者的各種需求。讓我們來看看幾個具體的應用方式。對於一般用戶而言，Google 翻譯 App 推出了一項非常貼心的「聽筒模式」。特別是在 Android 設備上，使用者只需像平常講電話一樣把手機貼在耳邊，就能直接聽見翻譯後的語音。這種設計免除了必須配戴耳機的麻煩，同時也極大地保護了對話的隱私。企業級的溝通同樣獲得了巨大的升級。Google Meet 現在支援的語言組合有了爆發性的成長。會議中的語言配對從原本僅限於 5 種與英語相關的組合，瞬間擴展到 2,000 多種雙向語言組合。不論是日語直接轉譯為西班牙語，還是國語轉換為瑞典語，都能在同一場視訊會議中輕鬆完成。針對專業領域，例如跨國 IT 支援，這款模型也展現了極高的準確度。它具備高達 128K 的音訊上下文記憶容量，這代表系統能記住好幾分鐘前的對話脈絡。在網路工程師的實際測試中，系統能夠精準辨識並保留「BGP」、「OSPF」、「VLAN」等專業術語。它不會死板地將這些詞彙直譯，大幅降低了技術溝通上的誤解。對於開發團隊來說，Live API 帶來了無限的整合潛力。東南亞大型叫車平台 Grab 已經率先導入了這項 API。他們目前每個月為上千萬次通話提供服務，讓在地司機與跨國旅客能夠毫無障礙地透過語音確認接送細節。

Jun 16, 2026 Read →

G …

tool

Google 推出 TranslateGemma：基於 Gemma 3 的高效能開源翻譯模型詳解

Google 於 2026 年 1 月正式發布 TranslateGemma，這是一套基於 Gemma 3 架構構建的全新開源翻譯模型系列。本文將詳細解析其如何透過 4B、12B 與 27B 三種參數規模，在保持輕量化的同時實現超越前代的高品質翻譯，並深入探討其獨特的訓練技術與多模態能力。對於開發者和語言研究人員來說，2026 年 1 月 15 日是個值得注意的日子。Google 在這一天正式向大眾介紹了 TranslateGemma。這並非只是另一個普通的語言模型更新，而是一套專門為了打破語言隔閡而生的開源翻譯模型。它是基於強大的 Gemma 3 架構所構建，這意味著什麼？簡單來說，這套模型讓高品質的翻譯不再是大公司的專利，無論使用者身處何地、手邊拿的是高階伺服器還是普通的手機，都能享受到流暢的跨語言溝通體驗。這套模型的出現，解決了一個長期存在的問題：如何在不犧牲準確度的前提下，讓模型跑得更快、更省資源？TranslateGemma 給出的答案相當令人驚艷，它支援 55 種核心語言，甚至在某些測試中，小尺寸模型的表現還贏過了體積大上一倍的舊款模型。小而強大：重新定義模型效率在過去，我們常有一種迷思，認為模型參數越大，效果一定越好。但 TranslateGemma 這次展示的技術成果，可能會讓人重新思考這件事。這系列模型提供了三種規格，分別是 4B（40 億參數）、12B（120 億參數）以及 27B（270 億參數）。這三種尺寸並非隨意設定，而是經過精心考量以適應不同的運作環境： 4B 模型：這是為了行動裝置和邊緣運算（Edge Deployment）所設計的輕量級選手。想像一下，在沒有網路連線的手機上也能進行高品質的即時翻譯，這就是 4B 模型的強項。它的表現甚至足以匹敵之前更大的 12B 基準模型。 12B 模型：這可能是對開發者最友善的版本。它被設計成可以在一般的消費級筆記型電腦上流暢運行。根據 MetricX 在 WMT24++ 基準測試的結果，這個 12B 版本的表現竟然超越了 Gemma 3 的 27B 基準模型。這意味著開發者可以用不到一半的運算資源，獲得同等甚至更好的翻譯品質。這對於本地端開發環境來說，是一個巨大的勝利。 27B 模型：為了追求極致準確度而生。這款模型雖然體積最大，但依然保持了良好的效率，能夠在單張 H100 GPU 或雲端 TPU 上運行，適合需要處理大量數據或對精準度有極高要求的企業級應用。說實話，能把模型做小不難，但要在做小的同時還讓性能翻倍，這才是真正的技術門檻。TranslateGemma 透過特殊的蒸餾技術，將大型模型的知識濃縮進這些緊湊的架構中，實現了效率與品質的雙贏。

Jan 16, 2026 Read →

騰 …

tool

騰訊開源新霸主 HY-MT1.5：筆電也能跑的 1.8B 翻譯模型，速度快到讓你忘記雲端

騰訊混元團隊最新發布的開源翻譯模型 HY-MT1.5 正式亮相。這次更新帶來了兩個版本：極致輕量的 1.8B 模型與性能強悍的 7B 模型。其中 1.8B 版本憑藉僅 1GB 的記憶體佔用和 0.18 秒的超低延遲，讓「離線高品質翻譯」成為現實。本文將深入解析這款模型的技術細節、部署優勢以及它如何挑戰現有的商業翻譯 API。翻譯模型的瘦身革命：為什麼你需要關注 HY-MT1.5？提到高品質的機器翻譯，大家腦海中浮現的往往是那些運行在龐大伺服器上的巨型模型。想要精準？你就得忍受雲端 API 的延遲和潛在的隱私風險。想要速度？過去的離線模型往往翻譯得一塌糊塗。但騰訊混元團隊剛剛發布的 HY-MT1.5 似乎打破了這個僵局。這不僅僅是一次常規的版本更新。HY-MT1.5 包含兩個版本：1.8B 和 7B。這兩個模型支援 33 種語言的互譯，甚至還囊括了 5 種民族和方言變體。最讓人驚訝的是那個 1.8B 的小傢伙，它在 Hugging Face 上一經發布就衝上了熱門榜首。為什麼？因為它證明了一件事：你不需要昂貴的 H100 顯卡，甚至不需要聯網，就能在自己的筆記本電腦、甚至是樹莓派這樣的邊緣設備上，獲得媲美商業軟體的翻譯體驗。輕量級的奇蹟：1.8B 模型的邊緣運算優勢讓我們來談談數字，因為這裏的數字實在太性感了。 HY-MT1.5-1.8B 模型的參數不到其 7B 版本的四分之一，但它的性能卻沒有因此大打折扣。根據官方的技術報告，經過量化處理後，這個模型可以部署在各種邊緣設備上。這意味著什麼？這意味著你的翻譯數據不需要離開你的設備，隱私得到了絕對保障。更誇張的是它的資源佔用率。它只需要大約 1GB 的記憶體空間。沒錯，就是現在隨便一支低階手機都能輕鬆負擔的大小。在速度方面，它展現了驚人的爆發力：處理 50 個 Token 僅需 0.18 秒。這種低延遲的特性，讓它成為即時翻譯場景的完美選擇。無論是即時字幕生成、跨境電商的即時客服，還是嵌入式系統中的多語言介面，這個模型都能輕鬆駕馭。你可以在 Hugging Face 上親自體驗這個小巨人的威力。對於那些受夠了雲端 API 延遲的開發者來說，這無疑是一個令人興奮的替代方案。性能怪獸：7B 模型與商業競品的對決如果你對資源不那麼敏感，而更追求極致的翻譯品質，那麼 HY-MT1.5-7B 版本就是為你準備的。這個版本是騰訊 WMT25 冠軍模型的升級版。它不僅僅是堆砌參數，更是在「解釋性翻譯」和「混合語言場景」上進行了專門優化。在技術評測中，7B 版本的表現超越了許多中型模型，甚至在某些指標上可以與 Gemini 3.0 Pro 的 90% 性能相抗衡。

Jan 13, 2026 Read →

騰訊開源 Hy-MT2 翻譯模型：1.25-bit 極限量化技術如何讓終端設備輕鬆搞定多語種翻譯

騰訊 Hy-MT2 翻譯模型全解析：極限量化技術如何顛覆終端多語種交流

模型規模與混合專家架構的巧妙平衡

突破硬體限制的 AngelSlim 1.25-bit 極限量化魔法

圖解：嚴格遵循複雜指令的卓越表現

效能評測與超越商業 API 的亮眼成績

開發者資源與國際級賽事挑戰

常見問題解密：你最想知道的 Hy-MT2 實用細節

DMflow.chat

DMflow.chat

videoweaver.app

scribis.app

DMflow.chat

DMflow.chat

videoweaver.app

scribis.app

Recommended for You

語音翻譯的全新標竿：Gemini 3.5 Live Translate 核心技術與競品深度解析

Google 推出 TranslateGemma：基於 Gemma 3 的高效能開源翻譯模型詳解

騰訊開源新霸主 HY-MT1.5：筆電也能跑的 1.8B 翻譯模型，速度快到讓你忘記雲端

Leaving Website