騰訊混元再出招！開源四款輕量級 AI 模型，讓筆電手機都能跑的智慧大腦

騰訊混元團隊再次震撼 AI 社群，正式開源四款從 0.5B 到 7B 的小尺寸模型。這些模型專為消費級硬體設計，具備驚人的 256k 長文本處理能力與強大的 Agent 功能，讓高效能 AI 不再是雲端巨獸的專利，你的筆電、手機也能擁有一個聰明的 AI 大腦。

就在大家還在討論大型語言模型需要多強大的運算資源時，騰訊混元團隊悄悄地投下了一顆震撼彈，宣布開源四款全新的小尺寸模型，參數規模涵蓋 0.5B、1.8B、4B 及 7B。

這不是一次單純的模型縮小，而是一次精心策劃的 AI 普及行動。這意味著，強大的人工智慧不再只存在於遙遠的雲端伺服器機房，而是能真正走進我們的日常生活，在筆記型電腦、手機、智慧座艙，甚至是智慧家電中流暢運行。

不只是縮小，更是為「端側」而生的智慧核心

你可能聽過「端側 AI」（Edge AI），這聽起來有點技術性，但概念其實很簡單：就是讓 AI 直接在你的裝置上運算，而不是把資料傳到雲端再傳回來。這樣做的好處顯而易見——反應更快、隱私更有保障。

騰訊這次推出的四款模型，正是為這個趨勢而生。它們經過特別設計，專為消費級顯示卡進行優化，功耗更低，非常適合在資源有限的裝置上部署。

更重要的是，這項計畫已經獲得了 Arm、高通 (Qualcomm)、Intel、聯發科技 (MediaTek) 等全球頂尖晶片製造商的支持。這代表什麼？這代表這些模型從設計之初就考慮到了與我們日常裝置的硬體相容性，確保了它們能夠順利地在各種平台上發揮效能。

快思慢想，一個模型兩種聰明

這次混元模型最有趣的一點，是它們支援所謂的「融合推理模型」（Hybrid Reasoning）。這讓模型具備了兩種思考模式，就像我們人類一樣。

快思考模式： 當你只需要一個快速、簡潔的答案時，它能立刻給你高效的回應。就像你問「將文字轉為英文？」，它會直接告訴你結果，不囉嗦。
慢思考模式： 當面對複雜問題時，例如「幫我規劃一趟為期五天的東京自由行，包含預算和交通建議」，模型會啟動更深度的推理模式，一步步拆解問題，提供更全面、更有條理的答案。

這種彈性設計讓開發者可以根據應用場景自由選擇，無論是需要快速反應的即時助理，還是需要深度思考的分析工具，都能找到最適合的運作方式。

數字會說話：實測數據見真章

當然，「快思慢想」的概念聽起來很棒，但這些模型在壓力下的實際表現如何？騰訊官方公佈的基準測試成績給出了答案。在涵蓋語言理解 (MMLU)、數學推理 (GSM8K, MATH) 到複雜任務拆解 (BBH) 等多個業界公認的評測集上，混元系列小模型展現了與其尺寸不相稱的強大實力。

從上方的圖表可以清楚看到，隨著模型參數從 0.5B（淺藍色）增加到 1.8B（中藍色）再到 4B（深藍色），在各項評測上的分數都有顯著且穩定的提升。

讓我們來看看幾個關鍵指標：

在考驗綜合知識與能力的 MMLU 評測上，4B 模型達到了 74.0 分。
在考驗數學應用題能力的 GSM8K 上，4B 模型更是取得了 87.5 的高分。
而在另一項更具挑戰性的數學推理評測 MATH 中，4B 模型也拿下了 72.3 分。

這些數據證明了混元模型架構的優越性和訓練策略的有效性，即便是小尺寸模型，也能在核心能力上媲美許多更大規模的模型。

過目不忘的超強記憶力？256k 長文本視窗的驚人實力

還記得跟 AI 聊天時，聊沒幾句它就忘了前面說過什麼的窘境嗎？騰訊混元的小模型徹底解決了這個問題。

它們原生支援高達 256k 的超長上下文視窗。

256k 是什麼概念？這相當於模型可以一次性讀取並記住 40 萬個中文字 或 50 萬個英文單字 的內容。打個比方，這等於一口氣讀完三本《哈利波特》小說，並且能清楚記得所有人物關係、魔法咒語和故事情節，甚至還能跟你深入討論後續劇情發展！

FAQ：這些模型這麼小，性能會不會打折扣？

這是一個很好的問題。從上面的數據可以看出，雖然模型尺寸變小了，但它們在特定能力上反而更強。透過精心的資料建構和強化學習，這些模型在 Agent 能力 上表現極為出色，能夠勝任任務規劃、工具呼叫（例如操作 Excel）、深度搜尋和旅行攻略規劃等複雜任務。超長的記憶力正是實現這些複雜任務的關鍵基礎。

從雲端到客廳，騰訊如何應用自家「小鋼炮」模型？

理論說得再好，不如看看實際應用。事實上，這些「小鋼炮」模型早已在騰訊內部多個產品中大顯身手：

騰訊會議 AI 小助手 & 微信讀書 AI 助理： 依賴 256k 的超長文本能力，AI 可以完整理解整場會議的錄音或一整本書的內容，並進行精準的摘要和問答。
騰訊手機管家： 在手機端直接利用小模型進行垃圾訊息辨識，達到毫秒級的攔截速度，而且所有運算都在本地完成，完全不涉及使用者隱私上傳。
騰訊智慧座艙助手： 在車載這種對功耗和反應速度極為敏感的環境中，透過雙模型協作架構，充分發揮小模型低功耗、高效率的特性，提供流暢的語音互動體驗。

FAQ：我需要什麼樣的硬體才能跑這些模型？

這正是它們最大的優勢之一。這些模型被設計為僅需 單張消費級顯示卡 即可部署。部分模型甚至可以直接在效能較好的個人電腦、手機或平板電腦上直接運行，大大降低了玩轉 AI 的硬體門檻。

開發者福音：部署輕鬆，生態開放

對於開發者和 AI 愛好者來說，這無疑是個好消息。騰訊混元模型不僅效能強大，更擁有極高的開放性。

它們支援 SGLang、vLLM 和 TensorRT-LLM 等主流推理框架，也支援多種量化格式，讓部署和優化變得非常簡單。

更重要的是，所有模型及程式碼都已在 GitHub 和 Hugging Face 上開源，開發者可以自由下載、使用和微調。

官方體驗網址： 騰訊混元模型廣場
GitHub 專案連結：
Hugging Face 模型連結 (Instruction-Tuned 版本)：

總結來說，騰訊這次開源的小尺寸模型，不僅是技術上的一次突破，更是推動 AI 民主化和普及化的重要一步。它們證明了高效能 AI 並不一定與龐大和昂貴劃上等號，一個更智慧、更便捷的未來，或許就從我們身邊的這些日常裝置開始。

分享至:

Featured Partners

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

Recommended for You

K …

tool

Kimi K2.5 模型解析：開源界的新標竿，視覺程式碼與多代理協作的實力展現

Moonshot AI 發布最新開源模型 Kimi K2.5，具備原生多模態能力與強大的「蜂群代理」技術。本文將詳細剖析其在視覺程式碼生成、多代理協作及複雜辦公任務上的突破性表現，並探討其如何以更低的成本達成超越單一代理的效率。技術圈最近有個令人興奮的消息，Moonshot AI 正式推出了 Kimi K2.5。這不僅僅是一個普通的模型更新，它是目前最強大的開源模型之一。經過大約 15T（兆）個混合視覺與文本 Token 的持續預訓練，K2.5 在程式碼編寫、視覺理解以及代理協作（Agent Swarm）方面，都展現了令人印象深刻的實力。對於開發者和專業工作者來說，這意味著什麼？簡單來說，它能看得懂你給的影片，寫出有美感的網頁，甚至能指揮一百個 AI 小幫手同時幫你查資料。我們這就來看看 Kimi K2.5 的幾個核心亮點。視覺與程式碼的完美融合：懂美感的工程師以前我們讓 AI 寫網頁，通常只能得到結構正確但外觀樸素的程式碼。但 Kimi K2.5 打破了這個限制。它內建了原生的多模態能力，這讓它在處理「視覺程式碼」（Coding with Vision）時顯得游刃有餘。你可以試著把一個網站的操作影片丟給它，或者給它一張設計草圖，K2.5 能夠理解其中的視覺邏輯、佈局互動，甚至是動畫效果。它不再只是單純地翻譯文字指令，而是像一個有經驗的前端工程師，能夠理解「美感」與「使用者體驗」。舉個例子，如果你想要一個類似馬蒂斯（Matisse）畫作風格的網頁，K2.5 不僅能生成程式碼，還能透過視覺除錯（Visual Debugging）來自我修正，確保最終呈現的效果符合藝術美感。這種從影片或圖像直接轉換為互動式介面、且包含豐富滾動特效的能力，大幅降低了將創意轉化為成品的門檻。蜂群代理系統：以一當百的並行處理能力這大概是 K2.5 最具科幻感的功能了。面對複雜的難題，單打獨鬥往往效率低落。Kimi K2.5 引入了「蜂群代理」（Agent Swarm）的概念。這不是單純的多工處理，而是一個能夠自我指揮的協作系統。想像一下，你需要調查一百個不同領域的利基市場。傳統的 AI 代理可能需要一步一步、一個一個去搜尋，耗時且容易出錯。但在 K2.5 的架構下，主代理（Orchestrator）會自動將任務拆解，並指揮多達 100 個子代理（Sub-agents）同時開工。這些子代理就像是一個訓練有素的團隊，並行執行多達 1,500 次的工具調用。這帶來了什麼改變？速度提升：相較於單一代理模式，執行時間縮短了 4.5 倍。自動編排：使用者不需要預先定義工作流程，K2.5 會根據任務需求，動態生成並管理這些子代理。這種並行處理能力，讓 Kimi K2.5 在處理廣度搜尋（Wide Search）這類任務時，展現出驚人的效率。辦公生產力的實質躍升：解決真實世界的繁重工作在實際的辦公場景中，我們面對的往往不是簡單的問答，而是高密度、長篇幅的資料處理。Kimi K2.5 特別針對這一點進行了優化。

Jan 29, 2026 Read →

S …

tool

StepFun Step-Audio-R1.1 登場：超越 GPT-4o 與 Gemini 的語音推理新霸主

在語音 AI 的競賽場上，大家總是習慣盯著 OpenAI 或 Google 的最新動態，期待他們端出下一個震撼世界的產品。但就在最近，一個開源權重模型無聲無息地爬上了排行榜的頂端，讓許多科技巨頭感到汗顏。這款名為 Step-Audio-R1.1 的模型，由 StepFun（階躍星辰）開發，它不僅在語音推理能力上刷新了紀錄，更在即時互動的流暢度上展現了驚人的實力。如果您以為這只是另一個普通的語音模型，那可就大錯特錯了。它在 Artificial Analysis 的語音推理基準測試（Speech Reasoning benchmark）中，以 96.4% 的準確率拿下了冠軍寶座，直接將 Grok、Gemini 乃至 GPT-Realtime 甩在身後。這究竟是怎麼做到的？讓我們來拆解這項技術背後的秘密。語音推理的新高度：數據不會說謊讓我們先來看看最直觀的數據表現。根據 Artificial Analysis 的 Big Bench Audio 數據集測試結果，Step-Audio-R1.1 展現了壓倒性的優勢。在這份榜單上，排在第二名的 Grok Voice Agent 成績是 92.3%，而廣受關注的 GPT-4o Realtime Preview 則落在 66% 到 68% 之間。這意味著什麼？這代表在處理複雜的語音指令、理解語境以及進行邏輯推演時，Step-Audio-R1.1 的表現比目前市面上昂貴的商業模型還要精準。這並非單純的語音轉文字再處理，而是真正的「端到端」（End-to-End）語音原生推理。模型直接聽懂了聲音中的邏輯，而不是依賴文字轉錄的中介。對於開發者與研究人員來說，這是一個激動人心的消息，尤其是當您可以在 Hugging Face 下載 Step-Audio-R1.1 的權重，親自驗證這項技術時，這種震撼感會更加真實。速度與智慧的博弈：打破傳統權衡長期以來，AI 領域存在一個難以忽視的矛盾：想要模型更聰明，通常就得犧牲反應速度；想要反應快，往往就得犧牲推理的深度。但在即時語音對話中，延遲是使用者體驗的殺手。沒人喜歡對著一個還要思考五秒鐘才能回話的 AI 聊天，那種尷尬的沉默會毀掉所有的沉浸感。 Step-Audio-R1.1 透過一種被稱為「思維配速說話」（Mind-Paced Speaking）的技術，巧妙地解決了這個難題。您可以把它想像成一位經驗豐富的演講者，他們不需要停下來長時間思考，而是能夠邊說邊想，組織語言的同時也在進行深層邏輯推演。這得益於其獨特的雙腦架構（Dual-Brain Architecture）：構思大腦（Formulation Brain）：負責高層次的邏輯推理與內容規劃。表達大腦（Articulation Brain）：專注於語音生成的流暢度與自然度。這種分工合作的機制，讓模型能夠在輸出的同時進行「思維鏈」（Chain-of-Thought）推理。結果就是，它既能保持極低的延遲，又能處理複雜的任務，完全不需要在速度與智慧之間做取捨。想體驗這種流暢感的朋友，可以前往 ModelScope 的 Demo 頁面試試看。

Jan 16, 2026 Read →

L …

tool

Liquid AI LFM2.5 強勢登場：重新定義端側 AI 效能，1B 參數模型的極致表現

Liquid AI 最新發布 LFM2.5 系列模型，以 1.2B 的輕量級參數帶來桌機級的效能。本文深入解析其在文字、視覺、日語及原生音訊處理上的突破，並探討這款針對端側裝置優化的開源模型如何改變開發者生態。大家有沒有發現，最近 AI 界的風向似乎正在悄悄轉變？雖然超大型模型依然佔據頭條，但真正在開發者社群中引起騷動的，反而是那些「小而美」、能跑在自己設備上的模型。就在昨天，Liquid AI 拋出了一枚震撼彈：LFM2.5 系列。這不僅僅是一次版本更新，它向我們展示了當 10 億（1B）參數等級的模型經過精心調校後，竟然能爆發出如此驚人的潛力。 LFM2.5 的核心目標非常明確：讓強大的 AI 走出雲端機房，直接住進你的筆電、手機甚至汽車裡。Liquid AI 這次不僅將預訓練數據量從 10T 提升到了 28T Token，更引入了強化學習來打磨後訓練流程。結果如何？他們在各項基準測試中，正面擊敗了 Llama 3.2 1B 和 Qwen 3 1.7B 等強勁對手。接下來，我們就來仔細拆解這次發布的重點，看看這個「小巨人」家族究竟藏著什麼黑科技。 LFM2.5 的核心架構：不只是堆砌數據這裡有個關鍵點需要釐清。很多人認為提升模型能力就是單純地「餵更多書給它讀」。但 LFM2.5 的成功並非僅此而已。它是建立在 LFM2 設備優化混合架構（device-optimized hybrid architecture）之上的進化版。 Liquid AI 這次採取了更積極的策略，將預訓練的規模擴大了近三倍（達到 28T Token）。這意味著模型在「大腦」容量有限的情況下，吸收了更廣泛的知識密度。更重要的是，團隊在後訓練階段大量運用了強化學習。這就像是給模型請了一位嚴格的家教，針對邏輯推理和指令遵循能力進行了高強度的特訓。對於開發者來說，這代表著你拿到手的不只是一個「會說話」的模型，而是一個懂得如何使用工具、能執行複雜指令的可靠代理（Agent）。而且，這些都是在開源權重（Open-weight）的前提下實現的。滿足多元需求的五大模型變體 LFM2.5 並非單打獨鬥，而是一個針對不同場景量身打造的家族。Liquid AI 這次一口氣推出了五個針對特定用途優化的模型實例，讓開發者不再需要拿著鐵鎚找釘子。 1. 通用指令模型 (Instruct Model) 這是整個系列的明星產品。LFM2.5-1.2B-Instruct 是大多數開發者的首選。它經過了監督式微調（SFT）和多階段強化學習，開箱即用。無論是處理一般對話、數學問題，還是調用外部工具，它都展現出了超越同級對手的穩定性。這款模型非常適合用來打造本地端的 Copilot 或是個人助理，因為它反應夠快，且不需要聯網就能處理隱私數據。 2. 基礎模型 (Base Model) 對於那些喜歡自己動手改裝的技術愛好者或企業研發團隊，LFM2.5-1.2B-Base 提供了最純粹的畫布。這是一個預訓練的檢查點（Checkpoint），尚未經過指令微調。如果您需要訓練一個特定領域的助手（比如醫療、法律專用），或者是想嘗試新穎的後訓練方法，這個基礎模型就是最佳起點。它擁有強大的知識底蘊，等待您去引導它的輸出方向。 3. 日語優化模型 (Japanese Language Model) 語言的精髓往往在於文化與語境，而不僅僅是字面翻譯。LFM2.5-1.2B-JP 是專為日語環境打造的聊天模型。雖然原版模型已經支援日語，但這個專用版本在日語知識庫和指令遵循上達到了該尺寸模型的「最先進」（SOTA）水準。對於需要開發日本市場應用、且極度重視文化細微差別的開發者來說，這是一個不可多得的工具。

Jan 6, 2026 Read →