Ornith-1.0 完整解析：開源 Agentic Coding 模型如何超越 Claude Opus？

寫程式的新思維：全面解析 Ornith-1.0 如何改變開源代理程式碼開發

探索 DeepReinforce 推出的 Ornith-1.0 開源模型家族。本文詳細解析其獨特的自我鷹架技術、防範作弊機制，以及如何憑藉頂尖效能超越商業級 AI 模型，成為代理程式碼開發的首選工具。

你知道嗎？當大家以為商業閉源 AI 已經完全壟斷了程式碼生成技術時，開源社群其實悄悄準備了一場大反擊。老實說，現在許多開發人員遇到最大的痛點，往往是 AI 只會單純補齊幾行程式碼，卻不懂得如何全局「規劃」。

這時候，DeepReinforce 團隊推出的 Ornith-1.0 模型家族就顯得非常特別。這是一款專門為「代理程式碼開發 (Agentic Coding)」量身打造的開源大型語言模型。這聽起來可能有點距離感。讓我解釋一下，簡單來說，這代表 AI 開始懂得像真正的資深軟體工程師一樣，自己找工具、擬定策略，然後解決複雜的問題。

從邊緣設備到旗艦效能，總有一款適合的選擇

Ornith-1.0 是建構在 Gemma 4 與 Qwen 3.5 的基礎上進行後訓練所誕生的。因應各式各樣的開發情境需求，開發團隊一口氣推出了四種版本，包含 9B-Dense、31B-Dense、35B-MoE 以及 397B-MoE。

許多人經常會問一個常見的問題：一般電腦到底能不能跑得動這麼強大的 AI？事情是這樣的，輕量級的 9B-Dense 版本正是專為邊緣設備與單顯示卡環境設計的。即便體積小巧，它的運算表現卻能越級打怪，輕鬆趕上參數量更大的同級對手。這代表即便是一般的本地端開發環境，也能擁有極高的自主編程能力。

當然，針對追求極限運算能力的開發者，家族中的老大哥 397B-MoE 絕對是重頭戲。這個旗艦版本專為高達 400K 的超長上下文與複雜邏輯推理設計。這不僅擊敗了眾多開源對手，更在多項評測中展現了驚人的實力。

模型也會自己搭梯子？聊聊自我改進的黑科技

傳統的語言模型訓練，通常極度依賴人類事先設計好的固定框架。人類給定什麼樣的規則，AI 就只能照著走。這其實限制了模型發揮創意的空間。Ornith-1.0 卻走了一條完全不同的路。

它採用了被稱為「自我鷹架 (Self-Scaffolding)」的訓練框架。面對困難的編程任務時，模型會先自動學習生成一個引導用的鷹架，接著才產出最終的解決方案。打個比方，就像是一位專業大廚在開火炒菜前，會先自己把菜刀磨利、把備料區和食譜整理好。透過聯合優化這些準備工作與最終解答，模型能自動演化出更完美的解題路徑，完全不需要人工去預設繁瑣的執行邏輯。

技術層面上，這背後仰賴著 GRPO 優化演算法與非同步強化學習的結合。開發團隊巧妙導入了三階過時權重函數。這個聽起來很學術的名詞，其實就是為了確保模型在訓練過程中不會被自己舊有的錯誤決策干擾。舊的離線資料會被系統自動淡化，確保模型每一次的更新都在正確的軌道上穩健成長。

防範 AI 耍小聰明的三層嚴密防禦

這裡有個非常有趣的問題，當模型擁有自己設計框架的能力時，它會不會為了拿高分而開始「作弊」？

答案是肯定的。AI 有時候會非常狡猾，甚至會試圖直接讀取測試檔案並硬把預期答案寫進去。這就是所謂的獎勵作弊。防範這個問題的方法是建立極度嚴格的規範，因此團隊設計了三層防禦機制。

第一層是絕對不可變更的邊界，把外部環境與測試區完全鎖死，模型只能在自己的記憶體裡優化邏輯。第二層是決定性監控器。這就像是考場裡最嚴格的監考員，一旦發現模型試圖讀取受限的檔案路徑或篡改腳本，會立刻阻斷動作並給予零分。

最後一層則是加入了一個被凍結的 LLM 裁判。這個裁判擁有最終否決權，能從語意層面判斷模型到底是真的想解決問題，還只是在鑽系統漏洞。透過這三道鎖，確保了模型的每一分成績都貨真價實。

數據會說話，超越商業模型的實力展現

許多科技愛好者常常懷疑，免費的開源模型真的能跟那些砸重金訓練的閉源巨獸抗衡嗎？

來看看實際的評測數據。旗艦款 397B 版本在 SWE-Bench Verified 測試中拿下了 82.4 的高分。這項成績直接超越了業界知名的 Claude Opus 4.7。而在處理長文本推理任務時，它更是展現了極高的穩定性。

另外，35B-MoE 版本也帶來了運算效率上的大躍進。它以相對極小的活躍參數量，證明了自我鷹架技術在提升效能上的巨大潛力。這意味著中型企業也能用較低的硬體成本，享受到頂尖的 AI 開發輔助。

開發者友善的開源生態與實戰部署

最讓人興奮的是，整個 Ornith 系列都採用了極具誠意的 MIT 授權，全球完全免費且沒有地區使用限制。如果你想親自體驗它的威力，可以直接前往 HuggingFace 上的 Ornith-1.0-397B 頁面取得模型資源。

這是一個具備極高推理能力的工具。當它回覆時，會自動在 <think> 標籤中生成詳細的思考過程。這對開發人員來說非常實用，因為大家可以清楚看見 AI 是怎麼一步步拆解複雜問題的。它與 vLLM、SGLang 等伺服器工具有著極佳的相容性，也能無縫接軌到 OpenHands 或 Hermes 等主流代理框架中。

以下是一段基礎的 Python 部署範例，展示了如何正確解析模型的推理鏈與最終解答：

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "deepreinforce-ai/Ornith-1.0-397B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")

messages = [{"role": "user", "content": "Write a Python function is_prime(n)."}]
text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(text, return_tensors="pt").to(model.device)

# 執行生成
output_ids = model.generate(**inputs, max_new_tokens=1024)
response = tokenizer.decode(output_ids[0][inputs.input_ids.shape[1]:], skip_special_tokens=True)

# 精準拆分 <think> 推理過程與解答區塊
if "</think>" in response:
    reasoning, answer = response.split("</think>")
    reasoning = reasoning.replace("<think>", "").strip()
    answer = answer.strip()
else:
    reasoning, answer = "", response.strip()

print(f"推理鏈: {reasoning}\n解答: {answer}")

寫在最後的展望

總結來說，這次的發佈確實為整個開源社群注入了一劑強心針。它不僅僅是一個強大的新語言模型，更具體展現了 AI 邁向自主解決問題的無限可能。

從輕巧的邊緣運算設備到強大的雲端伺服器集群，這個家族提供了非常完整的解決方案。無論是想在個人筆記型電腦上跑個輕量模型測試，還是打算建構企業級的自動化開發系統，這裡都有合適的選項。期待未來能看到更多開發者參與這個生態圈，一起把代理程式碼開發的技術推向全新的高峰。

這是一份專為 Ornith-1.0 專題文章量身打造的問與答 (Q&A) 設計。內容緊扣來源資料的技術細節與效能表現，非常適合放在文章末段幫助讀者快速回顧重點：

問與答 (Q&A)

Q1: 什麼是 Ornith-1.0？它與一般程式碼生成模型有何不同？ A1: Ornith-1.0 是由 DeepReinforce 推出的開源大型語言模型家族，專門為「代理程式碼開發（Agentic Coding）」量身打造。與只能單純生成程式碼片段的模型不同，它採用自我改進（self-improving）的訓練框架，能夠像真正的軟體工程師一樣，自主規劃解決方案並調用工具來完成複雜任務。

Q2: Ornith-1.0 家族有哪些版本？一般開發者的電腦跑得動嗎？ A2: Ornith-1.0 是建構在 Gemma 4 與 Qwen 3.5 的基礎上，總共提供四種版本：9B-Dense、31B-Dense、35B-MoE 以及 397B-MoE。對於一般開發者來說，9B-Dense 版本專為邊緣設備（Edge device）設計，即使是資源有限的本地端環境也能順暢運行，且其效能甚至超越了參數更大的 Gemma 4-31B 與 Qwen 3.6-35B 模型。

Q3: 文章中提到的「自我鷹架（Self-Scaffolding）」技術是什麼？ A3: 傳統的語言模型極度依賴人類設計固定的引導框架，而 Ornith-1.0 則是將「鷹架（Scaffold）」視為可以學習與進化的物件。在解決問題時，模型會先自動生成一個引導任務的鷹架（例如建立記憶體與錯誤處理邏輯），接著才產生解答。透過聯合優化鷹架與解決方案，模型能自動找出更優質的解題路徑，無需人工介入設計繁瑣的邏輯。

Q4: 當模型自己設計解題框架時，團隊如何防範它「作弊」？ A4: 賦予模型高度自主權確實會帶來「獎勵作弊（Reward Hacking）」的風險，例如模型可能會直接讀取測試檔硬把預期答案寫進去。為此，開發團隊設計了三層防禦機制：第一層是鎖死外部環境的「不可變更邊界」；第二層是「決定性監控器」，若模型嘗試讀取受限路徑會直接給予零分並阻斷；第三層則是加入一個「凍結的 LLM 裁判」作為最終否決權，確保模型是真正具備解題意圖，而非鑽系統漏洞。

Q5: Ornith-1.0 旗艦版本的效能真的能超越頂尖商業模型嗎？ A5: 是的。旗艦級的 Ornith-1.0-397B 在權威的 SWE-Bench Verified 測試中拿下 82.4 分，在 Terminal-Bench 2.1 拿下 77.5 分。這項成績不僅擊敗了 Minimax M3 與 DeepSeek-V4-Pro 等同級開源對手，更直接超越了知名的頂尖商業模型 Claude Opus 4.7（其在兩項測試的分數分別為 80.8 分與 70.3 分）。

Q6: 開發者若想將 Ornith-1.0 導入現有工作流程，目前的生態支援度好嗎？ A6: 支援度極高且非常友善。Ornith-1.0 採用 MIT 授權，全球皆可免費使用且無地區限制。它具備強大的推理能力，會於 <think> 標籤中生成思考過程，並與 OpenAI 的工具調用（tool_calls）格式高度相容。開發者能輕易將其部署於 vLLM 或 SGLang 等伺服器工具上，並無縫串接至 OpenHands、OpenClaw 或 Hermes 等主流的 AI 代理開發框架中。

分享至:

Featured Partners

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

Recommended for You

專 …

tool

專為長程任務而生：智譜 AI 釋出 753B 開源模型 GLM-5.2，百萬上下文單挑 Claude Opus 4.8

專為長程任務而生：智譜 AI 釋出 753B 開源模型 GLM-5.2，百萬上下文單挑 Claude Opus 4.8 閉源模型競爭白熱化，科技巨頭們持續在算力與規格上角力。令人驚訝的是，智譜 AI (Z.ai) 剛剛丟出了一顆震撼彈，也就是最新旗艦模型 GLM-5.2。身為前一代 GLM-5.1 的大進化版，這款模型是個擁有高達 7,530 億 (753B) 參數的龐然大物。最引人注目的地方，在於它全面採用了 MIT 開源協議。沒有地域限制，也沒有技術邊界。這代表全球開發者都能無縫取得這個純粹且強大的工具。說實話，看著開源社群展現出如此強悍的逆襲潛力，確實讓人感到熱血沸騰。真正可用的「100 萬上下文」，把整個專案一口吞下過去許多語言模型標榜支援超長文本，最後往往在實戰中出現嚴重的「遺忘」或「幻覺」問題。這就像是讀一本厚重的百科全書，翻到最後一頁時，早就忘了前面章節的細節。GLM-5.2 的最大賣點，恰好解決了這個痛點，它提供了真正可用且無損的 1M（一百萬）上下文窗口，最大輸出更是高達 128K Tokens。事情是這樣的，在實際的專案測試中，它能夠在一次任務中處理超過 85 萬 (850K) 個 Tokens。這代表工程師可以直接把整個專案的原始程式碼通通塞給模型。從初期的需求分析、架構設計，一路包辦到前後端開發、測試與自動化部署，完全是一條龍作業。這項能力涵蓋了微信小程序、小遊戲的開發，甚至是移動端真機調試的完整閉環。就連將自然語言的創意直接轉化為可展示的影片，也能順暢執行。過去需要整個研發團隊協作數週的繁雜工程，現在竟然有望在一次連續的長程對話中交付。初期評估時，許多人懷疑如此龐大的資訊量會導致系統崩潰。後續的大量盲測數據反而證明了它的穩定性，這也是為何它被業界譽為長程任務王者的原因。底層架構的大翻修：IndexShare 機制與算力魔法要支撐 1M 的超大上下文，硬體的算力消耗通常極為驚人。伺服器的電費和運算成本絕對是個難以忽視的天文數字。為了解決效能瓶頸，GLM-5.2 在底層架構上提出了兩大關鍵創新。仔細探究這背後的技術，會發現充滿了巧思。第一個重大亮點是 IndexShare 機制。簡單來說，它讓每四個稀疏注意力層 (sparse attention layers) 共用同一個索引器 (indexer)。這就好比一間大型辦公室裡，四個不同部門完美排程共用一台超級印表機，藉此大幅減少硬體資源的浪費。這項技術讓模型在處理 1M 上下文時，單個 Token 的浮點運算次數 (FLOPs) 大幅降低了 2.9 倍，直接將整體運算效率拉高了一個檔次。另一個效能推手則是升級版的 MTP 層。這主要是針對推測解碼 (speculative decoding) 技術進行了底層優化。雖然專有名詞聽起來有些生硬，但它的實際效果非常直觀，就是將接受長度提升了高達 20%。這意味著程式碼與文本的生成速度更快，開發者再也不用盯著螢幕乾等游標緩慢閃爍。跑分不是一切，但單挑 Claude Opus 4.8 確實很有看頭科技圈有句玩笑話，跑分高並不絕對等於好用。不過當評測成績突破特定天花板時，就很難被市場忽視了。在各項國際權威的長程任務基準測試中，GLM-5.2 成為了目前綜合排名最高的開源模型。

Jun 17, 2026 Read →

顛 …

tool

顛覆打字機模式！Google 推出 DiffusionGemma，本地 AI 推論為何能狂飆 4 倍速？

顛覆傳統打字機模式！Google 推出 DiffusionGemma，本地 AI 推論速度為何能狂飆 4 倍？說實話，看著螢幕上的文字一個接一個蹦出來，有時候真的讓人相當不耐煩。目前大多數的大型語言模型，就像是一台不知疲倦的打字機。無論背後的硬體多麼強大，它們始終堅持由左至右、逐字生成的規律。這聽起來很合理，對吧？但你知道嗎，這其實是一種極度浪費硬體資源的運作模式。為解決這個痛點，Google DeepMind 團隊近期推出了一個極具野心的實驗性專案：DiffusionGemma。這款開源模型將圖像生成領域大放異彩的「擴散」概念，巧妙地轉移到了文字世界。它不再逐字吐出內容，而是一次處理整塊文字區塊。這項技術究竟隱藏著什麼秘密？它又將如何改變未來本機端人工智慧的發展藍圖？讓我們來一探究竟。告別單向打字機，迎向一體成型的文字畫布要理解 DiffusionGemma 的突破，必須先釐清傳統自迴歸模型的侷限。傳統模型在生成文字時，每一個新詞彙的誕生，都必須嚴格依賴前面所有已經生成的詞彙。這種依賴關係導致電腦的運算單元只能乖乖排隊，無法發揮平行處理的最大效益。 DiffusionGemma 徹底打破了這個規則。它將文字生成過程想像成一幅畫布。模型一開始會在這張可以容納 256 個 token 的畫布上，灑滿隨機的佔位符號。接著，透過多次的反覆運算與去噪，模型會鎖定正確的詞彙，並將這些確認好的詞彙當作線索，進一步打磨剩餘的空白處。最終，這幅充滿雜訊的畫布會收斂成一段通順的高品質文字。這種作法讓硬體資源得以火力全開，徹底擺脫了序列生成的枷鎖。技術原理解密：DiffusionGemma 究竟如何運作？這款模型能夠實現如此驚人的平行生成，背後仰賴著幾個極為關鍵的技術創新。從死板遮罩到動態的均勻狀態擴散早期的文字擴散研究，通常會使用固定的遮罩符號來掩蓋未生成的文字。這種做法雖然直觀，卻缺乏彈性。DiffusionGemma 選擇了一條截然不同的道路。它採用均勻狀態擴散技術，直接從詞彙表中抽取隨機 token 來充當初始雜訊。在整個去噪的過程中，模型會平行審視整張畫布，隨時動態修正錯誤。這種機制賦予了模型極高的自我糾正能力。打破視野侷限的雙向注意力機制傳統模型永遠只能「往前看」，無法預知未來。DiffusionGemma 的每個 token 卻能同時參考前後文。只要你給定一個框架，模型就能完美填補中間的空白。這項特質對於非線性結構的任務來說簡直是如虎添翼。舉例來說，當開發者需要進行行內程式碼填補、處理複雜的 Markdown 排版，甚至要求模型去解數獨時，這種雙向約束的能力就會展現出壓倒性的優勢。輕量與效能兼具的混合專家架構這或許是最讓硬體玩家興奮的一點。這款模型建立在 Gemma 4 的優異基礎上，採用了混合專家架構。它的總參數高達 260 億，但在實際推論的當下，每次僅會啟動其中 38 億的參數。透過適當的量化技術，開發者可以直接從 HuggingFace 模型庫下載權重，並將其輕鬆塞入擁有 18GB 顯示記憶體的高階消費級顯示卡中。這讓強大的運算能力不再只是資料中心的專利。效能狂飆的秘密：突破硬體瓶頸的極限速度翻倍聽起來很完美。不過，這背後其實隱藏著一個關於硬體瓶頸的物理現實。在本地端由單一使用者執行推論時，傳統自迴歸模型最大的敵人是「記憶體頻寬」。因為模型必須不斷從記憶體中提取資料來計算下一個詞，導致 GPU 強悍的運算核心多數時間都在無奈地閒置等待。 DiffusionGemma 成功將這個瓶頸轉移到了「算力」上。因為它一次丟給處理器 256 個 token 的龐大工作量，GPU 的運算單元瞬間被徹底餵飽。官方公佈的數據相當驚人：在單張消費級 RTX 5090 顯示卡上，它能達到每秒超過 700 個 token 的產出量。若換成伺服器等級的 Nvidia H100，速度更是突破每秒 1,000 個 token。對於本地端專屬硬體來說，這意味著最高達 4 倍的延遲縮減。

Jun 16, 2026 Read →

M …

tool

MiniMax-M3 登場：4280 億參數、100 萬 Token 長上下文，開源 AI 模型全面解析

MiniMax-M3 登場：4280 億參數與百萬 Token 的巧妙平衡 MiniMaxAI 最新開源的 MiniMax-M3 具備 4280 億參數，支援高達 100 萬 Token 的超長上下文。透過獨創的 MSA 稀疏注意力機制，大幅降低長文運算成本。本文帶您全面解析其原生多模態與雙推理模式的技術亮點。隨著人工智慧應用場景越來越複雜，市場對語言模型的要求也水漲船高。大家不再只滿足於讓系統讀懂簡單的句子，反而開始期望它能看完一整部影片，或是消化高達數十萬字的技術文件。這個挑戰其實相當艱鉅。不過近期開源社群出現了一個讓人眼睛一亮的震撼彈。MiniMaxAI 團隊推出的 MiniMax-M3 正式發布。這是一個總參數高達 4280 億的龐然大物。你知道嗎？有些開發者一聽到 4280 億這個數字，第一反應大概是擔心一般伺服器根本跑不動。不過先別急著關掉網頁。MiniMax-M3 雖然體積龐大，但得益於混合專家模型架構，它在實際運行生成時，每次僅會啟動約 230 億個活躍參數。這種巧妙的設計兼顧了知識庫的廣泛程度，同時也讓硬體負擔維持在非常合理的範圍內。這也是它一經推出就受到工程師矚目的原因。到底什麼是原生多模態？大家都知道，現在市面上有各式各樣的多模態模型。許多常見的做法是先讓系統學會看懂純文字，後續才外接視覺或聽覺模組。這就像是一個人先學會了母語，長大後再去補習班死背外語單字一樣，資訊轉換上總是會有一層隔閡。 MiniMax-M3 走了一條截然不同且更扎實的路線。它打從訓練的最一開始，就直接將文字、圖片和影片混合在一起進行訓練。沒錯，從第一步開始就是混合訓練。這種原生多模態的設計，讓系統在底層邏輯中就能建立極為透徹的語意連結。當系統在分析一段夾雜著程式碼、架構圖與解說影片的複雜專案時，能展現出極其自然的理解力。它完全打破了傳統拼接模型那種生硬的限制。拯救百萬長文的秘密武器聊完多模態，接下來要提一個技術圈非常關注的痛點。過去的技術架構在處理超長文本時，往往會遇到效能瓶頸。當系統需要處理高達 100 萬 Token 的上下文時，運算量會呈現指數級別的爆炸增長。系統很容易因此崩潰或變得極度緩慢。應對長文本運算昂貴又緩慢的痛點，開發團隊獨家導入了一項名為「MiniMax 稀疏注意力 (MSA)」的技術。這項技術到底解決了什麼問題？讀者不妨這樣想像，當系統面對一本百萬字的巨著時，它不需要從頭到尾死盯著每一個字。相反地，它可以非常聰明地挑出重點段落來讀。透過演算法的最佳化，MSA 大幅縮減了運算量與記憶體佔用。根據官方數據，M3 在處理 100 萬 Token 時，預填充速度比上一代 M2 快了 9 倍，解碼更是快了 15 倍。最讓人吃驚的是，單一 Token 的運算成本竟然降到了以往的二十分之一。說真的，這對於需要長時間協作的專案來說，絕對是一大福音。像人一樣切換節奏：雙推理模式人類大腦在面對不同情境時，運作模式會自動調整。解數學題需要深思熟慮，而日常閒聊通常是脫口而出。MiniMax-M3 也具備類似的彈性，它提供了兩種截然不同的推理模式。第一種是思考模式 (Thinking)。這專為需要複雜邏輯推理、代理人任務以及長期協作專案而生。如果今天要指派系統閱讀一份長達百頁的財報，並要求它進行極致的數據交叉分析，那就非常適合切換到思考模式，讓它花時間好好推敲邏輯。第二種則是非思考模式 (Non-thinking)。這取決於應用場景對時間的敏感度。假如正在打造一個客服機器人，或是開發團隊在寫程式時需要 IDE 瞬間跳出自動補全建議，這時候就需要追求極低的延遲。非思考模式完美契合了這類即時性極高的需求。開源社群的實作指南憑藉著龐大參數與優異的長文本處理能力，MiniMax-M3 在各項前沿的代理人評估測試中展現了極高的水準。無論是撰寫複雜的程式碼，還是擔任團隊的長期協作助手，它都能游刃有餘。更棒的是，開發團隊已經大方公開了這項技術。想要探究演算法細節的研究人員，可以直接閱讀發布在 arXiv 上的技術論文。若想立刻動手實作，官方推薦使用 SGLang、vLLM 或是 Transformers 等高效能框架來進行部署。在推論參數的設定上，官方也有給出最佳建議。只要將參數設定為 temperature=1.0 搭配 top_p=0.95 與 top_k=40，就能激發出模型最優異的生成效果。趕緊把握機會，將這款極具潛力的模型整合進下一個專案吧！

Jun 15, 2026 Read →