微軟 AI 低調發表首款完全內部開發的文生圖模型 MAI-Image-1,並在知名 AI 模型競技場 LMArena 首次亮相即進入前十。這款模型強調照片級的真實感與創作靈活性,未來將整合至 Copilot 與 Bing Image Creator,為微軟的 AI 生態增添重要一環。
AI 圖像生成領域風起雲湧,科技巨頭們的佈局也日益清晰。最近,微軟 AI 悄然推出了其最新成果——MAI-Image-1。這並非尋常的更新,而是微軟首款完全在內部開發的文生圖模型。它沒有盛大的發表會,而是選擇在 AI 模型競技平台 LMArena 上直接亮相,並取得了第九名的不錯開局。
這一步棋,展現了微軟在生成式 AI 領域持續深耕的決心。MAI-Image-1 的出現,不僅是微軟 AI 研發實力的一次展示,也預示著其旗下的 Copilot 和 Bing Image Creator 等產品,未來將擁有更強大的原生圖像生成能力。
MAI-Image-1 在 LMArena 的初登場表現
LMArena 是一個透過用戶匿名投票來對各種 AI 模型進行評分的平台,其排名在一定程度上反映了模型在真實使用場景中的受歡迎程度。MAI-Image-1 作為一個新秀,能直接進入榜單前列,與來自 Google、Tencent、Bytedance 等公司的頂尖模型同場競技,本身就是一個不小的成就。
以下是目前的 LMArena 圖像模型排行榜,可以清楚看到 MAI-Image-1 的位置:
| Rank (UB) | Model | Score | 95% CI (±) | Votes | Organization | License |
|---|---|---|---|---|---|---|
| 1 | hunyuan-image-3.0 | 1161 (Preliminary) | ±6 | 14,414 | Tencent | tencent-hunyuan-community |
| 1 | gemini-2.5-flash-image-preview (nano-banana) | 1154 | ±3 | 526,205 | Proprietary | |
| 3 | imagen-4.0-ultra-generate-preview-06-06 | 1145 | ±3 | 447,731 | Proprietary | |
| 3 | seedream-4-2k | 1144 | ±6 | 14,582 | Bytedance | Proprietary |
| 4 | seedream-4-high-res-fal | 1134 | ±5 | 20,954 | Bytedance | Proprietary |
| 5 | imagen-4.0-generate-preview-06-06 | 1131 | ±3 | 448,875 | Proprietary | |
| 7 | gpt-image-1 | 1123 | ±3 | 204,686 | OpenAI | Proprietary |
| 7 | seedream-4-fal | 1118 | ±6 | 13,513 | Bytedance | Proprietary |
| 9 | mai-image-1 | 1096 (Preliminary) | ±9 | 4,091 | Microsoft AI | Proprietary |
| 9 | seedream-3 | 1082 | ±5 | 36,678 | Bytedance | Proprietary |
| 10 | flux-1-kontext-max | 1079 | ±3 | 72,764 | Black Forest Labs | Proprietary |
| 12 | qwen-image-prompt-extend | 1072 | ±2 | 571,973 | Alibaba | Apache 2.0 |
| 13 | imagen-3.0-generate-002 | 1062 | ±3 | 418,478 | Proprietary | |
| 13 | flux-1-kontext-pro | 1062 | ±3 | 333,142 | Black Forest Labs | Proprietary |
| 13 | qwen-image | 1061 | ±2 | 106,803 | Alibaba | Apache 2.0 |
| 16 | ideogram-v3-quality | 1049 | ±5 | 36,941 | Ideogram | Proprietary |
| 17 | lucid-origin | 1025 | ±3 | 277,597 | Leonardo AI | Proprietary |
| 17 | photon | 1020 | ±5 | 56,961 | Luma AI | Proprietary |
| 18 | recraft-v3 | 1017 | ±4 | 107,683 | Recraft | Proprietary |
| 18 | flux-1.1-pro | 1013 | ±3 | 71,781 | Black Forest Labs | Proprietary |
| 19 | ideogram-v2 | 1012 | ±3 | 73,285 | Ideogram | Proprietary |
| 22 | gemini-2.0-flash-preview-image-generation | 987 | ±3 | 285,249 | Proprietary | |
| 23 | dall-e-3 | 978 | ±4 | 266,633 | OpenAI | Proprietary |
| 24 | flux-1-dev-fp8 | 966 | ±4 | 49,919 | Black Forest Labs | Open |
| 24 | flux-1-kontext-dev | 963 | ±3 | 214,478 | Black Forest Labs | Proprietary |
| 26 | stable-diffusion-v35-large | 936 | ±4 | 23,764 | Stability AI | Open |
| 27 | bagel | 913 | ±5 | 11,646 | Bytedance | Apache 2.0 |
資料來源:LMArena 圖像模型排行榜,數據截至 2025 年 10 月。
不只是追求排名,更專注於創作者價值
儘管排名亮眼,但微軟 AI 更強調的是 MAI-Image-1 的內在價值。開發團隊表示,他們投入了大量心力,避免模型生成那些重複性高、缺乏新意的「公式化」圖像。
為此,他們專注於兩大方向:
- 精準的數據與評估: 團隊嚴格篩選訓練數據,並結合創意產業專業人士的回饋,讓模型的評估標準更貼近真實世界的創作場景。
- 卓越的真實感表現: MAI-Image-1 特別擅長生成照片級的逼真圖像,能細膩處理複雜的光影,如物件反射、反彈光以及各種自然景觀,為使用者提供高品質的視覺素材。
提升創作效率:兼顧速度與品質
對於創作者來說,工具的反應速度至關重要。MAI-Image-1 的一個關鍵優勢是在生成速度與圖像品質之間找到了平衡點。相比一些需要較長運算時間的大型模型,它能讓使用者更快地將想法視覺化,並進行快速迭代。
這種高效的工作流程,意味著創作者可以將更多精力放在創意本身,而非漫長的等待上。先用 MAI-Image-1 快速產出概念原型,再將滿意的結果匯出至其他專業軟體進行精修,整個過程將變得更加流暢。
未來的整合計畫:Copilot 與 Bing Image Creator 即將迎來升級
那麼,一般使用者何時能體驗到 MAI-Image-1 呢?
目前,除了在 LMArena 平台上進行測試外,微軟也已規劃好下一步。官方透露,MAI-Image-1 將在不久後正式整合到 Copilot 和 Bing Image Creator 中。這意味著,未來數億的微軟用戶將能直接在他們熟悉的工具中,享受到這款全新自研模型所帶來的創作便利。


