微软 AI 低调发表首款完全内部开发的文生图模型 MAI-Image-1,并在知名 AI 模型竞技场 LMArena 首次亮相即进入前十。这款模型强调照片级的真实感与创作灵活性,未来将整合至 Copilot 与 Bing Image Creator,为微软的 AI 生态增添重要一环。
AI 图像生成领域风起云涌,科技巨头们的布局也日益清晰。最近,微软 AI 悄然推出了其最新成果——MAI-Image-1。这并非寻常的更新,而是微软首款完全在内部开发的文生图模型。它没有盛大的发表会,而是选择在 AI 模型竞技平台 LMArena 上直接亮相,并取得了第九名的不错开局。
这一步棋,展现了微软在生成式 AI 领域持续深耕的决心。MAI-Image-1 的出现,不仅是微软 AI 研发实力的一次展示,也预示着其旗下的 Copilot 和 Bing Image Creator 等产品,未来将拥有更强大的原生图像生成能力。
MAI-Image-1 在 LMArena 的初登场表现
LMArena 是一个通过用户匿名投票来对各种 AI 模型进行评分的平台,其排名在一定程度上反映了模型在真实使用场景中的受欢迎程度。MAI-Image-1 作为一个新秀,能直接进入榜单前列,与来自 Google、Tencent、Bytedance 等公司的顶尖模型同场竞技,本身就是一个不小的成就。
以下是目前的 LMArena 图像模型排行榜,可以清楚看到 MAI-Image-1 的位置:
| Rank (UB) | Model | Score | 95% CI (±) | Votes | Organization | License |
|---|---|---|---|---|---|---|
| 1 | hunyuan-image-3.0 | 1161 (Preliminary) | ±6 | 14,414 | Tencent | tencent-hunyuan-community |
| 1 | gemini-2.5-flash-image-preview (nano-banana) | 1154 | ±3 | 526,205 | Proprietary | |
| 3 | imagen-4.0-ultra-generate-preview-06-06 | 1145 | ±3 | 447,731 | Proprietary | |
| 3 | seedream-4-2k | 1144 | ±6 | 14,582 | Bytedance | Proprietary |
| 4 | seedream-4-high-res-fal | 1134 | ±5 | 20,954 | Bytedance | Proprietary |
| 5 | imagen-4.0-generate-preview-06-06 | 1131 | ±3 | 448,875 | Proprietary | |
| 7 | gpt-image-1 | 1123 | ±3 | 204,686 | OpenAI | Proprietary |
| 7 | seedream-4-fal | 1118 | ±6 | 13,513 | Bytedance | Proprietary |
| 9 | mai-image-1 | 1096 (Preliminary) | ±9 | 4,091 | Microsoft AI | Proprietary |
| 9 | seedream-3 | 1082 | ±5 | 36,678 | Bytedance | Proprietary |
| 10 | flux-1-kontext-max | 1079 | ±3 | 72,764 | Black Forest Labs | Proprietary |
| 12 | qwen-image-prompt-extend | 1072 | ±2 | 571,973 | Alibaba | Apache 2.0 |
| 13 | imagen-3.0-generate-002 | 1062 | ±3 | 418,478 | Proprietary | |
| 13 | flux-1-kontext-pro | 1062 | ±3 | 333,142 | Black Forest Labs | Proprietary |
| 13 | qwen-image | 1061 | ±2 | 106,803 | Alibaba | Apache 2.0 |
| 16 | ideogram-v3-quality | 1049 | ±5 | 36,941 | Ideogram | Proprietary |
| 17 | lucid-origin | 1025 | ±3 | 277,597 | Leonardo AI | Proprietary |
| 17 | photon | 1020 | ±5 | 56,961 | Luma AI | Proprietary |
| 18 | recraft-v3 | 1017 | ±4 | 107,683 | Recraft | Proprietary |
| 18 | flux-1.1-pro | 1013 | ±3 | 71,781 | Black Forest Labs | Proprietary |
| 19 | ideogram-v2 | 1012 | ±3 | 73,285 | Ideogram | Proprietary |
| 22 | gemini-2.0-flash-preview-image-generation | 987 | ±3 | 285,249 | Proprietary | |
| 23 | dall-e-3 | 978 | ±4 | 266,633 | OpenAI | Proprietary |
| 24 | flux-1-dev-fp8 | 966 | ±4 | 49,919 | Black Forest Labs | Open |
| 24 | flux-1-kontext-dev | 963 | ±3 | 214,478 | Black Forest Labs | Proprietary |
| 26 | stable-diffusion-v35-large | 936 | ±4 | 23,764 | Stability AI | Open |
| 27 | bagel | 913 | ±5 | 11,646 | Bytedance | Apache 2.0 |
资料来源:LMArena 图像模型排行榜,数据截至 2025 年 10 月。
不只是追求排名,更专注于创作者价值
尽管排名亮眼,但微软 AI 更强调的是 MAI-Image-1 的内在价值。开发团队表示,他们投入了大量心力,避免模型生成那些重复性高、缺乏新意的「公式化」图像。
为此,他们专注于两大方向:
- 精准的数据与评估: 团队严格筛选训练数据,并结合创意产业专业人士的回馈,让模型的评估标准更贴近真实世界的创作场景。
- 卓越的真实感表现: MAI-Image-1 特别擅长生成照片级的逼真图像,能细腻处理复杂的光影,如对象反射、反弹光以及各种自然景观,为使用者提供高质量的视觉素材。
提升创作效率:兼顾速度与质量
对于创作者来说,工具的反应速度至关重要。MAI-Image-1 的一个关键优势是在生成速度与图像质量之间找到了平衡点。相比一些需要较长运算时间的大型模型,它能让使用者更快地将想法可视化,并进行快速迭代。
这种高效的工作流程,意味着创作者可以将更多精力放在创意本身,而非漫长的等待上。先用 MAI-Image-1 快速产出概念原型,再将满意的结果导出至其他专业软件进行精修,整个过程将变得更加流畅。
未来的整合计划:Copilot 与 Bing Image Creator 即将迎来升级
那么,一般使用者何时能体验到 MAI-Image-1 呢?
目前,除了在 LMArena 平台上进行测试外,微软也已规划好下一步。官方透露,MAI-Image-1 将在不久后正式整合到 Copilot 和 Bing Image Creator 中。这意味着,未来数亿的微软用户将能直接在他们熟悉的工具中,享受到这款全新自研模型所带来的创作便利。


