微软 AI 重磅出击:两款自研模型 MAI-Voice-1 与 MAI-1-preview 惊艳亮相
微软 AI (MAI) 揭示了其最新研发的两款强大模型:超高效的语音生成模型 MAI-Voice-1 和大型基础模型 MAI-1-preview。这不仅是技术的跃进,更是微软致力于打造人人可用的 AI、赋能全球每个人的重要一步。来看看它们将如何改变人们与 AI 的互动方式。
在微软 AI (Microsoft AI, 简称 MAI),其抱持一个坚定的信念:AI 应该为地球上的每一个人赋能。该团队正在创造的,是一个能服务全人类、随时提供支持与帮助的 AI 伙伴。它将是通往知识宇宙的门户,提供一系列强大的能力,帮助个人和组织成就更多。
微软 AI 的目标是打造一个负责任、可靠、兼具个性与专业的应用 AI 平台。这个平台不仅要能定义产业的未来,更要能深刻理解每个人的独特需求,成为值得信赖的产品。从去年开始,该团队便专注于为这个愿景奠定基础,而如今,微软 AI 正向世界展示实现这一愿景的初步成果。
值得注意的是,本文介绍的两款模型均为在云端服务器运行的非本地模型,用户需要通过网络连接才能使用其强大的运算功能。
听见未来?MAI-Voice-1 让声音活起来
首先登场的是 MAI-Voice-1。
这不仅仅是一个语音模型,它是微软 AI 首个具备高度表现力和自然流畅度的语音生成模型。声音很可能就是未来 AI 伙伴的主要界面,而 MAI-Voice-1 正是为此而生。它能提供高保真、情感丰富的音频,无论是单人独白还是多人对话场景,都能轻松驾驭。
坦白说,它的效率真的让人惊讶。MAI-Voice-1 能在单一 GPU 上,不到一秒钟就生成整整一分钟的音频,使其成为当今最高效的语音系统之一。
想亲身体验吗?MAI-Voice-1 已经在 Copilot Daily 和 Podcasts 功能中悄悄上线了。不仅如此,微软 AI 还在 Copilot Labs 开设了全新的体验区,让用户可以亲手尝试它强大的表达能力和故事叙述功能。想象一下,只要一个简单的提示,就能创造一个“由你选择结局”的冒险故事,或是定制一段引导式冥想,帮助用户安然入睡。
不仅仅是对话:MAI-1-preview 接受公开考验
接下来,是微软 AI 的第二个重磅发布:MAI-1-preview。
微软 AI 已经开始在 LMArena 这个知名的社区模型评估平台上,对 MAI-1-preview 进行公开测试。这不仅是 MAI 首个完全端到端训练的基础模型,也让外界得以一窥 Copilot 未来可能的新样貌。
MAI-1-preview 是一个内部开发的“专家混合 (mixture-of-experts)”模型。简单来说,就像是让一群各有所长的专家协同工作来解决问题。它在约 15,000 个 NVIDIA H100 GPU 上进行了预训练和后续训练,专为理解复杂指令并为日常查询提供有用的回应而设计。
在接下来的几周内,MAI-1-preview 将逐步应用于 Copilot 内部特定的文字使用情境中,目的是为了从用户的回馈中学习和改进。当然,微软 AI 仍会继续采用来自其团队、合作伙伴以及开源社区最优秀的模型来强化产品。这种灵活的策略让其能够在每天数百万次的独特互动中,提供最佳的使用体验。
此外,此模型也将提供给受信任的测试者申请 API 存取权限。该团队非常期待能收集到早期的回馈,了解模型在哪些方面表现出色,以及该如何让它变得更好。
这只是个开始:共创 AI 的未来
微软 AI 对于未来有着宏大的抱负。
这次的发布只是个开端。该公司相信,通过整合一系列针对不同用户意图和应用场景的专业模型,将能释放出巨大的价值。
MAI 是一个由全球顶尖人才组成的精实且行动迅速的实验室,拥有令人兴奋的运算资源蓝图,新一代的 GB200 集群现已投入运作。更重要的是,他们拥有一个其真正信奉的宏伟使命。该团队很幸运能与卓越的产品团队合作,让其模型有机会触及数十亿用户,并创造巨大的正面影响。
对于那些才华洋溢、雄心勃勃且不拘小节的人才,微软 AI 也持续敞开大门,邀请他们一同打造下一个世代的 AI 模型。


