Voice

Page 1 of 2 (16 items)

tool

Nov 19, 2025

引言：打破速度与隐私的藩篱在语音互动技术日益普及的当下，使用者对于“回应速度”的要求也水涨船高。试想一下，当你询问智慧助理一个问题，中间那几秒钟的尴尬空白，往往就足以破坏整个对话的沉浸感。市面上许多 …

tool

Nov 12, 2025

探索 Maya1，一款颠覆性的开源语音 AI 模型。它不仅能用自然语言创造声音，还能精准表达超过 20 种情绪。了解它如何为创作者、开发者和所有需要“声音”的专案，带来前所未有的自由度与生命力。你 …

tool

Oct 29, 2025

AI 语音合成又迎来了新的挑战者。SoulX-Podcast 号称能生成长达 90 分钟、支持多种方言、且情感自然的 AI 播客对话。这项新技术真的能克服以往模型在多说话者场景下的尴尬表现吗？本文将 …

tool

Oct 28, 2025

探索 VoxCPM，一款由 ModelBest、清华大学及 OpenBMB 联手打造的开源文字转语音（TTS）模型。本文将深入解析其三大核心亮点：零样本声音复制、情境感知语音生成以及高效能即时合成。 …

tool

Oct 2, 2025

探索 KaniTTS 系列文本转语音模型，从最初的 370M 到最新的 400M 版本，它不仅速度飞快，音质更是无可挑剔。这篇文章将带您了解其多语言支持、高效能表现以及背后的技术架构，看看它如何为实 …

tool

Sep 23, 2025

小米最新开源的 MiMo-Audio 模型彻底改变了 AI 音讯领域的游戏规则。它凭借强大的「少样本学习」能力，无需繁琐的微调，仅需几个范例就能生成、转换和编辑语音，就像人类学习一样直观。本文将带您 …

tool

Sep 23, 2025

阿里云 Qwen3-TTS-Flash 表现如何？本文将透过一份关键的性能测试数据，客观分析其与 GPT-4o、Seed-TTS 等顶尖模型的性能差异，特别是在英文和中文语音生成稳定性上的具体表现。 …

news

Sep 5, 2025

探索 Resemble AI 推出的开源 TTS（文本转语音）模型 Chatterbox Multilingual。了解它如何通过即时语音复制、情感控制和 23 种语言支持，为开发者和创作者赋能，并 …

tool

Sep 2, 2025

探索微软 Copilot Labs 最新的实验性工具 Audio Expressions！了解如何免费将文字转换为富有情感和风格的语音，非常适合内容创作者、教育工作者和家长。目前仅支持英文，但其潜力 …

tool

Sep 2, 2025

AI 语音模型的世界又迎来一位重量级选手！由阶跃星辰（StepFun）推出的最新开源端对端语音大模型 Step-Audio 2 mini，不仅在多项国际评测中拔得头筹，更在部分关键指标上超越了备受瞩 …