Voice

Page 2 of 5 (47 items)

tool

Dec 17, 2025

阿里雲 FunAudioLLM 團隊最新發布 CosyVoice 3，這款僅 0.5B 參數的 TTS 模型支援中英日韓等 9 種語言及 18 種方言，具備 150ms 極低延遲與超高擬真度。本文詳 …

tool

Dec 16, 2025

深入解析 Resemble AI 最新推出的 Chatterbox-Turbo，這款僅 3.5 億參數的開源模型如何透過單步解碼與副語言標籤（如笑聲、咳嗽）重新定義語音合成的真實感。本文將提供詳細的 …

tool

Dec 11, 2025

探索由智譜 AI 團隊推出的 GLM-TTS，這款強大的開源語音合成系統如何透過獨特的強化學習架構，實現只需幾秒素材就能完成的高品質聲音複製。本文將詳細剖析其技術原理、情感控制功能以及如何實際應用， …

tool

Dec 5, 2025

微軟發布 VibeVoice-Realtime-0.5B，這是一款基於 Qwen2.5 的輕量級文字轉語音模型。支援串流輸入與長文本生成，首字延遲低至 300ms。本文將解析其技術架構、效能評測及使 …

tool

Nov 26, 2025

還記得Dia嗎? 本文將介紹由 Nari-labs 開發的 Dia2 模型，這是一款專為生成自然英語對話設計的 AI 工具。它具備獨特的串流輸入功能，能在接收到少數文字時即開始運作，大幅降低語音系統 …

tool

Nov 19, 2025

引言：打破速度與隱私的藩籬在語音互動技術日益普及的當下，使用者對於「回應速度」的要求也水漲船高。試想一下，當你詢問智慧助理一個問題，中間那幾秒鐘的尷尬空白，往往就足以破壞整個對話的沉浸感。市面上許多 …

tool

Nov 12, 2025

探索 Maya1，一款顛覆性的開源語音 AI 模型。它不僅能用自然語言創造聲音，還能精準表達超過 20 種情緒。了解它如何為創作者、開發者和所有需要「聲音」的專案，帶來前所未有的自由度與生命力。你 …

tool

Oct 29, 2025

AI 語音合成又迎來了新的挑戰者。SoulX-Podcast 號稱能生成長達 90 分鐘、支持多種方言、且情感自然的 AI 播客對話。這項新技術真的能克服以往模型在多說話者場景下的尷尬表現嗎？本文將 …

tool

Oct 28, 2025

探索 VoxCPM，一款由 ModelBest、清華大學及 OpenBMB 聯手打造的開源文字轉語音（TTS）模型。本文將深入解析其三大核心亮點：零樣本聲音複製、情境感知語音生成以及高效能即時合成。 …

tool

Oct 2, 2025

探索 KaniTTS 系列文字轉語音模型，從最初的 370M 到最新的 400M 版本，它不僅速度飛快，音質更是無可挑剔。這篇文章將帶您了解其多語言支援、高效能表現以及背後的技術架構，看看它如何為即 …