Voice

Page 3 of 6

(57 items)

tool Dec 16, 2025

深入解析 Resemble AI 最新推出的 Chatterbox-Turbo，這款僅 3.5 億參數的開源模型如何透過單步解碼與副語言標籤（如笑聲、咳嗽）重新定義語音合成的真實 …

tool Dec 11, 2025

探索由智譜 AI 團隊推出的 GLM-TTS，這款強大的開源語音合成系統如何透過獨特的強化學習架構，實現只需幾秒素材就能完成的高品質聲音複製。本文將詳細剖析其技術原理、情感控制功 …

tool Dec 5, 2025

微軟發布 VibeVoice-Realtime-0.5B，這是一款基於 Qwen2.5 的輕量級文字轉語音模型。支援串流輸入與長文本生成，首字延遲低至 300ms。本文將解析其技 …

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

tool Nov 26, 2025

還記得Dia嗎? 本文將介紹由 Nari-labs 開發的 Dia2 模型，這是一款專為生成自然英語對話設計的 AI 工具。它具備獨特的串流輸入功能，能在接收到少數文字時即開始運 …

tool Nov 19, 2025

引言：打破速度與隱私的藩籬在語音互動技術日益普及的當下，使用者對於「回應速度」的要求也水漲船高。試想一下，當你詢問智慧助理一個問題，中間那幾秒鐘的尷尬空白，往往就足以破壞整個對話 …

tool Nov 12, 2025

探索 Maya1，一款顛覆性的開源語音 AI 模型。它不僅能用自然語言創造聲音，還能精準表達超過 20 種情緒。了解它如何為創作者、開發者和所有需要「聲音」的專案，帶來前所未有的 …

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

tool Oct 29, 2025

AI 語音合成又迎來了新的挑戰者。SoulX-Podcast 號稱能生成長達 90 分鐘、支持多種方言、且情感自然的 AI 播客對話。這項新技術真的能克服以往模型在多說話者場景下 …

tool Oct 28, 2025

探索 VoxCPM，一款由 ModelBest、清華大學及 OpenBMB 聯手打造的開源文字轉語音（TTS）模型。本文將深入解析其三大核心亮點：零樣本聲音複製、情境感知語音生成 …

tool Oct 2, 2025

探索 KaniTTS 系列文字轉語音模型，從最初的 370M 到最新的 400M 版本，它不僅速度飛快，音質更是無可挑剔。這篇文章將帶您了解其多語言支援、高效能表現以及背後的技術 …

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

tool Sep 23, 2025

小米最新開源的 MiMo-Audio 模型徹底改變了 AI 音訊領域的遊戲規則。它憑藉強大的「少樣本學習」能力，無需繁瑣的微調，僅需幾個範例就能生成、轉換和編輯語音，就像人類學習 …