Voice

Page 3 of 5 (47 items)

tool

Sep 23, 2025

小米最新開源的 MiMo-Audio 模型徹底改變了 AI 音訊領域的遊戲規則。它憑藉強大的「少樣本學習」能力，無需繁瑣的微調，僅需幾個範例就能生成、轉換和編輯語音，就像人類學習一樣直觀。本文將帶您 …

tool

Sep 23, 2025

阿里雲 Qwen3-TTS-Flash 表現如何？本文將透過一份關鍵的性能測試數據，客觀分析其與 GPT-4o、Seed-TTS 等頂尖模型的性能差異，特別是在英文和中文語音生成穩定性上的具體表現。 …

news

Sep 5, 2025

探索 Resemble AI 推出的開源 TTS（文字轉語音）模型 Chatterbox Multilingual。瞭解它如何透過即時語音複製、情感控制和 23 種語言支援，為開發者和創作者賦能，並 …

tool

Sep 2, 2025

探索微軟 Copilot Labs 最新的實驗性工具 Audio Expressions！了解如何免費將文字轉換為富有情感和風格的語音，非常適合內容創作者、教育工作者和家長。目前僅支援英文，但其潛力 …

tool

Sep 2, 2025

AI 語音模型的世界又迎來一位重量級選手！由階躍星辰（StepFun）推出的最新開源端對端語音大模型 Step-Audio 2 mini，不僅在多項國際評測中拔得頭籌，更在部分關鍵指標上超越了備受矚 …

tool

Aug 29, 2025

微軟 AI (MAI) 揭示了其最新研發的兩款強大模型：超高效的語音生成模型 MAI-Voice-1 和大型基礎模型 MAI-1-preview。這不僅是技術的躍進， …

tool

Aug 26, 2025

探索微軟最新開源文字轉語音 (TTS) 模型 VibeVoice。它提供 1.5B 和 7B 兩種版本，支援長達 90 分鐘的語音生成、最多 4 人對話、優異的中文效果(偏向外國人講中文)和背景音 …

tool

Aug 5, 2025

Kitten ML 團隊繼推出 25MB 的 Nano 預覽版後，再度震撼發布 Kitten TTS Mini！這款 170MB 的開源文字轉語音模型，同樣內建 8 種生動聲音，並延續了在手機、樹莓 …

tool

Jul 23, 2025

Boson AI 正式開源其最新的音訊基礎模型 Higgs Audio v2。這個模型僅憑預訓練就在多項評測中擊敗了 gpt-4o-mini-tts 等頂尖對手，展現了前所未有的情感表達、多語言對話 …

tool

Jul 22, 2025

繼廣受好評的 StyleTTS 2 之後，開發者 yl4579 再度為開源社群帶來驚喜。最新發布的 DMOSpeech2 不僅是 F5-TTS 的強化版，更在速度、準確性和穩定性上實現了巨大突破。本 …