Voice

Page 1 of 6 (57 items)

tool

Jun 29, 2026

拋棄離散 Token 解析開源語音合成新星 dots.tts 的全連續架構與實用技巧許多人可能會好奇，語音合成技術發展至今，是否已經遇到瓶頸？老實說，開源社群最近出現了一個極具話題性的新面孔，也就是 …

tool

Jun 15, 2026

Zyphra 推出 ZONOS2：首創 MoE 架構的即時 TTS 語音克隆模型 Zyphra 最新推出的 ZONOS2 是一款採用 Apache 2.0 授權的開源文字轉語音模型。首創導入混合專家架 …

tool

Jun 5, 2026

聽見真實的情感：Higgs Audio v3 TTS 讓語音 AI 學會真正說話當 AI 代理程式不再只是死板地朗讀文字，對話會變成什麼模樣？本文帶領大家認識這款支援破百種語言、具備行內標籤控制能力 …

tool

May 27, 2026

AI 語音不再像機器人！解析 MOSS-TTS-v1.5 的 31 國語言與精確停頓控制老實說，現在的語音合成技術已經相當普及。打開影音平台，隨處可以聽見流暢的 AI 解說。不過大家往往會發現一個小 …

tool

May 25, 2026

打破語言藩籬的語音引擎大家有沒有想過，如果不需要刻意學習，就能開口說出流利的德文或日文，那會是什麼感覺？如今，語音合成技術正迎來全新的突破。網易有道（NetEase Youdao） …

tool

Apr 14, 2026

0 GPU 需求！解析 1 億參數 MOSS-TTS-Nano 如何在 CPU 跑出 48kHz 高音質語音說實話，要在本地端順暢執行現代的 AI 語音生成模型，往往需要昂貴的顯卡與龐大的記憶體。開 …

tool

Apr 8, 2026

大家或許還記得早期導航系統那種生硬且充滿機械感的語音。隨著人工智慧不斷演進，文字轉語音（TTS）的技術水準已經來到了令人難以置信的境界。近期開源社群中討論度居高不下的焦點，絕對是來自 OpenBMB …

tool

Apr 3, 2026

打破語言界線！全面解析支援超過 600 種語言的零樣本 TTS 模型 OmniVoice AI 語音合成技術有了全新突破。OmniVoice 挾帶強大的單階段擴散語言模型架構，不僅支援超過六百種語言， …

tool

Mar 31, 2026

拋棄傳統頻譜！美團開源 35 億參數 LongCat-AudioDiT，透徹解析波形空間語音生成技術語音合成技術迎來突破性進展。美團 LongCat …

tool

Mar 27, 2026

Mistral AI 推出輕量級文字轉語音模型 Voxtral TTS：自然度與低延遲的完整解析語音人工智慧的發展一直備受矚目。過去的語音助理聽起來總是有些生硬。現在情況有了有趣的轉 …