支援 30 國語言、無分詞器!開源語音模型 VoxCPM2 五大功能解析
大家或許還記得早期導航系統那種生硬且充滿機械感的語音。隨著人工智慧不斷演進,文字轉語音(TTS)的技術水準已經來到了令人難以置信的境界。近期開源社群中討論度居高不下的焦點,絕對是來自 OpenBMB …
Read MorePage 1 of 6 (51 items)
大家或許還記得早期導航系統那種生硬且充滿機械感的語音。隨著人工智慧不斷演進,文字轉語音(TTS)的技術水準已經來到了令人難以置信的境界。近期開源社群中討論度居高不下的焦點,絕對是來自 OpenBMB …
Read More打破語言界線!全面解析支援超過 600 種語言的零樣本 TTS 模型 OmniVoice AI 語音合成技術有了全新突破。OmniVoice 挾帶強大的單階段擴散語言模型架構,不僅支援超過六百種語言, …
Read More拋棄傳統頻譜!美團開源 35 億參數 LongCat-AudioDiT,透徹解析波形空間語音生成技術 語音合成技術迎來突破性進展。美團 LongCat …
Read MoreMistral AI 推出輕量級文字轉語音模型 Voxtral TTS:自然度與低延遲的完整解析 語音人工智慧的發展一直備受矚目。過去的語音助理聽起來總是有些生硬。現在情況有了有趣的轉 …
Read More探索 Fish Audio S2 如何透過自然語言標籤實現精細的情緒控制,並以百毫秒級的超低延遲重新定義文本轉語音技術,帶給開發者與創作者前所未有的創作自由。 老實說,大家過去在聽有聲書或語音導覽 …
Read More
探索 Aratako 最新發布的 MioTTS 專案,這是一系列基於 LLM 架構的超輕量級 TTS 模型。從極致的 0.1B 版本到高品質的 2.6B 版本,MioTTS 結合了自研的神經音訊編碼 …
Read More在人工智慧語音合成(TTS)的領域裡,我們經常看到各種新模型的發布,它們大多標榜著聲音更逼真、推理速度更快。但老實說,真正能讓開發者感到興奮的,往往不是只有「魚」吃,而是有人願意把「釣竿」和「漁場」都 …
Read More想像一下,如果你不僅能複製任何人的聲音,還能憑空創造出從未存在過的說話者,甚至連背景的雨聲、街道的嘈雜聲都能一鍵生成,那會是什麼樣的體驗?這聽起來像是科幻電影的劇本,但隨著 MOSS-TTS 的發布, …
Read MoreQwen 團隊正式開源 Qwen3-TTS 系列模型,這套被稱為「全家桶」的解決方案提供了從音色克隆、創造到高擬真語音控制的完整功能。本文將詳細解析其雙軌建模技術、不同參數模型的應用場景,以及如何透 …
Read MoreSoprano TTS 釋出訓練代碼 Soprano-Factory 與編碼器。這款超輕量級模型支援 15ms 低延遲串流,現在更能讓開發者使用自己的數據訓練專屬語音,探索邊緣運算語音生成的更多可 …
Read More
© 2026 Communeify. All rights reserved.