
Chatterbox Multilingual:聴覚体験を覆すオープンソース音声AI、23言語に即対応
Resemble AIがリリースしたオープンソースのTTS(テキスト読み上げ)モデル、Chatterbox Multilingualを探る。リアルタイム音声クローニング、感情制御、23言語サポートを …
Read MorePage 4 of 5 (41 items)

Resemble AIがリリースしたオープンソースのTTS(テキスト読み上げ)モデル、Chatterbox Multilingualを探る。リアルタイム音声クローニング、感情制御、23言語サポートを …
Read Moreマイクロソフト Copilot Labs の最新実験ツール、Audio Expressions を探る!テキストを無料で表現力豊かでスタイリッシュな音声に変換する方法を学びましょう。コンテンツクリ …
Read MoreAI音声モデルの世界にまた新たなヘビー級選手が登場!StepFunが発表した最新のオープンソースエンドツーエンド大規模音声モデル「Step-Audio 2 mini」は、いくつかの国際的な評価でトッ …
Read MoreマイクロソフトAI(MAI)は、最新開発の2つの強力なモデル、超高効率の音声生成モデル「MAI-Voice-1」と大規模基盤モデル「MAI-1-preview」を発表しました。これは単なる技術的な飛 …
Read Moreマイクロソフトの最新オープンソーステキスト読み上げ(TTS)モデル、VibeVoiceを探る。1.5Bと7Bの2つのバージョンが提供され、最大90分の音声生成、最大4人の会話、優れた中国語効果(外国 …
Read More
DMflow.chat: Your intelligent AI partner for exceptional customer engagement.
Learn MoreKitten MLチームは、25MBのNanoプレビュー版のリリースに続き、再びKitten TTS Miniを衝撃的に発表しました!この170MBのオープンソーステキスト読み上げモデルは、同様に8 …
Read More
Boson AIは、最新のオーディオ基盤モデルであるHiggs Audio v2を正式にオープンソース化しました。このモデルは、事前学習のみでgpt-4o-mini-ttsなどのトップクラスの競合を …
Read More絶賛されたStyleTTS 2に続き、開発者のyl4579が再びオープンソースコミュニティに驚きをもたらしました。新たにリリースされたDMOSpeech2は、F5-TTSの強化版であるだけでなく、速 …
Read MoreかつてByteDanceによって発表されたものの、主要コンポーネントが欠けていたために普及しなかった音声クローニング技術MegaTTS 3が、オープンソースコミュニティの努力のおかげで復活しました。 …
Read More
Bilibiliチームが開発した革命的なテキスト読み上げAI、IndexTTS2を探る。本記事では、わずか数秒の音声ファイルで映画レベルの音声クローンを実現し、前例のない感情コントロールを可能にする …
Read More
DMflow.chat: Your intelligent AI partner for exceptional customer engagement.
Learn More© 2026 Communeify. All rights reserved.