Asr | Communeify

Page 1 of 1 (9 items)

tool

Feb 5, 2026

この新しい音声モデルは、40億パラメータというコンパクトなサイズでありながら、驚異的な低遅延とApache 2.0オープンソースライセンスにより、音声文字起こし市場の既存のルールを打ち破り、開発者に …

tool

Jan 30, 2026

長い間、OpenAIのWhisperシリーズモデルは、オープンソースの自動音声認識（ASR）分野における事実上の標準解となっていました。開発者が音声のテキスト化タスクを処理する必要があるとき、最初に頭 …

tool

Jan 22, 2026

途切れる録音にサヨナラ！Microsoft VibeVoice ASRが挑む60分連続の高精度文字起こし AIを使って長時間の議事録やポッドキャストの文字起こしをしようとしたことがあるなら、こんな状況 …

tool

Jan 9, 2026

OpenMOSS チームは 2026 年初頭に、エンドツーエンドのマルチモーダル大規模言語モデルである MOSS-Transcribe-Diarize を発表しました。これは高精度な音声書き起こしを …

tool

Dec 11, 2025

1.5Bパラメータの軽量設計であるGLM-ASR-Nano-2512は、複数の音声認識ベンチマークでOpenAI Whisper V3を打ち負かしました。このオープンソースモデルは、広東語などの方言 …

tool

Nov 11, 2025

Meta AIは、1600以上の言語、特にリソースの少ない言語の音声認識をサポートする画期的なOmnilingual ASR技術を発表しました。このオープンソース技術は、技術的なボトルネックを打破す …

tool

Sep 9, 2025

アリババが新たに発表したQwen3-ASR-Flash音声認識モデルを探る。11言語をサポートするだけでなく、言語の自動検出、ノイズフィルタリング機能を備え、その精度は想像を絶する。本記事では、その …

tool

Aug 18, 2025

NVIDIAが発表した最新のParakeet-TDT-0.6b-v3モデルをご覧ください。この6億パラメータのAIモデルが、驚異的な効率と精度で25のヨーロッパ言語のリアルタイム音声テキスト変換をサ …

tool

May 8, 2025

AI音声認識の分野が活況を呈しています！NVIDIAが最近Hugging Faceでオープンソース化したParakeet TDT 0.6B V2モデルは、驚異的な文字起こし速度、商用ツールに匹敵する …