Asr | Communeify

Page 1 of 2 (11 items)

tool

Feb 5, 2026

這款全新的語音模型不只具備 40 億參數的精巧體積，更以驚人的低延遲和 Apache 2.0 開源授權，打破了目前語音轉錄市場的既有規則，為開發者帶來了前所未有的本地端運算潛力。以往提到高精準度的 …

tool

Jan 30, 2026

長期以來，OpenAI 的 Whisper 系列模型幾乎成了開源語音識別（ASR）領域的標準答案。每當開發者需要處理語音轉文字的任務時，腦中浮現的第一個名字通常都是它。但坦白說，這種「一家獨大」的局面 …

tool

Jan 22, 2026

擺脫切碎的錄音檔！Microsoft VibeVoice ASR 挑戰一小時不間斷的精準轉錄如果你曾經試著用 AI 來處理長篇會議記錄或 Podcast 逐字稿，這情況可能讓人感到熟悉：前面十分鐘還 …

tool

Jan 9, 2026

OpenMOSS 團隊於 2026 年初重磅發布 MOSS-Transcribe-Diarize，這是一款端到端的多模態大型語言模型。它不僅能精準進行語音轉錄，還解決了長久以來「多人重疊對話」與「情 …

tool

Dec 11, 2025

GLM-ASR-Nano-2512 以 1.5B 參數量的輕量化設計，在多項語音識別基準測試中擊敗了 OpenAI Whisper V3。這款開源模型不僅在粵語等方言識別上表現出色，更能精準捕捉低音 …

tool

Nov 11, 2025

Meta AI 發表了革命性的 Omnilingual ASR 技術，支援超過 1600 種語言的語音辨識，特別是那些資源稀少的語言。這項開源技術不僅打破了技術瓶頸，更希望透過社群力量，真正弭平數位 …

tool

Sep 9, 2025

探索阿里巴巴最新推出的 Qwen3-ASR-Flash 語音辨識模型。它不僅支援 11 種語言，還能自動偵測語種、過濾雜音，精準度超乎想像。本文將深入解析其強大功能與實際應用場景，看看這個 AI 新 …

tool

Aug 18, 2025

探索 NVIDIA 最新推出的 Parakeet-TDT-0.6b-v3 模型，這款擁有 6 億參數的 AI 模型如何以驚人的效率和準確性，支援 25 種歐洲語言的即時語音轉文字，並為開發者和企業帶 …

tool

Jun 23, 2025

認識 Kyutai STT，這款來自法國的開源語音轉文字模型，不僅在速度和準確性上挑戰 OpenAI 的 Whisper，更帶來了專為即時互動而生的創新架構。無論是開發者、研究員還是 AI 愛好者， …

tool

May 8, 2025

AI 語音辨識領域風起雲湧！NVIDIA 最近在 Hugging Face 上開源釋出的 Parakeet TDT 0.6B V2 模型，憑藉著驚人的轉錄速度、媲美商業工具的準確度，以及佛心的開源授 …