OpenAI gpt-realtime 登場:讓 AI 語音對話告別延遲
OpenAI 發表最新語音模型 gpt-realtime 及 Realtime API 重大更新。體驗前所未有的低延遲、高擬真度和多模態互動,支援 SIP 通話、圖片輸入,並大幅降價 20%,為開發 …
Read MorePage 27 of 77 (764 items)
OpenAI 發表最新語音模型 gpt-realtime 及 Realtime API 重大更新。體驗前所未有的低延遲、高擬真度和多模態互動,支援 SIP 通話、圖片輸入,並大幅降價 20%,為開發 …
Read MoreAI 公司 Anthropic 近日宣布更新其 AI 助理 Claude 的消費者條款與隱私政策,賦予使用者更大的數據控制權,可以自行決定是否允許其對話內容用於模型訓練。本文將深入解析這次更新的重 …
Read More探索騰訊混元推出的 HunyuanVideo-Foley,一款專業級 AI 影片音效生成工具。了解它如何透過多模態擴散模型,為短片、廣告和遊戲開發帶來高傳真、與畫面完美同步的音效,徹底改變內容創作流 …
Read More探索 Google Vids 最新的生成式 AI 功能!從圖片生成影片、AI 虛擬人像到自動剪輯,製作專業影片從未如此簡單。了解 Google Workspace 如何透過 AI 徹底改變您的內容創 …
Read More想像一下,只要一張靜態照片和一段錄音,就能讓畫中人物栩栩如生地開口說話。這不再是科幻電影的場景。阿里 Wan 團隊正式開源了其最新的音訊驅動影片生成模型 Wan2.2-S2V-14B,為內容創作與數 …
Read More
Elon Musk 旗下的 xAI 公司再次投下重磅消息,正式發布專為程式設計打造的 AI 模型——Grok Code Fast 1,代號「Sonic」。此模型不僅擁有驚人的 256,000 …
Read More探索 Google 最新 AI 圖像模型 Gemini 2.5 Flash Image (nano-banana)。本文將深入解析其強大的多圖融合、角色一致性、自然語言編輯等革命性功能,以及如何為開 …
Read More探索 Google 翻譯最新的兩大 AI 功能!體驗支援超過 70 種語言的即時對話翻譯,以及專為你打造的個人化語言練習。無論是出國旅遊還是學習新語言,這款應用程式都將成為你最得力的溝通夥伴,讓語言 …
Read More探索微軟最新開源文字轉語音 (TTS) 模型 VibeVoice。它提供 1.5B 和 7B 兩種版本,支援長達 90 分鐘的語音生成、最多 4 人對話、優異的中文效果(偏向外國人講中文)和背景音 …
Read MoreGoogle 的 AI 筆記工具 NotebookLM 最近迎來了重大更新。 Video Overviews 功能不再僅限於英文,現已支援多達 80 種語言,讓跨語言的影音內容處理能力大幅提升。同 …
Read More
© 2026 Communeify. All rights reserved.