部落格 | Communeify

Page 35 of 77 (764 items)

news

Jul 16, 2025

Google 正式向所有開發者開放 Gemini 嵌入模型（Embedding Model）。這不僅代表著頂尖的 AI 技術，更帶來了每百萬 token 僅 0.15 美元的震撼價格。本文將深入解析 …

tool

Jul 16, 2025

探索由 Bilibili 團隊開發的革命性文字轉語音 AI — IndexTTS2。本文將深入解析它如何透過短短幾秒音檔實現影視級的聲音複製、前所未有的情緒控制，以及為何它能成為專業影視製作的利器， …

tool

Jul 11, 2025

新創公司 Liquid AI 推出了第二代基礎模型 LFM2，專為手機、筆電、AI PC 等邊緣裝置設計。本文將深入探討 LFM2 的三大模型、其驚人的效能表現，以及與 Qwen 3、Llama …

news

Jul 11, 2025

Google 宣布為其 AI 影片生成器 Veo3 新增「圖片到影片」的強大功能，並整合至 Gemini 應用程式中。想知道如何輕鬆將靜態照片轉換為動態影片嗎？一起來看看這項創新技術如何透過數位浮水 …

tool

Jul 10, 2025

想像一下，AI 不僅能為影片配上聲音，更能理解畫面中的每一個動態細節，從鳥兒振翅到樹葉搖曳，並允許你像導演一樣即時修改音效。阿里巴巴開源的 ThinkSound 模型，透過創新的「思維鏈」技術，正讓 …

tool

Jul 10, 2025

告別傳統的AI對嘴工具！來認識 MeiGen-AI 推出的開源專案 MultiTalk。它不僅能讓靜態照片中的人物開口說話，更能生成生動、自然的多人對話影片，甚至可以透過文字指令控制角色互動。本文將 …

tool

Jul 10, 2025

AI 領域又迎來新星！Hugging Face 最新推出的開源語言模型 SmolLM3，以僅僅 30 億（3B）的參數規模，在效能上直逼 40 億（4B）參數的對手。 …

tool

Jul 10, 2025

ByteDance震撼開源其 AI IDE 核心元件 Trae-Agent！這款基於大型語言模型（LLM）的智慧體，能透過自然語言指令執行複雜的軟體工程任務。本文將深入探討 Trae-Agent 的 …

news

Jul 10, 2025

2025 年上半場結束，AI 大模型競爭白熱化。OpenRouter 最新數據揭示了一個重要轉變：性能不再是唯一指標，「性價比」才是王道。本文深入分析 Google Gemini 如何領跑市 …

tool

Jul 1, 2025

TEN Agent 團隊近日投下一枚震撼彈，宣布將企業級即時語音活動偵測器（TEN VAD）正式開源。這款工具不僅在精準度上超越了 WebRTC 及 Silero VAD，更憑藉其超低延遲與高相容 …