news
2025 年 AI API 戰場報告:Gemini Flash 靠「性價比」稱王
2025 年上半場結束,AI 大模型競爭白熱化。OpenRouter 最新數據揭示了一個重要轉變:性能不再是唯一指標,「性價比」才是王道。本文深入分析 Google Gemini 如何領跑市場,DeepSeek 如何異軍突起,以及 OpenAI 和 Anthropic 面臨的挑戰。 時間過得真快,2025 年已經過了......
tool
ByteDance開源 AI 開發神器 Trae-Agent:用「說」的就能寫程式,開發者生態圈的下一個革命?
ByteDance震撼開源其 AI IDE 核心元件 Trae-Agent!這款基於大型語言模型(LLM)的智慧體,能透過自然語言指令執行複雜的軟體工程任務。本文將深入探討 Trae-Agent 的強大功能、與眾不同之處,以及它為開發者社群帶來的巨大機遇。 科技巨頭ByteDance最近投下了一顆震撼彈,宣布正式開源......
tool
Hugging Face 的 SmolLM3 震撼登場:30億參數模型如何挑戰 40 億級巨頭?
AI 領域又迎來新星!Hugging Face 最新推出的開源語言模型 SmolLM3,以僅僅 30 億(3B)的參數規模,在效能上直逼 40 億(4B)參數的對手。這篇文章將帶您深入了解 SmolLM3 如何透過創新技術、雙模式推理和完全開源的策略,重新定義「輕量級」模型的可能性。 在人工智慧的世界裡,我們似乎總在......
tool
MultiTalk:AI影片生成大突破!從單張照片創造多人自然對話
告別傳統的AI對嘴工具!來認識 MeiGen-AI 推出的開源專案 MultiTalk。它不僅能讓靜態照片中的人物開口說話,更能生成生動、自然的多人對話影片,甚至可以透過文字指令控制角色互動。本文將帶您深入了解這項改變遊戲規則的技術。 你是否曾想像過,只要一張照片、一段音訊,就能讓相片中的人物活過來,不僅開口說話,還......
tool
阿里 ThinkSound 開源:AI 配音不再「看圖說話」,用「思維鏈」聽懂影片的潛台詞*
想像一下,AI 不僅能為影片配上聲音,更能理解畫面中的每一個動態細節,從鳥兒振翅到樹葉搖曳,並允許你像導演一樣即時修改音效。阿里巴巴開源的 ThinkSound 模型,透過創新的「思維鏈」技術,正讓這一切成為現實,徹底改變我們對 AI 音訊生成的想像。 你有沒有過這種經驗?觀看一段 AI 生成的影片,畫面很精彩,但聲......
tool
ERNIE 4.5 來襲:百度震撼推出新一代多模態 AI 王牌,模型能力全面升級!
AI 不再只是聊天機器人!百度最新推出的 ERNIE 4.5 系列,是一個能看、能聽、能讀、能思考的「全能選手」。它憑藉創新的 MoE 架構,在文字、圖像、影片等領域展現驚人實力,更實現了高效能與輕量化部署。現在,就讓我們一起揭開它的神秘面紗! 你有沒有想過,人工智慧(AI)除了跟你聊天打字,還能做些什麼?如果它能像......
tool
TEN VAD 全面開源:比 WebRTC 更強的語音偵測,打造次世代對話 AI 的秘密武器
TEN Agent 團隊近日投下一枚震撼彈,宣布將企業級即時語音活動偵測器(TEN VAD)正式開源。這款工具不僅在精準度上超越了 WebRTC 及 Silero VAD,更憑藉其超低延遲與高相容性,準備徹底改變我們與 AI 互動的方式。 最近,開發者社群掀起了一陣熱議,主角正是 TEN Agent 團隊宣布開源的企......
news
AI 當老闆會怎樣?Anthropic 讓 Claude 經營一個月便利商店,結果完全失控
AI 公司 Anthropic 進行了一項大膽的實驗:讓旗下 AI 模型 Claude 獨自經營辦公室裡的一家小型自動化商店。一個月後,實驗結果不僅揭示了 AI 距離成為精明老闆還有多遠,更記錄了它在過程中犯下的各種離奇錯誤,甚至引發了一場短暫的身份認同危機。 如果一家企業的管理者是 AI,日常營運會是什麼景象?是超......
tool
OmniGen2橫空出世:不只會畫圖,還會「思考」和「修改」的開源AI新星
AI圖像生成的世界又迎來一位重量級選手!北京人工智慧研究院推出的OmniGen2,憑藉其獨特的雙路徑架構和創新的「反思機制」,不僅在開源模型中表現頂尖,更讓我們看到了AI創作的全新可能。它到底強在哪裡?又有哪些值得我們期待的突破? AI畫圖工具滿天飛,OmniGen2憑什麼脫穎而出? 老實說,現在的AI圖像生成工具多......
tool
AI 圖像編輯迎來新浪潮!Black Forest Labs 開源 FLUX.1 Kontext,挑戰 GPT-4o 地位
Black Forest Labs 震撼開源其最新的圖像編輯模型 FLUX.1 Kontext [dev],憑藉其優異的上下文感知編輯能力、高效能與親民的硬體需求,被譽為 GPT-4o 的強力競爭對手。本文將帶您深入了解這款模型的強大功能、對創作者社群的影響,以及其負責任的 AI 開發理念。 最近 AI 圈最熱門的話......
tool
Google Gemma 3n 橫空出世:手機就能跑的 AI 新革命,權重已開放下載!
Google AI 戰場再下一城!最新釋出的輕量級 AI 模型 Gemma 3n,專為手機、筆電等行動裝置設計,不僅效能強悍,更具備處理影像、音訊的多模態能力。最令人振奮的是,模型權重已在 Hugging Face 開放,開發者社群將迎來新一波端側 AI 應用大爆發。 還記得Google IO大會宣布的Gemma 3......
news
Google 新推 AI 試衣 App「Doppl」:手機一拍,任何衣服都能穿上身!
還在對著螢幕想像衣服穿在自己身上的樣子嗎?Google 最新推出的 AI 虛擬試衣應用 Doppl,讓你只需一張全身照,就能輕鬆「試穿」任何看到的服飾。這項黑科技不僅徹底改變了線上購物體驗,更開啟了探索個人風格的全新方式。 你有沒有過這樣的經驗?滑著社群媒體,被某位網紅的穿搭燒到不行;或是在二手店挖到一件寶,卻不確定......
Scroll down to load more...