Vision

Page 1 of 1

(8 items)

tool Jun 29, 2026

告別運算卡頓！京東開源 JoyAI-VL-Interaction 如何改寫即時影音互動規則探討京東 Joy 未來學院最新發佈的 JoyAI-VL-Interaction 模型。透 …

tool Dec 9, 2025

GLM-4.6V 系列模型正式亮相，帶來 106B 與 9B 兩個版本，分別針對雲端高效能與本地低延遲場景。本文將解析其原生 Function Calling 能力如何打通「看」 …

tool Dec 2, 2025

ByteDance Vidi2 震撼登場！深入了解字節跳動如何透過這款大型多模態模型，實現對長影片的精準理解與生成。Vidi2 不僅能精確定位影片中「穿棕色西裝的男人打鼓」等特 …

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

tool Aug 30, 2025

Apple 最近在 Hugging Face 平台上悄悄發布了幾個月前發布的的視覺語言模型 FastVLM。這一舉動震驚了整個 AI 社群，畢竟 Apple 一向以其封閉的生態系 …

tool Aug 26, 2025

AI圈又迎來重磅消息！OpenBMB發布了僅有80億參數的視覺語言模型MiniCPM-V 4.5，並宣稱其在多項視覺基準測試中擊敗了GPT-4o、Gemini Pro等業界巨頭。 …

tool Aug 21, 2025

厭倦了需要時刻連網的 AI 嗎？Liquid AI 推出的全新視覺語言模型 LFM2-VL，專為手機、穿戴裝置等邊緣設備設計。它不僅速度快、效率高，還能保持頂尖的準確度，徹底改變 …

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

tool Aug 18, 2025

Meta AI 近日開源了新一代通用影像辨識模型 DINOv3。它憑藉強大的「自我監督學習」能力，無需人工標註就能在多項視覺任務中達到頂尖水準，從環境監測到醫療影像，其應用潛力正 …

tool Mar 25, 2025

RF-DETR 是什麼？ RF-DETR 是由 Roboflow 團隊開發並開源釋出的最新即時物件偵測（Real-time Object Detection）模型。 …