GLM-4.6V 登場:視覺感知與執行動作的無縫整合
GLM-4.6V 系列模型正式亮相,帶來 106B 與 9B 兩個版本,分別針對雲端高效能與本地低延遲場景。本文將解析其原生 Function Calling 能力如何打通「看」與「做」的界線,並深 …
Read MorePage 1 of 1 (7 items)
GLM-4.6V 系列模型正式亮相,帶來 106B 與 9B 兩個版本,分別針對雲端高效能與本地低延遲場景。本文將解析其原生 Function Calling 能力如何打通「看」與「做」的界線,並深 …
Read MoreByteDance Vidi2 震撼登場! 深入了解字節跳動如何透過這款大型多模態模型,實現對長影片的精準理解與生成。Vidi2 不僅能精確定位影片中「穿棕色西裝的男人打鼓」等特定事件,更在基準測試 …
Read MoreApple 最近在 Hugging Face 平台上悄悄發布了幾個月前發布的的視覺語言模型 FastVLM。這一舉動震驚了整個 AI 社群,畢竟 Apple 一向以其封閉的生態系統聞名。然而,這次 …
Read MoreAI圈又迎來重磅消息!OpenBMB發布了僅有80億參數的視覺語言模型MiniCPM-V 4.5,並宣稱其在多項視覺基準測試中擊敗了GPT-4o、Gemini Pro等業界巨頭。這究竟是噱頭還是真材 …
Read More厭倦了需要時刻連網的 AI 嗎?Liquid AI 推出的全新視覺語言模型 LFM2-VL,專為手機、穿戴裝置等邊緣設備設計。它不僅速度快、效率高,還能保持頂尖的準確度,徹底改變我們對設備端 AI …
Read More
Meta AI 近日開源了新一代通用影像辨識模型 DINOv3。它憑藉強大的「自我監督學習」能力,無需人工標註就能在多項視覺任務中達到頂尖水準,從環境監測到醫療影像,其應用潛力正引發全球開發者的熱烈 …
Read MoreRF-DETR 是什麼? RF-DETR 是由 Roboflow 團隊開發並開源釋出的最新即時物件偵測(Real-time Object Detection)模型。如果你對 YOLO 模型的速度或準確 …
Read More
© 2026 Communeify. All rights reserved.
By continuing to use this website, you agree to the use of cookies according to our privacy policy.