
DMflow.chat
廣告
DMflow.chat:智能整合,創新溝通!支援持久記憶、客製欄位,無縫連接資料庫與表單,還能自行接 API 輸出資料,讓網頁互動更加靈活高效!
在影像處理領域,如何快速且準確地去除背景,一直是業界關注的重點。傳統方法依賴綠幕技術或手動摳圖,耗時且成本高昂。如今,BEN2 (Background Erase Network 2) 透過深度學習技術,帶來了一種更高效、準確的前景分割方案。
BEN2 是由 Prama LLC 開發的深度學習模型,專門用於影像與影片的背景移除與前景分割。該技術基於創新的 置信度引導摳圖 (Confidence Guided Matting, CGM) 管道,特別擅長處理細緻區域,如頭髮、透明物體邊緣等。BEN2 能夠在 高解析度圖像 (4K) 上運作,並支援 GPU 加速,大幅提升處理速度。
BEN2 首先使用基礎模型進行初步前景分割,並生成一張前景掩碼 (mask)。然而,影像中的部分像素,特別是邊緣區域,可能會產生較低的分割置信度。這時,置信度映射 (confidence map) 會識別這些不確定區域,進一步傳遞給 精細化網絡 (Refiner Network) 進行優化。
Refiner Network 針對 邊緣細節處理,例如髮絲、透明材質、複雜光影區域等,透過多尺度特徵融合與上下文信息補償,提升前景分割的準確性。
BEN2 採用了高效的 編碼器-解碼器 (Encoder-Decoder) 架構,並在 DIS5k 與 Prama LLC 自有的 22K 分割數據集 上進行訓練,使其能適應不同場景與光照條件。
BEN2 支援 CUDA,並可在 NVIDIA GPU 上執行加速。根據官方測試結果:
我們來看看 BEN2 與其他影像分割模型的比較。
模型 | IoU | Accuracy |
---|---|---|
BEN_Base | 0.88 | 0.90 |
BEN_Base+Refiner | 0.905 | 0.96 |
BiRefNet | 0.93 | 0.96 |
RMBG2 | 0.935 | 0.96 |
BEN2_Base | 0.95 | 0.98 |
BEN2_Base+Refiner | 0.96 | 0.985 |
在 Custom Closed Source Dataset 上,BEN2 在 IoU 和 Accuracy 指標上皆優於其他模型,特別是 BEN2_Base+Refiner 取得了 0.96 的 IoU 與 0.985 的 Accuracy,展現極高的分割能力。
模型 | IoU | Accuracy |
---|---|---|
BEN_Base | 0.83 | 0.97 |
BEN_Base+Refiner | 0.85 | 0.975 |
BiRefNet | 0.835 | 0.975 |
RMBG2 | 0.825 | 0.975 |
BEN2_Base | 0.825 | 0.98 |
BEN2_Base+Refiner | 0.835 | 0.98 |
在 DIS5k Validation Dataset 上,BEN2 的 Accuracy 指標較其他模型略高,但 IoU 變化不明顯。這意味著 BEN2 在影像邊緣處理上的準確度更勝一籌。
BEN2 具備高精度與高效率的前景分割能力,可應用於多種專業場景:
在電商領域,產品圖片背景通常需要去除,以便更好地合成至不同場景中。BEN2 能夠高效處理 產品邊緣與細節,如衣物、飾品、玻璃製品等,確保清晰且自然的分割效果。
影視後期中,傳統綠幕技術雖然成熟,但對光線與場景佈置要求較高。BEN2 可在 普通背景下進行高精度摳圖,大幅簡化後期製作流程。
BEN2 可用於 虛擬直播、AR 應用,自動去除背景,讓虛擬主播無需綠幕就能擁有乾淨背景。
BEN2 提供 批量圖像處理 API,適用於需要大規模影像分割的應用場景,如社群媒體內容創作、廣告設計等。
想嘗試 BEN2 的效果?你可以透過以下連結測試: 👉 BEN2 在線 Demo
如果你是開發者,BEN2 也提供 API,方便整合到你的應用程式中。
BEN2 透過深度學習技術,為影像與影片的前景分割提供了一種高效、精準的解決方案。其 置信度引導摳圖 (CGM) 技術、高分辨率處理能力、GPU 加速,讓影像去背變得更加輕鬆。無論是 電商、影視、AR/VR 還是批量影像處理,BEN2 都能提供專業級的分割效果。
現在,就試試 BEN2,看看它能如何幫助你的影像處理工作吧!
DMflow.chat:智能整合,創新溝通!支援持久記憶、客製欄位,無縫連接資料庫與表單,還能自行接 API 輸出資料,讓網頁互動更加靈活高效!
挑戰 Sora?Luojian 科技開源 Open-Sora 2.0 視訊生成模型 — 更便宜、更快、更強! 開頭 — Sora 太貴?Open-Sora 2.0 來了! 你知道嗎?OpenA...
DeepSeek 推出全新多模態 AI 模型 Janus-Pro,效能超越 DALL-E 3 DeepSeek 這家近期爆紅的 AI 公司,發布了一系列全新的多模態 AI 模型,名為 J...
免費AI繪圖神器降臨!Raphael AI讓你無限暢畫 在這個創意無限的時代,AI繪圖工具正以驚人的速度發展,為藝術創作和設計領域帶來革命性的變革。然而,市面上許多AI繪圖工具往往伴隨著...
探索 FaceFusion 的奇幻世界 - 換臉AI 本次介紹將深入探討人臉融合技術 (FaceFusion) 的原理、應用及未來發展趨勢。我們將從人臉檢測、特徵提取到圖像融合等技術層面...
TransPixar:Adobe 最新突破性透明影片生成技術 前言 在影片生成技術快速發展的今日,Adobe 推出了革命性的 TransPixar 技術,這項創新不僅能透過文字和圖像生...
LatentSync:突破性的 AI 口型同步技術,讓影音製作更上一層樓 在影音內容製作領域中,口型同步一直是個重要且具有挑戰性的問題。LatentSync 作為一個創新的端到端口型同步...
NotebookLM Plus:全方位升級指南與新功能解析 描述 了解 NotebookLM Plus 與 NotebookLM 的差異,探索這項升級服務如何為企業、學校、和機構帶來全新可能性...
NVIDIA RTX 50 系列顯示卡發布:AI 算力翻倍,開創遊戲與創作新紀元 重大突破:Blackwell 架構與 AI 技術 NVIDIA 最新發布的 GeForce RTX™ ...
Kore.ai:企業級對話式 AI 平台的完整指南 Kore.ai Experience Optimization (XO) 平台是一款專為企業設計的對話式 AI 平台,旨在自動化和優化客戶體...