BEN2:精準影像前景分割的 AI 解決方案

在影像處理領域,如何快速且準確地去除背景,一直是業界關注的重點。傳統方法依賴綠幕技術或手動摳圖,耗時且成本高昂。如今,BEN2 (Background Erase Network 2) 透過深度學習技術,帶來了一種更高效、準確的前景分割方案。

BEN2:精準影像前景分割的 AI 解決方案

什麼是 BEN2?

BEN2 是由 Prama LLC 開發的深度學習模型,專門用於影像與影片的背景移除與前景分割。該技術基於創新的 置信度引導摳圖 (Confidence Guided Matting, CGM) 管道,特別擅長處理細緻區域,如頭髮、透明物體邊緣等。BEN2 能夠在 高解析度圖像 (4K) 上運作,並支援 GPU 加速,大幅提升處理速度。


BEN2 的核心技術

1. 置信度引導摳圖 (CGM)

BEN2 首先使用基礎模型進行初步前景分割,並生成一張前景掩碼 (mask)。然而,影像中的部分像素,特別是邊緣區域,可能會產生較低的分割置信度。這時,置信度映射 (confidence map) 會識別這些不確定區域,進一步傳遞給 精細化網絡 (Refiner Network) 進行優化。

2. 精細化網絡 (Refiner Network)

Refiner Network 針對 邊緣細節處理,例如髮絲、透明材質、複雜光影區域等,透過多尺度特徵融合與上下文信息補償,提升前景分割的準確性。

3. 深度學習架構與數據集訓練

BEN2 採用了高效的 編碼器-解碼器 (Encoder-Decoder) 架構,並在 DIS5kPrama LLC 自有的 22K 分割數據集 上進行訓練,使其能適應不同場景與光照條件。

4. 高效能 GPU 加速

BEN2 支援 CUDA,並可在 NVIDIA GPU 上執行加速。根據官方測試結果:

  • 1080p 圖像處理時間:6 秒內
  • 4K 圖像處理時間:約 20 秒 這使得 BEN2 在專業應用場景中擁有極高的實用性。

BEN2 的效能對比

我們來看看 BEN2 與其他影像分割模型的比較。

Custom Closed Source Dataset 測試結果

模型 IoU Accuracy
BEN_Base 0.88 0.90
BEN_Base+Refiner 0.905 0.96
BiRefNet 0.93 0.96
RMBG2 0.935 0.96
BEN2_Base 0.95 0.98
BEN2_Base+Refiner 0.96 0.985

Custom Closed Source Dataset 上,BEN2 在 IoU 和 Accuracy 指標上皆優於其他模型,特別是 BEN2_Base+Refiner 取得了 0.96 的 IoU 與 0.985 的 Accuracy,展現極高的分割能力。

DIS5k Validation Dataset 測試結果

模型 IoU Accuracy
BEN_Base 0.83 0.97
BEN_Base+Refiner 0.85 0.975
BiRefNet 0.835 0.975
RMBG2 0.825 0.975
BEN2_Base 0.825 0.98
BEN2_Base+Refiner 0.835 0.98

DIS5k Validation Dataset 上,BEN2 的 Accuracy 指標較其他模型略高,但 IoU 變化不明顯。這意味著 BEN2 在影像邊緣處理上的準確度更勝一籌


BEN2 的應用場景

BEN2 具備高精度與高效率的前景分割能力,可應用於多種專業場景:

1. 電商與產品攝影

在電商領域,產品圖片背景通常需要去除,以便更好地合成至不同場景中。BEN2 能夠高效處理 產品邊緣與細節,如衣物、飾品、玻璃製品等,確保清晰且自然的分割效果。

2. 影視後期製作

影視後期中,傳統綠幕技術雖然成熟,但對光線與場景佈置要求較高。BEN2 可在 普通背景下進行高精度摳圖,大幅簡化後期製作流程。

3. AR/VR 與虛擬主播

BEN2 可用於 虛擬直播、AR 應用,自動去除背景,讓虛擬主播無需綠幕就能擁有乾淨背景。

4. 批量圖像處理

BEN2 提供 批量圖像處理 API,適用於需要大規模影像分割的應用場景,如社群媒體內容創作、廣告設計等。


如何使用 BEN2?

1. 在線體驗 BEN2

想嘗試 BEN2 的效果?你可以透過以下連結測試: 👉 BEN2 在線 Demo

huggingface測試使用

2. 開發與集成

如果你是開發者,BEN2 也提供 API,方便整合到你的應用程式中。


總結

BEN2 透過深度學習技術,為影像與影片的前景分割提供了一種高效、精準的解決方案。其 置信度引導摳圖 (CGM) 技術高分辨率處理能力GPU 加速,讓影像去背變得更加輕鬆。無論是 電商、影視、AR/VR 還是批量影像處理,BEN2 都能提供專業級的分割效果。

現在,就試試 BEN2,看看它能如何幫助你的影像處理工作吧!

Share on:
Previous: OpenAI 的 AI 未來藍圖:從 GPT-4.5(Orion)到 GPT-5
Next: Mistral AI 正式推出 iOS 和 Android 版 Le Chat,能撼動 ChatGPT 的地位嗎?
DMflow.chat

DMflow.chat

廣告

一站整合多平台聊天,體驗真人與 AI 自由切換的新境界!支援 Facebook、Instagram、Telegram、LINE 及網站,結合歷史記錄、推播通知、行銷活動及客服轉接,全面提升效率與互動。

吉卜力風格免費玩!EasyControl_Ghibli 模型橫空出世,照片秒變動畫感
2 April 2025

吉卜力風格免費玩!EasyControl_Ghibli 模型橫空出世,照片秒變動畫感

吉卜力風格免費玩!EasyControl_Ghibli 模型橫空出世,照片秒變動畫感 厭倦了 AI 繪圖工具的付費牆和限制嗎?最近 Hugging Face 上出現了一款名為 EasyC...

OpenAI 推出 GPT-4o 圖像生成功能,支援多輪對話編輯
26 March 2025

OpenAI 推出 GPT-4o 圖像生成功能,支援多輪對話編輯

OpenAI 推出 GPT-4o 圖像生成功能,支援多輪對話編輯 OpenAI 於 2025 年 3 月 25 日宣布,最新的 GPT-4o 模型現已支援圖像生成與多輪對話編輯,帶來更強大的 ...

StarVector:從圖像與文本生成 SVG 代碼的多模態模型
22 March 2025

StarVector:從圖像與文本生成 SVG 代碼的多模態模型

StarVector:從圖像與文本生成 SVG 代碼的多模態模型 什麼是 StarVector? StarVector 是一款專門為 Scalable Vector Graphics (SVG...

Google AI Studio 影像生成功能升級:更低誤判率、更強大易用性
21 March 2025

Google AI Studio 影像生成功能升級:更低誤判率、更強大易用性

Google AI Studio 影像生成功能升級:更低誤判率、更強大易用性 Google AI Studio 的重大更新:更準確、更高效的 AI 影像生成 Google 最近對其 AI 開...

挑戰 Sora?Luojian 科技開源 Open-Sora 2.0 視訊生成模型 — 更便宜、更快、更強!
13 March 2025

挑戰 Sora?Luojian 科技開源 Open-Sora 2.0 視訊生成模型 — 更便宜、更快、更強!

挑戰 Sora?Luojian 科技開源 Open-Sora 2.0 視訊生成模型 — 更便宜、更快、更強! 開頭 — Sora 太貴?Open-Sora 2.0 來了! 你知道嗎?OpenA...

DeepSeek 推出全新多模態 AI 模型 Janus-Pro,效能超越 DALL-E 3
27 January 2025

DeepSeek 推出全新多模態 AI 模型 Janus-Pro,效能超越 DALL-E 3

DeepSeek 推出全新多模態 AI 模型 Janus-Pro,效能超越 DALL-E 3 DeepSeek 這家近期爆紅的 AI 公司,發布了一系列全新的多模態 AI 模型,名為 J...

OpenAI推出結構化輸出功能:讓AI生成的JSON更加可靠
7 August 2024

OpenAI推出結構化輸出功能:讓AI生成的JSON更加可靠

OpenAI推出結構化輸出功能:讓AI生成的JSON更加可靠 OpenAI在其API中新增了結構化輸出功能,大幅提升了AI模型生成有效JSON的可靠性。這項功能不僅讓開發者能更輕鬆地建立穩定的...

Google推出突破性AI工具Whisk:用圖像激發創意靈感
20 December 2024

Google推出突破性AI工具Whisk:用圖像激發創意靈感

Google推出突破性AI工具Whisk:用圖像激發創意靈感 Google Labs推出劃時代AI工具Whisk,顛覆傳統AI圖像生成方式,創作者僅需上傳圖像,即可激發無限創意靈感。 ...

LangChain:革新AI應用開發的全方位框架
29 July 2024

LangChain:革新AI應用開發的全方位框架

LangChain:革新AI應用開發的全方位框架 簡介 LangChain是一個開創性的開源框架,專為打造基於大型語言模型(LLM)的應用而設計。本文將深入探討LangChain的核心概念、主...