
DMflow.chat
廣告
一站整合多平台聊天,體驗真人與 AI 自由切換的新境界!支援 Facebook、Instagram、Telegram、LINE 及網站,結合歷史記錄、推播通知、行銷活動及客服轉接,全面提升效率與互動。
在影像處理領域,如何快速且準確地去除背景,一直是業界關注的重點。傳統方法依賴綠幕技術或手動摳圖,耗時且成本高昂。如今,BEN2 (Background Erase Network 2) 透過深度學習技術,帶來了一種更高效、準確的前景分割方案。
BEN2 是由 Prama LLC 開發的深度學習模型,專門用於影像與影片的背景移除與前景分割。該技術基於創新的 置信度引導摳圖 (Confidence Guided Matting, CGM) 管道,特別擅長處理細緻區域,如頭髮、透明物體邊緣等。BEN2 能夠在 高解析度圖像 (4K) 上運作,並支援 GPU 加速,大幅提升處理速度。
BEN2 首先使用基礎模型進行初步前景分割,並生成一張前景掩碼 (mask)。然而,影像中的部分像素,特別是邊緣區域,可能會產生較低的分割置信度。這時,置信度映射 (confidence map) 會識別這些不確定區域,進一步傳遞給 精細化網絡 (Refiner Network) 進行優化。
Refiner Network 針對 邊緣細節處理,例如髮絲、透明材質、複雜光影區域等,透過多尺度特徵融合與上下文信息補償,提升前景分割的準確性。
BEN2 採用了高效的 編碼器-解碼器 (Encoder-Decoder) 架構,並在 DIS5k 與 Prama LLC 自有的 22K 分割數據集 上進行訓練,使其能適應不同場景與光照條件。
BEN2 支援 CUDA,並可在 NVIDIA GPU 上執行加速。根據官方測試結果:
我們來看看 BEN2 與其他影像分割模型的比較。
模型 | IoU | Accuracy |
---|---|---|
BEN_Base | 0.88 | 0.90 |
BEN_Base+Refiner | 0.905 | 0.96 |
BiRefNet | 0.93 | 0.96 |
RMBG2 | 0.935 | 0.96 |
BEN2_Base | 0.95 | 0.98 |
BEN2_Base+Refiner | 0.96 | 0.985 |
在 Custom Closed Source Dataset 上,BEN2 在 IoU 和 Accuracy 指標上皆優於其他模型,特別是 BEN2_Base+Refiner 取得了 0.96 的 IoU 與 0.985 的 Accuracy,展現極高的分割能力。
模型 | IoU | Accuracy |
---|---|---|
BEN_Base | 0.83 | 0.97 |
BEN_Base+Refiner | 0.85 | 0.975 |
BiRefNet | 0.835 | 0.975 |
RMBG2 | 0.825 | 0.975 |
BEN2_Base | 0.825 | 0.98 |
BEN2_Base+Refiner | 0.835 | 0.98 |
在 DIS5k Validation Dataset 上,BEN2 的 Accuracy 指標較其他模型略高,但 IoU 變化不明顯。這意味著 BEN2 在影像邊緣處理上的準確度更勝一籌。
BEN2 具備高精度與高效率的前景分割能力,可應用於多種專業場景:
在電商領域,產品圖片背景通常需要去除,以便更好地合成至不同場景中。BEN2 能夠高效處理 產品邊緣與細節,如衣物、飾品、玻璃製品等,確保清晰且自然的分割效果。
影視後期中,傳統綠幕技術雖然成熟,但對光線與場景佈置要求較高。BEN2 可在 普通背景下進行高精度摳圖,大幅簡化後期製作流程。
BEN2 可用於 虛擬直播、AR 應用,自動去除背景,讓虛擬主播無需綠幕就能擁有乾淨背景。
BEN2 提供 批量圖像處理 API,適用於需要大規模影像分割的應用場景,如社群媒體內容創作、廣告設計等。
想嘗試 BEN2 的效果?你可以透過以下連結測試: 👉 BEN2 在線 Demo
如果你是開發者,BEN2 也提供 API,方便整合到你的應用程式中。
BEN2 透過深度學習技術,為影像與影片的前景分割提供了一種高效、精準的解決方案。其 置信度引導摳圖 (CGM) 技術、高分辨率處理能力、GPU 加速,讓影像去背變得更加輕鬆。無論是 電商、影視、AR/VR 還是批量影像處理,BEN2 都能提供專業級的分割效果。
現在,就試試 BEN2,看看它能如何幫助你的影像處理工作吧!
一站整合多平台聊天,體驗真人與 AI 自由切換的新境界!支援 Facebook、Instagram、Telegram、LINE 及網站,結合歷史記錄、推播通知、行銷活動及客服轉接,全面提升效率與互動。
Google Veo 2 登陸 AI Studio!免費試玩,人人都能變身 AI 導演? Google 最新的 AI 影片生成模型 Veo 2 終於在 AI Studio 開放免費試用了...
復旦大學聯手階躍星辰!OmniSVG 橫空出世,AI 向量圖生成要變天了? 聽說過用 AI 一句話生成向量圖 (SVG) 嗎?復旦大學和階躍星辰合作的 OmniSVG 模型來了!它不只能...
MuseTalk 深入解析:騰訊音樂打造的即時高傳真 AI 唇形同步神器 探索由騰訊音樂 Lyra Lab 開發的 MuseTalk 技術。了解這款開源 AI 模型如何實現即時、高品質的...
Midjourney V7 來了!不只畫質升級,這次 AI 繪圖要讀懂你的心? AI 繪圖界的大咖 Midjourney 終於推出 V7 Alpha 版!這次不只追求更美的畫面和更順暢的...
吉卜力風格免費玩!EasyControl_Ghibli 模型橫空出世,照片秒變動畫感 厭倦了 AI 繪圖工具的付費牆和限制嗎?最近 Hugging Face 上出現了一款名為 EasyC...
OpenAI 推出 GPT-4o 圖像生成功能,支援多輪對話編輯 OpenAI 於 2025 年 3 月 25 日宣布,最新的 GPT-4o 模型現已支援圖像生成與多輪對話編輯,帶來更強大的 ...
探索 FaceFusion 的奇幻世界 - 換臉AI 本次介紹將深入探討人臉融合技術 (FaceFusion) 的原理、應用及未來發展趨勢。我們將從人臉檢測、特徵提取到圖像融合等技術層面...
別只知道 Cursor!Windsurf 用 AI Agent 幫你「指揮」程式碼,開發體驗大升級? 厭倦了複製貼上和無止盡的 Debug 嗎?繼 Cursor 之後,AI 程式設計工具...
NotebookLM:Google最新AI筆記工具,讓你的研究效率倍增! 描述 想像擁有一位天才研究助理,能夠閱讀所有文件、完美總結,還能與你討論內容?Google的最新AI工具Noteboo...