
DMflow.chat
廣告
DMflow.chat:智慧整合,創新溝通!除了持久記憶與客製欄位外,更支持真人與 AI 的靈活轉換,無縫連接資料庫與表單,讓網頁互動更靈活高效。
StarVector 是一款專門為 Scalable Vector Graphics (SVG) 生成而設計的多模態視覺語言模型(VLM)。它可以透過 圖像轉 SVG(Image-to-SVG) 和 文本轉 SVG(Text-to-SVG) 兩種方式生成高精度、語義豐富的 SVG 代碼。與傳統的曲線向量化方法不同,StarVector 直接在 SVG 代碼層面 運作,使其能夠準確使用 SVG 原語(如 橢圓、矩形、多邊形、文本 等),避免傳統方法常見的失真與偽影。
StarVector 採用 多模態架構,能夠處理 圖像 與 文本 兩種輸入:
模型核心基於 StarCoder,使其能夠將編碼能力遷移到 SVG 生成領域,確保代碼精簡且語法正確。
傳統 SVG 生成方法,如 AutoTrace、Potrace、VTracer 等,主要依賴於 曲線擬合,無法準確理解圖像的語義,經常產生 扭曲或冗長的路徑數據,且難以處理 複雜的 SVG 元素。
StarVector 的優勢:
<path>
)。過去,許多 SVG 生成方法依賴於 像素級評估指標(如 MSE),但這些方法無法真正衡量 SVG 的語義準確性。因此,StarVector 團隊開發了 SVG-Bench,這是一個專門用於測試 SVG 生成質量 的基準測試,涵蓋 10 個數據集與 3 種 SVG 生成任務:
目前,StarVector 提供 兩個模型版本,並在 Hugging Face 上開放下載:
在 SVG-Bench 測試中,StarVector 在 DinoScore 指標上的表現超越了所有基準模型:
方法 | SVG-Stack | SVG-Fonts | SVG-Icons | SVG-Emoji | SVG-Diagrams |
---|---|---|---|---|---|
AutoTrace | 0.942 | 0.954 | 0.946 | 0.975 | 0.874 |
Potrace | 0.898 | 0.967 | 0.972 | 0.882 | 0.875 |
VTracer | 0.954 | 0.964 | 0.940 | 0.981 | 0.882 |
Im2Vec | 0.692 | 0.733 | 0.754 | 0.732 | - |
LIVE | 0.934 | 0.956 | 0.959 | 0.969 | 0.870 |
DiffVG | 0.810 | 0.821 | 0.952 | 0.814 | 0.822 |
GPT-4-V | 0.852 | 0.842 | 0.848 | 0.850 | - |
💫 StarVector-1B | 0.926 | 0.978 | 0.975 | 0.929 | 0.943 |
💫 StarVector-8B | 0.966 | 0.982 | 0.984 | 0.981 | 0.959 |
注意: StarVector 不適用於自然圖像或插畫,因為模型的訓練數據主要來自 圖標、技術圖表、圖表(charts)、標誌等矢量圖形。
StarVector 的訓練數據來自 SVG-Bench,這是一個專門為 SVG 生成模型設計的數據集,涵蓋 10 個子數據集,每個數據集針對不同的 SVG 生成場景:
數據集 | 訓練集 | 驗證集 | 測試集 | 平均 Token 長度 | 支援的 SVG 原語 | 註釋類型 |
---|---|---|---|---|---|---|
SVG-Stack | 2.1M | 108k | 5.7k | 1,822 ± 1,808 | 所有 SVG 原語 | 圖像標註 |
SVG-Stack_sim | 601k | 30.1k | 1.5k | 2,000 ± 918 | Vector path | - |
SVG-Diagrams | - | - | 472 | 3,486 ± 1,918 | 所有 SVG 原語 | - |
SVG-Fonts | 1.8M | 91.5k | 4.8k | 2,121 ± 1,868 | Vector path | 字體標註 |
SVG-Fonts_sim | 1.4M | 71.7k | 3.7k | 1,722 ± 723 | Vector path | 字體標註 |
SVG-Emoji | 8.7k | 667 | 668 | 2,551 ± 1,805 | 所有 SVG 原語 | - |
SVG-Emoji_sim | 580 | 57 | 96 | 2,448 ± 1,026 | Vector path | - |
SVG-Icons | 80.4k | 6.2k | 2.4k | 2,449 ± 1,543 | Vector path | - |
SVG-Icons_sim | 80.4k | 2.8k | 1.2k | 2,005 ± 824 | Vector path | - |
SVG-FIGR | 270k | 27k | 3k | 5,342 ± 2,345 | Vector path | 圖像分類 & 標註 |
SVG 在 圖標、商標、技術圖表、地圖設計 等領域至關重要,而 StarVector 是目前最先進的 Image-to-SVG 與 Text-to-SVG 生成模型。與傳統曲線擬合方法相比,它提供:
✅ 語義理解,能正確識別圖像結構
✅ 精簡代碼,生成更高效的 SVG
✅ 更準確的評測標準,解決像素級評估的局限性
✅ 支援 Hugging Face 訓練與測試,可供開發者使用
StarVector 讓 AI 生成 SVG 變得更加精確、可靠,並為未來的向量圖形應用開啟了更多可能性。💡
👉 相關資源:
DMflow.chat:智慧整合,創新溝通!除了持久記憶與客製欄位外,更支持真人與 AI 的靈活轉換,無縫連接資料庫與表單,讓網頁互動更靈活高效。
OpenAI 推出 GPT-4o 圖像生成功能,支援多輪對話編輯 OpenAI 於 2025 年 3 月 25 日宣布,最新的 GPT-4o 模型現已支援圖像生成與多輪對話編輯,帶來更強大的 ...
Google AI Studio 影像生成功能升級:更低誤判率、更強大易用性 Google AI Studio 的重大更新:更準確、更高效的 AI 影像生成 Google 最近對其 AI 開...
BEN2:精準影像前景分割的 AI 解決方案 在影像處理領域,如何快速且準確地去除背景,一直是業界關注的重點。傳統方法依賴綠幕技術或手動摳圖,耗時且成本高昂。如今,BEN2 (Backg...
DeepSeek 推出全新多模態 AI 模型 Janus-Pro,效能超越 DALL-E 3 DeepSeek 這家近期爆紅的 AI 公司,發布了一系列全新的多模態 AI 模型,名為 J...
免費AI繪圖神器降臨!Raphael AI讓你無限暢畫 在這個創意無限的時代,AI繪圖工具正以驚人的速度發展,為藝術創作和設計領域帶來革命性的變革。然而,市面上許多AI繪圖工具往往伴隨著...
Meta Leffa:AI虛擬試衣新突破,逼真細節打造沉浸式購物體驗 文章摘要 Meta 最新發布開源 AI 虛擬試衣框架 Leffa,以突破性技術精準捕捉服裝紋理、光影及垂墜感等細節,大幅降...
OpenAI Day6: 聊天機器人功能大升級:即時互動與節慶驚喜全新體驗 描述 OpenAI 在第六天的活動中宣布了 ChatGPT 的多項創新功能,包括視訊功能、螢幕共享、先進語音模式,以...
Claude 提示快取:讓 AI 對話更快更省 Anthropic 推出全新的 Claude 提示快取功能,可大幅提升 AI 對話效率與成本表現。本文深入探討這項新功能的應用場景、效益與定價策...
ChatGPT全方位革新:電話、WhatsApp全面整合,AI溝通更簡單 文章概述 OpenAI推出革命性的ChatGPT新功能,讓AI助理不再受限於網頁和應用程式介面。現在,透過電話...
By continuing to use this website, you agree to the use of cookies according to our privacy policy.