挑戰 Sora？Luojian 科技開源 Open-Sora 2.0 視訊生成模型 — 更便宜、更快、更強！

開頭 — Sora 太貴？Open-Sora 2.0 來了!

你知道嗎？OpenAI 的 Sora，一款令人驚艷的視訊生成模型，訓練成本動輒上百萬美元，被譽為視訊生成界的「勞斯萊斯」。但現在，Luojian 科技帶來了平價又強悍的挑戰者 —— Open-Sora 2.0！

只花了 20 萬美元（約等同於 224 張 GPU 的計算力），就成功訓練了一個擁有 110 億參數 的商業級視訊生成模型。這不只是讓人跌破眼鏡，更像是用平價家用車的成本打造了一輛賽車！

別以為便宜就代表妥協。Open-Sora 2.0 的實力可不是說說而已。

在權威視訊評測指標 VBench 和使用者偏好測試中，它的表現穩穩咬住業界標竿，包括 OpenAI 的 Sora，以及騰訊的 混元視頻（HunyuanVideo）與擁有 300 億參數 的 Step-Video。

最讓人驚艷的是：

在 VBench 測試 中，Open-Sora 2.0 與 OpenAI Sora 的差距已從 4.52% 縮小到僅 0.69%！幾乎已經達到性能平價。
它甚至超越了騰訊的 HunyuanVideo，在低成本下展現更高的生成品質。
在使用者偏好測試裡，Open-Sora 2.0 在 視覺呈現、文本一致性 和 動作表現 等至少兩項指標上，擊敗了開源的 HunyuanVideo 和商業模型 Runway Gen-3Alpha。

這是一場真正的平價革命 — 花更少的錢，達到接近甚至超越頂級模型的效果。

你可能會問：這麼便宜，效果還這麼好，怎麼做到的？

Open-Sora 2.0 的成功關鍵，來自幾個核心策略：

延續 Open-Sora 1.2 架構：繼續採用 3D 自動編碼器（3D autoencoder）與 Flow Matching 訓練框架，強化視訊時序一致性與畫質細節。
3D 全注意力機制（3D full attention）：提升對視訊動作與場景變化的捕捉能力，讓畫面更流暢自然。

嚴格資料過濾：確保訓練資料的高品質，從源頭提升效率，避免無謂的計算浪費。
優先低解析度訓練：先學會影片動作細節，再逐步提升解析度，因為高解析度訓練的成本往往是低解析度的數十倍！
影像到視訊（I2V）優先訓練：加速模型收斂，同時在推理階段可透過 文本到影像到視訊（T2I2V） 微調畫面質感。
高效平行訓練方案：結合 ColossalAI 與系統層優化技術，如序列平行化、ZeroDP、梯度檢查點（Gradient Checkpointing），大幅提升計算資源利用率。

為了解決影片生成耗時過長的痛點，Open-Sora 團隊還訓練了一個 高壓縮影片自動編碼器（4×32×32），把生成 768px、5 秒影片的推理時間，從 30 分鐘縮短到不到 3 分鐘。

這表示，不用再等半個小時才能看到成果，未來我們可能在幾分鐘內，就能生成高品質影片內容！

真正讓人感動的是，Open-Sora 2.0 不只開源模型權重和程式碼，連完整的訓練流程都公開了。

很多技術團隊選擇開源模型但保留細節，然而 Open-Sora 的透明度讓全球研究者與開發者，都有機會參與並推動視訊生成技術的發展。

事實上，根據第三方統計：

這不只是技術上的突破，更是一場開源文化的勝利。

Luojian 科技推出的 Open-Sora 2.0，不僅成本低、效能強，還真正秉持開源精神，讓更多人有機會參與 AI 視訊生成的前線研究。

它讓視訊生成技術，不再是巨頭獨享的高牆花園，而是一個開放共創的實驗室。

也許，有一天，你我都能用自己的電腦，創作出媲美好萊塢的 AI 動畫短片。

想親自體驗或參與這場開源革命嗎？以下是資源連結：

🔗 GitHub 開源庫： Open-Sora 專案

準備好了嗎？讓我們一起站在巨人的肩膀上，改變未來的視訊生成世界！