超長上下文窗口：人工智慧的新境界與 Magic 公司的突破性進展

探索 Magic 公司在 100M 代幣上下文窗口的突破性研究，以及與 Google Cloud 的合作。了解超長上下文模型如何改變 AI 學習方式，以及它們在軟體開發領域的應用前景。

超長上下文窗口的重要性

人工智慧（AI）學習方式正在經歷重大變革。傳統上，AI 模型主要通過兩種方式學習：訓練和推理時的上下文學習。然而，隨著超長上下文窗口的出現，這種格局可能發生巨大變化。

Magic 公司的長期記憶（LTM）模型能夠在推理過程中處理高達 1 億個代幣的上下文，這相當於約 1000 萬行代碼或 750 本小說的內容量。這種能力為 AI 在軟體開發領域帶來了革命性的可能性。

想像一下，如果 AI 模型能夠將您的所有代碼、文檔和庫（包括那些不在公共互聯網上的）都納入上下文，代碼合成的質量將會有多大提升。這不僅能提高開發效率，還能大幅減少錯誤和提高代碼質量。

評估上下文窗口的新方法

傳統的長上下文評估方法存在一些問題。例如，常見的「大海撈針」評估方法將隨機事實（針）放在長上下文窗口（大海）中間，並要求模型檢索該事實。然而，這種方法可能導致模型學會識別異常信息，而不是真正理解和處理長上下文。

為了解決這個問題，Magic 公司設計了一種新的評估方法：HashHop。這種方法使用哈希對來測試模型的存儲和檢索能力，確保模型能夠處理最大可能的信息內容。

HashHop 的具體步驟如下：

使用哈希對訓練模型
要求模型完成隨機選擇的哈希對
增加難度，要求模型完成哈希鏈
打亂哈希對的順序，測試模型的順序和位置不變性

這種方法不僅能評估模型的單步推理能力，還能測試多步推理和跨上下文推理的能力，更貼近實際應用場景。

Magic 公司的 LTM-2-mini 模型

Magic 公司最近訓練了他們的首個 1 億代幣上下文模型：LTM-2-mini。這個模型在處理長上下文方面表現出色，特別是在效率和內存需求方面遠超傳統模型。

LTM-2-mini 的主要優勢包括：

對於每個解碼的代幣，其序列維度算法比 Llama 3.1 405B 的注意力機制在 1 億代幣上下文窗口中便宜約 1000 倍
內存需求顯著降低，僅需一個 H100 GPU 的小部分 HBM 即可處理 1 億代幣上下文
在 HashHop 評估中表現出色，特別是在短距離推理任務中

LTM-2-mini 在代碼合成方面也展現了潛力，儘管其規模遠小於當前的頂尖模型，但在某些任務中仍能產生合理的輸出，如使用自定義 GUI 框架創建計算器和實現密碼強度計。

與 Google Cloud 的合作

為了進一步推進其研究和開發，Magic 公司與 Google Cloud 建立了戰略合作夥伴關係。這項合作的主要內容包括：

建設兩台新的超級計算機：Magic-G4（由 NVIDIA H100 Tensor Core GPU 驅動）和 Magic-G5（由 NVIDIA GB200 NVL72 驅動）
利用 Google Cloud 的端到端 AI 平台，包括各種領先的 NVIDIA 芯片和 Vertex AI 的 AI 工具
計劃隨時間擴展到數萬個 Blackwell GPU

這項合作將大大提高 Magic 公司的推理和訓練效率，並為其提供快速擴展和豐富的雲服務生態系統。

未來展望

隨著 Magic 公司在其新的超級計算機上訓練更大規模的 LTM-2 模型，我們可以期待看到更多令人興奮的突破：

更強大的代碼合成能力，可能徹底改變軟體開發流程
在處理超長上下文方面的進一步改進，可能使 AI 能夠理解和操作更複雜的信息結構
AI 輔助軟體開發工具的快速發展，提高開發效率和代碼質量
在其他領域的應用，如自然語言處理、科學研究等

這些進展不僅將推動 AI 技術的發展，還可能為各行各業帶來革命性的變化。

常見問題

Q: 什麼是超長上下文窗口，它為什麼重要？ A: 超長上下文窗口允許 AI 模型在推理過程中處理大量信息，如 Magic 的 LTM 模型可處理高達 1 億個代幣的上下文。這對於提高 AI 在複雜任務中的表現至關重要，特別是在軟體開發等需要大量上下文信息的領域。
Q: Magic 公司的 LTM-2-mini 模型有什麼特點？ A: LTM-2-mini 是一個能夠處理 1 億代幣上下文的模型，其序列維度算法比傳統模型效率高得多，內存需求也大大降低。它在 HashHop 評估中表現出色，並展示了在代碼合成方面的潛力。
Q: Magic 公司與 Google Cloud 的合作會帶來什麼影響？ A: 這項合作將使 Magic 公司能夠利用 Google Cloud 的強大計算資源和 AI 工具，加速其模型的訓練和部署。這可能會導致更強大、更高效的 AI 模型的快速發展，推動整個 AI 行業的進步。
Q: 超長上下文模型對軟體開發有什麼潛在影響？ A: 這些模型可能徹底改變代碼合成和軟體開發流程。它們能夠理解和操作更大的代碼庫，提供更準確的建議和自動化更複雜的編程任務，從而大幅提高開發效率和代碼質量。
Q: HashHop 評估方法有什麼優勢？ A: HashHop 通過使用隨機且不可壓縮的哈希來評估模型的存儲和檢索能力，避免了傳統評估方法中的隱含語義提示問題。這種方法更能反映模型在實際應用中的表現，特別是在需要多步推理的複雜任務中。

超長上下文窗口：人工智慧的新境界與 Magic 公司的突破性進展

目錄

超長上下文窗口的重要性

評估上下文窗口的新方法

Magic 公司的 LTM-2-mini 模型

與 Google Cloud 的合作

未來展望

常見問題

DMflow.chat

廣告

xAI推出Grok-2測試版：X平台的全新AI革命

微軟 BitNet b1.58 震撼登場：跑更快、更省電的 1 位元 AI 模型來了

限時七天！Windsurf AI 震撼推出免費無限 GPT-4.1 試用，立即體驗頂尖 AI！

偷聽海豚說話？Google AI 神器 DolphinGemma 揭開海洋世界的溝通秘密

WordPress 放大絕！一句話打造專屬網站？AI 助手讓你跟架站煩惱說掰掰！

AI 智慧體大串連！Google 推出開源 A2A 協定，打造無縫協作新時代

TikTok 大規模裁員：AI內容審核時代來臨，全球數百員工受影響

GenSFX：AI 音效產生器 - 將文字化為聲音

AI 當導演？SkyReels-V2 讓無限長度電影成真

Communeify

Hello, we want to use some third-party cookies and scripts to enhance the functionality of this website.

超長上下文窗口：人工智慧的新境界與 Magic 公司的突破性進展

目錄

超長上下文窗口的重要性

評估上下文窗口的新方法

Magic 公司的 LTM-2-mini 模型

與 Google Cloud 的合作

未來展望

常見問題

DMflow.chat

廣告

Communeify

Links