Mistral Large 2：突破性的人工智能語言模型

Mistral Large 2 是一款新一代的大型語言模型，具有卓越的成本效益、速度和性能。它支持多種語言和編程語言，並在多個基準測試中展現出優異的表現。本文將詳細介紹 Mistral Large 2 的特點、性能和應用場景。

Mistral Large 2 概述

Mistral Large 2 是一個具有 128k 上下文窗口的強大語言模型。它支持數十種語言，包括法語、德語、西班牙語、意大利語、葡萄牙語、阿拉伯語、印地語、俄語、中文、日語和韓語。此外，它還支持 80 多種編程語言，如 Python、Java、C、C++、JavaScript 和 Bash。

這個模型設計用於單節點推理，特別適合長上下文應用。它擁有 1230 億個參數，能夠在單個節點上實現高吞吐量運行。Mistral Large 2 以 Mistral 研究許可證發布，允許用於研究和非商業用途。如需商業用途，則需要獲取 Mistral 商業許可證。

一般性能

Mistral Large 2 在評估指標上設立了性能/服務成本的新標準。特別是在 MMLU（大規模多任務語言理解）測試中，預訓練版本達到了 84.0% 的準確率，在開放模型中創造了新的性能/成本巴雷托前沿。

代碼和推理能力

基於 Codestral 22B 和 Codestral Mamba 的經驗，Mistral Large 2 在訓練中包含了大量的代碼數據。它的表現遠超前代 Mistral Large，並與 GPT-4、Claude 3 Opus 和 Llama 3 405B 等領先模型不相上下。

在增強模型推理能力方面，開發團隊投入了大量精力。重點之一是最小化模型產生”幻覺”（生成聽起來合理但實際上不正確或不相關的信息）的傾向。通過精細調整，使模型在回應時更加謹慎和敏銳，確保輸出可靠且準確。

此外，新的 Mistral Large 2 經過訓練，能夠在無法找到解決方案或缺乏足夠信息提供確切答案時坦誠承認。這種對準確性的承諾反映在數學基準測試的改進性能上，展示了其增強的推理和解決問題的能力。

Performance accuracy on MultiPL-E (all models were benchmarked through the same evaluation pipeline, except for the "paper" row) 圖片轉自 mistral-large-2407

指令跟隨和對齊

Mistral Large 2 大幅改進了指令跟隨和對話能力。新版本特別擅長遵循精確指令和處理長時間多輪對話。在 MT-Bench、Wild Bench 和 Arena Hard 基準測試中表現出色。

值得注意的是，雖然在某些基準測試中，生成較長的回應可能會提高分數，但在許多商業應用中，簡潔至關重要。簡短的模型生成有助於更快速的互動，並且在推理方面更具成本效益。因此，開發團隊花費了大量精力確保生成的內容在可能的情況下保持簡潔明瞭。

語言多樣性

鑑於當今大量商業用例涉及多語言文檔，Mistral Large 2 在訓練中包含了大比例的多語言數據。它在英語、法語、德語、西班牙語、意大利語、葡萄牙語、荷蘭語、俄語、中文、日語、韓語、阿拉伯語和印地語方面表現出色。在多語言 MMLU 基準測試中，Mistral Large 2 相較於前代 Mistral Large、Llama 3.1 模型和 Cohere 的 Command R+ 都有優異表現。

工具使用和函數調用

Mistral Large 2 配備了增強的函數調用和檢索技能，並經過訓練能夠熟練執行並行和順序函數調用，使其成為複雜商業應用的強大引擎。

在 la Plateforme 上試用 Mistral Large 2

用戶現在可以通過 la Plateforme 使用 Mistral Large 2，模型名稱為 mistral-large-2407，並可在 le Chat 上進行測試。它以 24.07 版本（YY.MM 版本系統）提供，API 名稱為 mistral-large-2407。指令模型的權重可用，並托管在 HuggingFace 上。

通過雲服務提供商訪問 Mistral 模型

Mistral AI 與領先的雲服務提供商合作，將新的 Mistral Large 2 帶給全球用戶。特別是，他們擴大了與 Google Cloud Platform 的合作，通過 Vertex AI 的托管 API 提供 Mistral AI 的模型。Mistral AI 的最佳模型現在可在 Vertex AI、Azure AI Studio、Amazon Bedrock 和 IBM watsonx.ai 上使用。

這些合作關係使 Mistral Large 2 更易於訪問，為全球開發者和企業提供了強大的人工智能工具，以推動創新和提高效率。