Mistral Large 2:突破性的人工智能语言模型

Mistral Large 2 是一款新一代的大型语言模型,具有卓越的成本效益、速度和性能。它支持多种语言和编程语言,并在多个基准测试中展现出优异的表现。本文将详细介绍 Mistral Large 2 的特点、性能和应用场景。

Mistral Large 2 概述

Mistral Large 2 是一个具有 128k 上下文窗口的强大语言模型。它支持数十种语言,包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语。此外,它还支持 80 多种编程语言,如 Python、Java、C、C++、JavaScript 和 Bash。

这个模型设计用于单节点推理,特别适合长上下文应用。它拥有 1230 亿个参数,能够在单个节点上实现高吞吐量运行。Mistral Large 2 以 Mistral 研究许可证发布,允许用于研究和非商业用途。如需商业用途,则需要获取 Mistral 商业许可证。

一般性能

Mistral Large 2 在评估指标上设立了性能/服务成本的新标准。特别是在 MMLU(大规模多任务语言理解)测试中,预训练版本达到了 84.0% 的准确率,在开放模型中创造了新的性能/成本巴雷托前沿。

代码和推理能力

基于 Codestral 22B 和 Codestral Mamba 的经验,Mistral Large 2 在训练中包含了大量的代码数据。它的表现远超前代 Mistral Large,并与 GPT-4、Claude 3 Opus 和 Llama 3 405B 等领先模型不相上下。

在增强模型推理能力方面,开发团队投入了大量精力。重点之一是最小化模型产生”幻觉”(生成听起来合理但实际上不正确或不相关的信息)的倾向。通过精细调整,使模型在回应时更加谨慎和敏锐,确保输出可靠且准确。

此外,新的 Mistral Large 2 经过训练,能够在无法找到解决方案或缺乏足够信息提供确切答案时坦诚承认。这种对准确性的承诺反映在数学基准测试的改进性能上,展示了其增强的推理和解决问题的能力。

Performance accuracy on MultiPL-E (all models were benchmarked through the same evaluation pipeline, except for the "paper" row) 图片转自 mistral-large-2407

指令跟随和对齐

Mistral Large 2 大幅改进了指令跟随和对话能力。新版本特别擅长遵循精确指令和处理长时间多轮对话。在 MT-Bench、Wild Bench 和 Arena Hard 基准测试中表现出色。

值得注意的是,虽然在某些基准测试中,生成较长的回应可能会提高分数,但在许多商业应用中,简洁至关重要。简短的模型生成有助于更快速的互动,并且在推理方面更具成本效益。因此,开发团队花费了大量精力确保生成的内容在可能的情况下保持简洁明了。

语言多样性

鉴于当今大量商业用例涉及多语言文档,Mistral Large 2 在训练中包含了大比例的多语言数据。它在英语、法语、德语、西班牙语、意大利语、葡萄牙语、荷兰语、俄语、中文、日语、韩语、阿拉伯语和印地语方面表现出色。在多语言 MMLU 基准测试中,Mistral Large 2 相较于前代 Mistral Large、Llama 3.1 模型和 Cohere 的 Command R+ 都有优异表现。

工具使用和函数调用

Mistral Large 2 配备了增强的函数调用和检索技能,并经过训练能够熟练执行并行和顺序函数调用,使其成为复杂商业应用的强大引擎。

在 la Plateforme 上试用 Mistral Large 2

用户现在可以通过 la Plateforme 使用 Mistral Large 2,模型名称为 mistral-large-2407,并可在 le Chat 上进行测试。它以 24.07 版本(YY.MM 版本系统)提供,API 名称为 mistral-large-2407。指令模型的权重可用,并托管在 HuggingFace 上。

通过云服务提供商访问 Mistral 模型

Mistral AI 与领先的云服务提供商合作,将新的 Mistral Large 2 带给全球用户。特别是,他们扩大了与 Google Cloud Platform 的合作,通过 Vertex AI 的托管 API 提供 Mistral AI 的模型。Mistral AI 的最佳模型现在可在 Vertex AI、Azure AI Studio、Amazon Bedrock 和 IBM watsonx.ai 上使用。

这些合作关系使 Mistral Large 2 更易于访问,为全球开发者和企业提供了强大的人工智能工具,以推动创新和提高效率。

更多信息

mistral-large-2407

Share on:
Previous: SearchGPT 原型:AI 搜寻的新时代
Next: Meta 推出 Llama 3.1:开源 AI 的新里程碑
DMflow.chat

DMflow.chat

一站式整合Facebook、Instagram、Telegram、LINE和网站的聊天机器人,支持ChatGPT和Gemini模型,具备保留历史记录、推送通知、营销活动和客服转接功能。

25 July 2024

Meta 推出 Llama 3.1:开源 AI 的新里程碑

Meta 推出 Llama 3.1:开源 AI 的新里程碑 Meta 推出了 Llama 3.1 系列模型,其中包括 405B 参数的旗舰模型,这是首个能与顶级闭源 AI 模型相媲美的开源模型...