Mistral Large 2:突破性的人工智能語言模型

Mistral Large 2 是一款新一代的大型語言模型,具有卓越的成本效益、速度和性能。它支持多種語言和編程語言,並在多個基準測試中展現出優異的表現。本文將詳細介紹 Mistral Large 2 的特點、性能和應用場景。

Mistral Large 2 概述

Mistral Large 2 是一個具有 128k 上下文窗口的強大語言模型。它支持數十種語言,包括法語、德語、西班牙語、意大利語、葡萄牙語、阿拉伯語、印地語、俄語、中文、日語和韓語。此外,它還支持 80 多種編程語言,如 Python、Java、C、C++、JavaScript 和 Bash。

這個模型設計用於單節點推理,特別適合長上下文應用。它擁有 1230 億個參數,能夠在單個節點上實現高吞吐量運行。Mistral Large 2 以 Mistral 研究許可證發布,允許用於研究和非商業用途。如需商業用途,則需要獲取 Mistral 商業許可證。

一般性能

Mistral Large 2 在評估指標上設立了性能/服務成本的新標準。特別是在 MMLU(大規模多任務語言理解)測試中,預訓練版本達到了 84.0% 的準確率,在開放模型中創造了新的性能/成本巴雷托前沿。

代碼和推理能力

基於 Codestral 22B 和 Codestral Mamba 的經驗,Mistral Large 2 在訓練中包含了大量的代碼數據。它的表現遠超前代 Mistral Large,並與 GPT-4、Claude 3 Opus 和 Llama 3 405B 等領先模型不相上下。

在增強模型推理能力方面,開發團隊投入了大量精力。重點之一是最小化模型產生”幻覺”(生成聽起來合理但實際上不正確或不相關的信息)的傾向。通過精細調整,使模型在回應時更加謹慎和敏銳,確保輸出可靠且準確。

此外,新的 Mistral Large 2 經過訓練,能夠在無法找到解決方案或缺乏足夠信息提供確切答案時坦誠承認。這種對準確性的承諾反映在數學基準測試的改進性能上,展示了其增強的推理和解決問題的能力。

Performance accuracy on MultiPL-E (all models were benchmarked through the same evaluation pipeline, except for the "paper" row) 圖片轉自 mistral-large-2407

指令跟隨和對齊

Mistral Large 2 大幅改進了指令跟隨和對話能力。新版本特別擅長遵循精確指令和處理長時間多輪對話。在 MT-Bench、Wild Bench 和 Arena Hard 基準測試中表現出色。

值得注意的是,雖然在某些基準測試中,生成較長的回應可能會提高分數,但在許多商業應用中,簡潔至關重要。簡短的模型生成有助於更快速的互動,並且在推理方面更具成本效益。因此,開發團隊花費了大量精力確保生成的內容在可能的情況下保持簡潔明瞭。

語言多樣性

鑑於當今大量商業用例涉及多語言文檔,Mistral Large 2 在訓練中包含了大比例的多語言數據。它在英語、法語、德語、西班牙語、意大利語、葡萄牙語、荷蘭語、俄語、中文、日語、韓語、阿拉伯語和印地語方面表現出色。在多語言 MMLU 基準測試中,Mistral Large 2 相較於前代 Mistral Large、Llama 3.1 模型和 Cohere 的 Command R+ 都有優異表現。

工具使用和函數調用

Mistral Large 2 配備了增強的函數調用和檢索技能,並經過訓練能夠熟練執行並行和順序函數調用,使其成為複雜商業應用的強大引擎。

在 la Plateforme 上試用 Mistral Large 2

用戶現在可以通過 la Plateforme 使用 Mistral Large 2,模型名稱為 mistral-large-2407,並可在 le Chat 上進行測試。它以 24.07 版本(YY.MM 版本系統)提供,API 名稱為 mistral-large-2407。指令模型的權重可用,並托管在 HuggingFace 上。

通過雲服務提供商訪問 Mistral 模型

Mistral AI 與領先的雲服務提供商合作,將新的 Mistral Large 2 帶給全球用戶。特別是,他們擴大了與 Google Cloud Platform 的合作,通過 Vertex AI 的托管 API 提供 Mistral AI 的模型。Mistral AI 的最佳模型現在可在 Vertex AI、Azure AI Studio、Amazon Bedrock 和 IBM watsonx.ai 上使用。

這些合作關係使 Mistral Large 2 更易於訪問,為全球開發者和企業提供了強大的人工智能工具,以推動創新和提高效率。

更多訊息

mistral-large-2407

Share on:
Previous: SearchGPT 原型:AI 搜尋的新時代
Next: Meta 推出 Llama 3.1:開源 AI 的新里程碑
DMflow.chat

DMflow.chat

廣告

一站整合多平台聊天,體驗真人與 AI 自由切換的新境界!支援 Facebook、Instagram、Telegram、LINE 及網站,結合歷史記錄、推播通知、行銷活動及客服轉接,全面提升效率與互動。

微軟 BitNet b1.58 震撼登場:跑更快、更省電的 1 位元 AI 模型來了
17 April 2025

微軟 BitNet b1.58 震撼登場:跑更快、更省電的 1 位元 AI 模型來了

微軟 BitNet b1.58 震撼登場:跑更快、更省電的 1 位元 AI 模型來了? AI 發展快到讓人眼花撩亂,但模型的「食量」也越來越驚人?來看看微軟最新的 BitNet b1.5...

秘密武器登場?OpenRouter 無預警釋出百萬級長上下文模型 Quasar Alpha
6 April 2025

秘密武器登場?OpenRouter 無預警釋出百萬級長上下文模型 Quasar Alpha

秘密武器登場?OpenRouter 無預警釋出百萬級長上下文模型 Quasar Alpha! AI 界又有新玩具了!OpenRouter 悄悄推出了一款名為 Quasar Alpha 的...

Mistral Small 3:開創效能與開放性兼具的 AI 模型
1 February 2025

Mistral Small 3:開創效能與開放性兼具的 AI 模型

Mistral Small 3:開創效能與開放性兼具的 AI 模型 Mistral AI 於 2025 年 1 月推出全新的 Mistral Small 3 模型,這款採用 Apache...

DeepSeek V3:突破性的開源大型語言模型,超越 GPT-4 與 Claude 3
26 December 2024

DeepSeek V3:突破性的開源大型語言模型,超越 GPT-4 與 Claude 3

DeepSeek V3:突破性的開源大型語言模型,超越 GPT-4 與 Claude 3 2024年底,中國 DeepSeek 發布了突破性的開源語言模型 DeepSeek V3。這款模型在多...

Meta 推出開源 Llama 3.3 70B,將強大的模型縮小為更小的尺寸
7 December 2024

Meta 推出開源 Llama 3.3 70B,將強大的模型縮小為更小的尺寸

Meta 推出開源 Llama 3.3 70B,將強大的模型縮小為更小的尺寸 簡介 Meta 最新推出的 Llama 3.3 70B 模型,不僅以創新技術挑戰傳統規模極限,還以不足 Llama...

Mistral 發佈 Pixtral 12B:突破性多模態 AI 模型處理文字與圖像
13 September 2024

Mistral 發佈 Pixtral 12B:突破性多模態 AI 模型處理文字與圖像

Mistral 發佈 Pixtral 12B:突破性多模態 AI 模型處理文字與圖像 法國 AI 新星推出首款圖文處理模型,展現強大實力 法國 AI 新創公司 Mistral 最近推出了一款...

ChatGPT升級語音互動:OpenAI推出高級語音模式,為AI對話體驗帶來革新
27 September 2024

ChatGPT升級語音互動:OpenAI推出高級語音模式,為AI對話體驗帶來革新

ChatGPT升級語音互動:OpenAI推出高級語音模式,為AI對話體驗帶來革新 摘要 OpenAI最新推出的高級語音模式(Advanced Voice Mode, AVM)為ChatGPT ...

OpenAI Day9: 向全球開發者致敬:提升開發者體驗
18 December 2024

OpenAI Day9: 向全球開發者致敬:提升開發者體驗

OpenAI Day9: 向全球開發者致敬:提升開發者體驗 開場介紹 歡迎致辭 by Olivia Gar Olivia Gar,OpenAI 的平台產品負責人,以滿滿的熱情開啟了第九天的活動...

Cursor AI:程式設計師的智能助手 - 讓編碼更高效、更智慧(什麼是Cursor AI)
6 September 2024

Cursor AI:程式設計師的智能助手 - 讓編碼更高效、更智慧(什麼是Cursor AI)

Cursor AI:程式設計師的智能助手 - 讓編碼更高效、更智慧 探索 Cursor AI 如何革新程式開發流程,從 AI 輔助編碼到團隊協作,本文全面解析這款智能編輯器的強大功能及其對開發...