Google 發佈 Gemini 1.5 最新版本:性能提升、價格降低、速度加快
描述
Google 推出了 Gemini 1.5 系列的最新版本,包括 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。這些更新帶來了顯著的性能提升、價格優惠和速度改進,為開發者提供更強大、更經濟的 AI 模型選擇。
目錄
- Gemini 1.5 系列的主要更新
- Gemini-1.5-Pro-002 的重大改進
- Gemini-1.5-Flash-002 的性能提升
- 價格調整和使用限制的變化
- 安全性和過濾設置的更新
- 開發者可用性和未來展望
Gemini 1.5 系列的主要更新
Google 最新發佈的 Gemini 1.5 系列模型帶來了多方面的顯著提升:
- 整體性能提升:在 MMLU-Pro 基準測試中,性能提高約 7%。
- 數學能力大幅提升:在 MATH 和 HiddenMath 基準測試中,性能提升約 20%。
- 視覺和代碼能力增強:在視覺理解和 Python 代碼生成方面,性能提升 2-7%。
- 回應質量優化:模型回答更加精準,拒絕回答的情況減少。
- 輸出簡潔度提高:默認輸出長度縮短 5-20%,有助於降低使用成本。
這些改進使得 Gemini 1.5 系列模型在處理文本、代碼和多模態任務時更加出色,能夠輕鬆處理長達 1000 頁的 PDF 文件、分析超過 10,000 行代碼的倉庫,甚至能夠理解和處理長達一小時的視頻內容。
Gemini-1.5-Pro-002 的重大改進
Gemini-1.5-Pro-002 作為 Gemini 1.5 系列中最強大的模型,帶來了以下重大改進:
- 大幅降價:
- 輸入 token 價格降低 64%
- 輸出 token 價格降低 52%
- 增量緩存 token 價格降低 64%
- 長上下文處理能力:
- 支援高達 200 萬 token 的長上下文窗口
- 特別適合處理大型文件和複雜數據分析任務
- 多模態能力增強:
- 能夠更好地理解和處理圖像、視頻等多媒體內容
- 為開發者提供更多創新應用可能性
- 速度提升:
- 輸出速度提高 2 倍
- 延遲降低 3 倍
這些改進使得 Gemini-1.5-Pro-002 成為處理複雜、大規模 AI 任務的理想選擇,同時大幅降低了使用成本。
Gemini-1.5-Flash-002 的性能提升
Gemini-1.5-Flash-002 作為 Gemini 1.5 系列中的快速模型,也帶來了顯著的性能提升:
- 速度優化:
- 回應速度更快,適合需要實時交互的應用場景
- 多功能性增強:
- 在文本和多模態任務中都有顯著提升
- 適合廣泛的 AI 應用開發需求
- 使用限制放寬:
- 每分鐘請求次數(RPM)提高到 2,000 次,之前為 1,000 次
Gemini-1.5-Flash-002 的這些改進使其成為構建快速回應 AI 應用的理想選擇,特別適合需要高吞吐量的場景。
價格調整和使用限制的變化
為了讓開發者更容易使用 Gemini 模型,Google 進行了以下調整:
- Gemini-1.5-Pro 價格調整(針對小於 128K token 的提示):
- 輸入 token 價格降低 64%
- 輸出 token 價格降低 52%
- 增量緩存 token 價格降低 64%
- 使用限制提高:
- Gemini-1.5-Flash:付費版每分鐘請求次數提高到 2,000 次
- Gemini-1.5-Pro:付費版每分鐘請求次數提高到 1,000 次
這些調整大大降低了使用 Gemini 模型的成本,同時提高了開發靈活性。
安全性和過濾設置的更新
Google 一直致力於提供安全可靠的 AI 模型,最新版本在這方面也有所改進:
- 指令遵循能力提升:模型更好地平衡了遵循用戶指令和保持安全性
- 靈活的安全過濾選項:提供多種安全過濾器,開發者可根據需求自行配置
- 默認設置調整:新版模型默認不應用過濾器,給予開發者更多控制權
這些更新使得開發者可以更好地根據自己的應用場景來調整模型的行為,同時保證了基本的安全性。
開發者可用性和未來展望
Google 正在不斷優化 Gemini 模型的開發者體驗:
- 訪問渠道:
- 通過 Google AI Studio 和 Gemini API 免費使用
- 大型組織和 Google Cloud 客戶可通過 Vertex AI 使用
- 實驗版本:
- 發佈了改進版的 Gemini-1.5-Flash-8B-Exp-0924 實驗模型
- 在文本和多模態任務中有顯著性能提升
- 未來規劃:
- 計劃進一步提高 Gemini API 的使用限制
- 即將為 Gemini Advanced 用戶提供針對聊天優化的 Gemini 1.5 Pro-002 版本
Google 鼓勵開發者嘗試這些新模型,並期待看到更多創新應用的誕生。
常見問題解答(FAQ)
-
Q: Gemini 1.5 系列的主要改進是什麼? A: 主要改進包括整體性能提升、數學和代碼能力增強、多模態處理能力提升、回應質量優化以及輸出簡潔度提高。
-
Q: 新版本的 Gemini 模型如何優化了價格? A: Gemini-1.5-Pro 模型的輸入 token 價格降低 64%,輸出 token 價格降低 52%,增量緩存 token 價格降低 64%。
-
Q: 使用限制有什麼變化? A: Gemini-1.5-Flash 的付費版每分鐘請求次數提高到 2,000 次,Gemini-1.5-Pro 提高到 1,000 次。
-
Q: 如何訪問這些新的 Gemini 模型? A: 開發者可以通過 Google AI Studio 和 Gemini API 免費使用,大型組織和 Google Cloud 客戶可通過 Vertex AI 使用。
-
Q: 安全性方面有什麼更新? A: 新版模型改進了指令遵循能力,提供了更靈活的安全過濾選項,並調整了默認設置以給予開發者更多控制權。