初探 Amazon Nova LLM 系列:價格與功能全面剖析

描述

Amazon 在 AWS re:Invent 大會上推出了全新的大型語言模型系列 Amazon Nova,包含 Micro、Lite 和 Pro 三種版本,成為 Google Gemini 的主要競爭對手。這篇文章將詳細介紹 Nova 系列的功能與價格,並與市場上的其他主流模型進行比較。

初探 Amazon Nova LLM 系列:價格與功能全面剖析

Nova 系列概覽與亮點

Amazon Nova 系列首次亮相即展現了多模態處理的能力,支援文本、影像和影片輸入(但目前不支援音訊)。以下是各型號的核心特色:

  • Nova Micro: 價格低廉,適合處理文本為主的任務。
  • Nova Lite: 支援影像和文件,適用於中型工作負載。
  • Nova Pro: 多模態處理能力最強,專為高端應用設計。

Nova 系列中的 Premier 型號仍在訓練中,預計 2025 年推出,其將具備超過 200 萬輸入 token 的上下文處理能力。


價格與功能比較

Amazon Nova 的價格非常具有競爭力,以下為與市場主流模型的比較:

入門級模型

供應商 型號 每百萬輸入 token (美金) 每百萬輸出 token (美金)
OpenAI GPT-4o Mini 0.15 0.6
Google Gemini 1.5 Flash-8B 0.0375 0.15
Google Gemini 1.5 Flash 0.075 0.3
Amazon Nova Micro 0.035 0.15
Amazon Nova LITE 0.06 0.24
Anthropic Claude 3 Haiku 0.25 1.25
Anthropic Claude 3.5 Haiku 1 5

高端模型

供應商 型號 每百萬輸入 token (美金) 每百萬輸出 token (美金)
OpenAI GPT-4o 2.5 10
OpenAI GPT-o1-mini 3 12
OpenAI GPT-o1-preview 15 60
Google Gemini 1.5 Pro 1.25 5
Anthropic Claude 3.5 Sonnet 3 15
Anthropic Claude 3 Opus 15 75
Amazon Nova Pro 0.80 3.2

Nova Pro 的價格略低於 Claude 3.5 Haiku,並在高端市場中顯示出一定的競爭優勢。

** 若有填寫錯誤價格訊息,請告知我們客服修正。

實際測試Nova 的多模態處理能力

Nova Lite 和 Nova Pro 的多模態處理涵蓋影像與影片。以下為測試案例:

  1. 影像描述生成
    輸入一張Discovery拍攝的影像,Nova Pro 生成了詳細的描述,涵蓋場景、光線條件與物體行為。約 0.242 美分

  2. 影片處理
    Nova Pro 可分析影片中的影像序列,但目前無法處理音訊內容。

  3. PDF 文檔處理
    在測試中,Nova Pro 能夠將複雜的 PDF 文檔轉換為 Markdown 格式,但對表格與圖表的處理仍有改進空間。


結語:Amazon Nova 的市場定位

優勢

  • 價格競爭力: Nova Micro 成為目前市場上最便宜的模型。
  • 多模態能力: 支援影像與影片輸入,擴展了應用場景。
  • 高性價比: Nova Pro 以相對低廉的價格提供高端多模態能力。

劣勢

  • AWS 配置複雜: 高門檻的 API 訪問流程可能阻礙新用戶的採用。
  • 上下文限制: 與 Google Gemini 的 200 萬 token 相比,Nova 的 30 萬 token 稍顯不足。

未來展望

Amazon 將於 2025 年推出支援「多模態互轉」的新型 Nova 模型,並引入語音輸入功能。屆時,Nova 系列或將成為多模態 AI 的主力軍之一。

備註

總體來看,Amazon Nova 模型的推出為 LLM 市場帶來了新氣象,特別是在定價和多模態功能上表現不俗。Nova 不僅在價格上與 Google Gemini 模型形成了直接競爭,還進一步強化了多模態的處理能力,包括影像和影片的支持,這無疑為用戶提供了更多選擇。然而,與 Gemini 相比,AWS 的 API 在使用便利性上仍有改進空間,與Google Vertex,兩者都要使用平台的便利性。但是 Gemini 仍提供 Endpoint 直接調用。

儘管如此,Nova 的推出仍顯示出 Amazon 強大的技術實力和進一步挑戰頂級模型供應商的決心。未來若能在用戶友好性上更進一步,並解決相關 API 使用門檻的問題,Nova 勢必能在 LLM 市場中占有一席之地。同時,這也可能促使市場的其他參與者重新評估其定價策略,以維持競爭力。對用戶而言,這無疑是一個多贏的局面。

Share on:
Previous: World Labs:AI生成3D互動世界的新革命
Next: 被遺忘的名字:David Mayer 教授與 AI 模型中的身份迷霧
DMflow.chat

DMflow.chat

廣告

全能 DMflow.chat:支援多平台整合與持久記憶,客製欄位靈活運用,無需額外開發即可連接資料庫與表單,網頁互動+API 輸出,一步到位!

Vidu 2.0 的重大突破
16 January 2025

Vidu 2.0 的重大突破

Vidu 2.0 的重大突破 VIDU,由盛數科技開發的多模態文本轉視頻 AI 模型,近日推出了劃時代的升級版本——Vidu 2.0。這項重大更新不僅在生成速度、成本效益上取得了突破,更...

SearchGPT 原型:AI 搜尋的新時代
26 July 2024

SearchGPT 原型:AI 搜尋的新時代

SearchGPT 原型:AI 搜尋的新時代 OpenAI 正在測試 SearchGPT,這是一個結合 AI 模型和網絡信息的新搜尋功能原型。它旨在提供快速、及時的答案,並清晰地列出相關來源。...