Google 推出 Gemini 3.1 Flash-Lite AI 模型以更快速度處理以及更低成本解決 AI 導入痛點

陳拔
個人積分：48699分
文章編號：92869364

48699分

樓主

2026-03-04 11:43

Google 推出 Gemini 3.1 Flash-Lite AI 模型以更快速度處理以及更低成本解決 AI 導入痛點

Google 推出 Gemini 3.1 Flash-Lite AI 模型。

在上個月底推出具備進階推理能力、解決複雜問題的 Gemini 3.1 Pro 後，Google 持續擴展 Gemini 3.1 世代產品，在今天稍早宣布推出了著重在速度表現以及成本效益的「Gemini 3.1 Flash-Lite」模型，主要針對大規模、高頻率的工作負載所使用，來解決目前 AI 使用者所面臨到的運算成本以及延遲時間兩大痛點。

Google 推出 Gemini 3.1 Flash-Lite AI 模型以更快速度處理以及更低成本解決 AI 導入痛點

（點擊可看大圖）首先在價格部分，Google 將 Gemini 3.1 Flash-Lite 訂定了相當具有競爭力的使用價格，每百萬個輸入 token 的定價為 0.25 美元，每百萬個輸出 token 則是 1.50 美元，比先前 Gemini 2.5 Flash 或是競爭對手的定價都還要低，針對需要大量使用 Token 的企業 API 來說相當具有吸引力。

另外在速度表現上，Gemini 3.1 Flash-Lite 在 Artificial Analysis 的基準測試中，首次回應時間比起 Gemini 2.5 Flash 要快了 2.5 倍，整體輸出速度提升了 45%，尤其是首次回應時間縮短所帶來的低延遲表現，對於想要建立快速反應、具備即時互動體驗的開發者來說，更是具有優勢，以下是 Google 展示 Gemini 3.1 Flash-Lite 快速建立影片分類的示範影片。

至於在效能表現部分，這次 Gemini 3.1 Flash-Lite 加入了「思考層級」彈性控制設計，提供開發者更高的控制權與彈性，可以依照任務需求手動調整模型在處理特定任務時的思考程度，在面對高頻率的工作負載，不會浪費資源在過度運算上。而在實際效能跑分的表現上，Gemini 3.1 Flash-Lite 在 Arena.ai 排行榜上獲得 1432 的 Elo 分數。在專業基準的 GPQA Diamond 測試中取得 86.9% 的成績，在 MMMU Pro 測試中達到 76.8%，比起上一代的 Gemini 2.5 Flash 等更大型的模型獲得更好的表現。

Google 推出 Gemini 3.1 Flash-Lite AI 模型以更快速度處理以及更低成本解決 AI 導入痛點

（點擊可看大圖） Gemini 3.1 Flash-Lite 效能測試表現。

而在應用層面部分，Google 也舉例了 Gemini 3.1 Flash-Lite 使用在成本敏感的大規模應用場景，包括快速處理大量翻譯與審核內容，也可以應對需要深度推理的複雜工作，像是生成使用者介面、建立模擬場景等等，先前 Google 已經將 Gemini 3.1 Flash-Lite 提供給大型企業以及早期開發者做導入測試，而使用者目前也可透過 Google AI Studio 的 Gemini API 開發者預覽或是企業用戶透過 Vertex AI 平台進行存取。

2026-03-04 11:43 發佈

文章關鍵字 google 模型 ai Gemini 3.1 Flash-Lite