
Google 推出 Gemini 3.1 Flash-Lite AI 模型。
在上個月底推出具備進階推理能力、解決複雜問題的 Gemini 3.1 Pro 後,Google 持續擴展 Gemini 3.1 世代產品,在今天稍早宣布推出了著重在速度表現以及成本效益的「Gemini 3.1 Flash-Lite」模型,主要針對大規模、高頻率的工作負載所使用,來解決目前 AI 使用者所面臨到的運算成本以及延遲時間兩大痛點。

(點擊可看大圖)首先在價格部分,Google 將 Gemini 3.1 Flash-Lite 訂定了相當具有競爭力的使用價格,每百萬個輸入 token 的定價為 0.25 美元,每百萬個輸出 token 則是 1.50 美元,比先前 Gemini 2.5 Flash 或是競爭對手的定價都還要低,針對需要大量使用 Token 的企業 API 來說相當具有吸引力。
另外在速度表現上,Gemini 3.1 Flash-Lite 在 Artificial Analysis 的基準測試中,首次回應時間比起 Gemini 2.5 Flash 要快了 2.5 倍,整體輸出速度提升了 45%,尤其是首次回應時間縮短所帶來的低延遲表現,對於想要建立快速反應、具備即時互動體驗的開發者來說,更是具有優勢,以下是 Google 展示 Gemini 3.1 Flash-Lite 快速建立影片分類的示範影片。
至於在效能表現部分,這次 Gemini 3.1 Flash-Lite 加入了「思考層級」彈性控制設計,提供開發者更高的控制權與彈性,可以依照任務需求手動調整模型在處理特定任務時的思考程度,在面對高頻率的工作負載,不會浪費資源在過度運算上。而在實際效能跑分的表現上,Gemini 3.1 Flash-Lite 在 Arena.ai 排行榜上獲得 1432 的 Elo 分數。在專業基準的 GPQA Diamond 測試中取得 86.9% 的成績,在 MMMU Pro 測試中達到 76.8%,比起上一代的 Gemini 2.5 Flash 等更大型的模型獲得更好的表現。

(點擊可看大圖) Gemini 3.1 Flash-Lite 效能測試表現。
而在應用層面部分,Google 也舉例了 Gemini 3.1 Flash-Lite 使用在成本敏感的大規模應用場景,包括快速處理大量翻譯與審核內容,也可以應對需要深度推理的複雜工作,像是生成使用者介面、建立模擬場景等等,先前 Google 已經將 Gemini 3.1 Flash-Lite 提供給大型企業以及早期開發者做導入測試,而使用者目前也可透過 Google AI Studio 的 Gemini API 開發者預覽或是企業用戶透過 Vertex AI 平台進行存取。
感謝分享&介紹,AI依舊是近年的重點呀 


























































































