Gemini 3.1 Flash-Lite:為大規模智慧應用而生
Gemini 3.1 Flash-Lite:為大規模智慧應用而生
2026 年 3 月 3 日
為您最高運算量的工作負載提供同級最佳的智慧能力。
內容摘要
Gemini 3.1 Flash-Lite 現已透過 Google AI Studio 的 Gemini API 向開發者開放預覽,並透過 Vertex AI 向企業用戶開放。其定價為每百萬輸入 token 0.25 美元,每百萬輸出 token 1.50 美元,不僅具備成本效益,且速度比 2.5 Flash 更快。您可將 3.1 Flash-Lite 應用於翻譯、內容審核、生成使用者介面以及建立模擬等任務。
基本說明
Google 推出了一款名為 Gemini 3.1 Flash-Lite 的新 AI 模型。它的速度極快且使用成本低廉,能讓更多人使用。這款 AI 擅長處理語言翻譯和內容檢查等工作。部分公司已經開始使用它來解決棘手問題,因為它既聰明又高效。
探索其他風格:
今天,我們正式介紹 Gemini 3.1 Flash-Lite,這是我們 Gemini 3 系列中最快且最具成本效益的模型。3.1 Flash-Lite 專為大規模的高運算量開發者工作負載而打造,在其價格區間與模型層級中提供了卓越的品質。
從今天起,3.1 Flash-Lite 開始透過 Google AI Studio 的 Gemini API 向開發者,以及透過 Vertex AI 向企業用戶推出預覽版。
不妥協的成本效益
3.1 Flash-Lite 的定價僅為每百萬輸入 token 0.25 美元及每百萬輸出 token 1.50 美元,以大型模型極小部分的成本提供了增強的效能。根據 Artificial Analysis 基準測試,它的「首個答案 token 時間」(Time to First Answer Token)比 2.5 Flash 快了 2.5 倍,輸出速度提升了 45%,同時保持了相同甚至更好的品質。這種低延遲對於高頻率工作流至關重要,使其成為開發者構建即時響應體驗的理想模型。
Gemini 3.1 Flash-Lite 在速度和品質上均超越了 2.5 Flash。
3.1 Flash-Lite 在 Arena.ai 排行榜上獲得了令人印象深刻的 1432 分 Elo 評分,並在推理和多模態理解基準測試中超越了同層級的其他模型,包括在 GPQA Diamond 取得 86.9% 以及在 MMMU Pro 取得 76.8% 的成績——甚至超越了前幾代較大的 Gemini 模型(如 2.5 Flash)。
為開發者提供的大規模自適應智慧
除了原始效能外,Gemini 3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中標配了「思考等級」(thinking levels),讓開發者能夠控制並靈活選擇模型針對某項任務需要「思考」多少,這對於管理高頻率工作負載至關重要。3.1 Flash-Lite 可以大規模處理任務,例如以成本為優先考量的大量翻譯和內容審核。它也能處理需要更深入推理的複雜工作負載,例如生成使用者介面和儀表板、建立模擬或遵循指令。
3.1 Flash-Lite 能立即在電子商務線框圖中填入數百個不同類別的產品。
3.1 Flash-Lite 可以利用即時預報和歷史數據,即時生成動態天氣儀表板。
3.1 Flash-Lite 建立了一個 SaaS 代理,能夠為企業執行多樣化、多步驟的任務。
3.1 Flash-Lite 可以快速分析並分類大量內容(如圖片)。
AI Studio 和 Vertex AI 的早期試用開發者,以及 Latitude、Cartwheel 和 Whering 等公司,已經在使用 3.1 Flash-Lite 大規模解決複雜問題。早期測試者強調了 3.1 Flash-Lite 的效率和推理能力,表示它能以大型模型的精準度處理複雜輸入,並能嚴格遵循指令。
我們期待看到您使用 3.1 Flash-Lite 以及 Gemini 3 系列的其他模型所構建的成果。
在您的收件匣中獲取更多來自 Google 的故事。
在您的收件匣中獲取更多來自 Google 的故事。
您的資訊將根據 Google 的隱私權政策進行使用。
完成。只需再一個步驟。
請檢查您的收件匣以確認訂閱。
您已經訂閱了我們的電子報。
您也可以使用不同的電子郵件地址進行訂閱。