Gemini 3.1 Flash-Lite：專為大規模智慧應用而生

Google Deepmind

大約 5 小時前

AI 生成摘要

Google DeepMind 推出了 Gemini 3.1 Flash-Lite，這是我們最快且最具成本效益的模型，專為大規模開發者工作負載設計，並具備強化的推理能力。

Gemini 3.1 Flash-Lite：為大規模智慧應用而生

2026 年 3 月 3 日

為您最高運算量的工作負載提供同級最佳的智慧能力。

內容摘要

Gemini 3.1 Flash-Lite 現已透過 Google AI Studio 的 Gemini API 向開發者開放預覽，並透過 Vertex AI 向企業用戶開放。其定價為每百萬輸入 token 0.25 美元，每百萬輸出 token 1.50 美元，不僅具備成本效益，且速度比 2.5 Flash 更快。您可將 3.1 Flash-Lite 應用於翻譯、內容審核、生成使用者介面以及建立模擬等任務。

基本說明

Google 推出了一款名為 Gemini 3.1 Flash-Lite 的新 AI 模型。它的速度極快且使用成本低廉，能讓更多人使用。這款 AI 擅長處理語言翻譯和內容檢查等工作。部分公司已經開始使用它來解決棘手問題，因為它既聰明又高效。

探索其他風格：

今天，我們正式介紹 Gemini 3.1 Flash-Lite，這是我們 Gemini 3 系列中最快且最具成本效益的模型。3.1 Flash-Lite 專為大規模的高運算量開發者工作負載而打造，在其價格區間與模型層級中提供了卓越的品質。

從今天起，3.1 Flash-Lite 開始透過 Google AI Studio 的 Gemini API 向開發者，以及透過 Vertex AI 向企業用戶推出預覽版。

不妥協的成本效益

3.1 Flash-Lite 的定價僅為每百萬輸入 token 0.25 美元及每百萬輸出 token 1.50 美元，以大型模型極小部分的成本提供了增強的效能。根據 Artificial Analysis 基準測試，它的「首個答案 token 時間」（Time to First Answer Token）比 2.5 Flash 快了 2.5 倍，輸出速度提升了 45%，同時保持了相同甚至更好的品質。這種低延遲對於高頻率工作流至關重要，使其成為開發者構建即時響應體驗的理想模型。

該圖片顯示了兩張標題為「速度與成本效益」的長條圖，對比了 Gemini 3.1 Flash-Lite 與其他幾款模型（包括 Gemini 2.5 Flash-Lite、GPT-5 mini、Claude 4.5 Haiku 和 Grok 4.1 Fast）的「輸出速度（越高越好）」和「價格（越低越好）」。

Gemini 3.1 Flash-Lite 在速度和品質上均超越了 2.5 Flash。

3.1 Flash-Lite 在 Arena.ai 排行榜上獲得了令人印象深刻的 1432 分 Elo 評分，並在推理和多模態理解基準測試中超越了同層級的其他模型，包括在 GPQA Diamond 取得 86.9% 以及在 MMMU Pro 取得 76.8% 的成績——甚至超越了前幾代較大的 Gemini 模型（如 2.5 Flash）。

該圖片顯示了多款 AI 模型的對比表，包括「Gemini 3.1 Flash-Lite」、「Gemini 2.5 Dynamic」、「Gemini 2.5 Flash-Lite」、「GPT-5 mini」、「Claude 4.5 Haiku」和「Grok 4.1 Fast」，涵蓋了輸入/輸出價格、輸出速度以及各種學術、推理和事實基準測試等多項指標。

為開發者提供的大規模自適應智慧

除了原始效能外，Gemini 3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中標配了「思考等級」（thinking levels），讓開發者能夠控制並靈活選擇模型針對某項任務需要「思考」多少，這對於管理高頻率工作負載至關重要。3.1 Flash-Lite 可以大規模處理任務，例如以成本為優先考量的大量翻譯和內容審核。它也能處理需要更深入推理的複雜工作負載，例如生成使用者介面和儀表板、建立模擬或遵循指令。

3.1 Flash-Lite 能立即在電子商務線框圖中填入數百個不同類別的產品。

3.1 Flash-Lite 可以利用即時預報和歷史數據，即時生成動態天氣儀表板。

3.1 Flash-Lite 建立了一個 SaaS 代理，能夠為企業執行多樣化、多步驟的任務。

3.1 Flash-Lite 可以快速分析並分類大量內容（如圖片）。

AI Studio 和 Vertex AI 的早期試用開發者，以及 Latitude、Cartwheel 和 Whering 等公司，已經在使用 3.1 Flash-Lite 大規模解決複雜問題。早期測試者強調了 3.1 Flash-Lite 的效率和推理能力，表示它能以大型模型的精準度處理複雜輸入，並能嚴格遵循指令。

我們期待看到您使用 3.1 Flash-Lite 以及 Gemini 3 系列的其他模型所構建的成果。

在您的收件匣中獲取更多來自 Google 的故事。

      在您的收件匣中獲取更多來自 Google 的故事。

您的資訊將根據 Google 的隱私權政策進行使用。

完成。只需再一個步驟。

請檢查您的收件匣以確認訂閱。

您已經訂閱了我們的電子報。

您也可以使用不同的電子郵件地址進行訂閱。

Gemini 3.1 Flash-Lite: Built for Intelligence at Scale

Gemini 3.1 Flash-Lite：為大規模智慧應用而生

Gemini 3.1 Flash-Lite：為大規模智慧應用而生

內容摘要

基本說明

探索其他風格：

不妥協的成本效益

為開發者提供的大規模自適應智慧

在您的收件匣中獲取更多來自 Google 的故事。