Step 3.5 Flash：思考夠快，行動夠穩

Hacker News

10 天前

AI 生成摘要

階躍星辰推出 Step 3.5 Flash，這是我們最強大的開源基礎模型，採用稀疏混合專家架構，旨在以卓越的效率提供前沿的推理與智能體能力。

static.stepfun.com

step 3

背景

StepFun（階躍星辰）近期發布了其最新的開源基礎模型 Step 3.5 Flash，這是一款採用稀疏混合專家（MoE）架構的大型語言模型。該模型擁有 196B 總參數，但在推論時僅需激活 11B 參數，旨在於高難度推理、代碼編寫與智能體能力之間取得平衡，並強調在保持高性能的同時提供極高的運算效率。

社群觀點

在 Hacker News 的討論中，社群對於 Step 3.5 Flash 的技術規格與實際表現展現了高度關注。部分用戶指出，該模型在多項基準測試中已能超越 Kimi K2.5 與 GLM 4.7 等競爭對手，顯示出強勁的競爭力。特別是在硬體門檻方面，已有討論提到透過 4-bit 量化技術，該模型可以在配備 128GB 記憶體的機器（如 Mac Studio 或 NVIDIA GB10 平台）上運行，這對於追求在地化部署的開發者而言具有相當的吸引力。

然而，並非所有評價都趨向正面。有使用者在實際測試後反映，該模型在處理特定領域的查詢（例如寶可夢卡牌冠軍牌組及其運作邏輯）時，出現了嚴重的幻覺現象，表現明顯遜於 Claude Opus 4.6、DeepSeek 或 Kimi 等模型。這引發了社群對於基準測試分數與實際應用可靠性之間落差的疑慮，提醒其他開發者在使用時應保持謹慎。此外，官方網頁的圖表設計也遭到不少吐槽，其反向的 X 軸設計讓許多讀者感到困惑，甚至被質疑是為了讓數據在視覺上顯得更美觀而刻意為之。

關於 StepFun 的背景，社群也進行了深入挖掘。由於官方網站的資訊導引較為破碎，用戶紛紛尋求其商業模式與定價資訊。目前已知這是一家總部位於中國的 AI 初創公司，並已建立起相對完整的 API 定價體系。最後，有觀點認為 Step 3.5 Flash 對效率的追求值得肯定，因為近期許多模型雖然在基準測試上有所突破，卻往往是以劇增的 Token 消耗與電力需求為代價。若 AI 要實現真正的轉型，解決能源與運算效率問題將是比單純追求高分更關鍵的挑戰。

Step 3.5 Flash: Fast Enough to Think. Reliable Enough to Act

背景

社群觀點

延伸閱讀