newsence
來源篩選

Step 3.5 Flash: Fast Enough to Think. Reliable Enough to Act

Hacker News

StepFun introduces Step 3.5 Flash, a high-performance open-source foundation model utilizing a sparse Mixture of Experts architecture to deliver frontier reasoning and agentic capabilities with exceptional efficiency.

newsence

Step 3.5 Flash:思考夠快,行動夠穩

Hacker News
10 天前

AI 生成摘要

階躍星辰推出 Step 3.5 Flash,這是我們最強大的開源基礎模型,採用稀疏混合專家架構,旨在以卓越的效率提供前沿的推理與智能體能力。

背景

StepFun(階躍星辰)近期發布了其最新的開源基礎模型 Step 3.5 Flash,這是一款採用稀疏混合專家(MoE)架構的大型語言模型。該模型擁有 196B 總參數,但在推論時僅需激活 11B 參數,旨在於高難度推理、代碼編寫與智能體能力之間取得平衡,並強調在保持高性能的同時提供極高的運算效率。

社群觀點

在 Hacker News 的討論中,社群對於 Step 3.5 Flash 的技術規格與實際表現展現了高度關注。部分用戶指出,該模型在多項基準測試中已能超越 Kimi K2.5 與 GLM 4.7 等競爭對手,顯示出強勁的競爭力。特別是在硬體門檻方面,已有討論提到透過 4-bit 量化技術,該模型可以在配備 128GB 記憶體的機器(如 Mac Studio 或 NVIDIA GB10 平台)上運行,這對於追求在地化部署的開發者而言具有相當的吸引力。

然而,並非所有評價都趨向正面。有使用者在實際測試後反映,該模型在處理特定領域的查詢(例如寶可夢卡牌冠軍牌組及其運作邏輯)時,出現了嚴重的幻覺現象,表現明顯遜於 Claude Opus 4.6、DeepSeek 或 Kimi 等模型。這引發了社群對於基準測試分數與實際應用可靠性之間落差的疑慮,提醒其他開發者在使用時應保持謹慎。此外,官方網頁的圖表設計也遭到不少吐槽,其反向的 X 軸設計讓許多讀者感到困惑,甚至被質疑是為了讓數據在視覺上顯得更美觀而刻意為之。

關於 StepFun 的背景,社群也進行了深入挖掘。由於官方網站的資訊導引較為破碎,用戶紛紛尋求其商業模式與定價資訊。目前已知這是一家總部位於中國的 AI 初創公司,並已建立起相對完整的 API 定價體系。最後,有觀點認為 Step 3.5 Flash 對效率的追求值得肯定,因為近期許多模型雖然在基準測試上有所突破,卻往往是以劇增的 Token 消耗與電力需求為代價。若 AI 要實現真正的轉型,解決能源與運算效率問題將是比單純追求高分更關鍵的挑戰。

延伸閱讀

  • StepFun 官方定價頁面:提供各型號 API 調用的詳細費用說明。
  • NVIDIA 開發者論壇討論:關於如何在 128GB 記憶體環境下運行 Step 3.5 Flash 的技術細節。
  • StepFun 維基百科條目:關於該公司的背景與發展歷程介紹。