背景
知名科技部落客 Simon Willison 近期關注到阿里巴巴旗下開源模型 Qwen(通義千問)團隊發生的重大動盪。隨著 Qwen 3.5 系列模型的發布,該團隊的核心人物、技術負責人林俊漾(Junyang Lin)突然宣布離職,隨後多位負責代碼開發、指令微調及多模態研究的核心成員也相繼出走。這場人事地震發生在 Qwen 3.5 展現出極佳性能的關鍵時刻,引發了開發者社群對於開源模型未來走向的熱烈討論。
社群觀點
在 Hacker News 的討論中,社群對於 Qwen 團隊的集體離職感到震驚,並對其背後的組織架構調整感到惋惜。有意見指出,這類核心人才的流失往往源於企業內部的權力重組,例如傳聞中阿里巴巴從 Google Gemini 團隊挖角新主管來領導 Qwen,這可能導致了原團隊的集體反彈。部分討論者認為,儘管人工智慧被視為未來能取代人類勞動的工具,但 Qwen 的案例恰恰證明了頂尖 AI 的研發依然高度依賴特定天才研究員的領導。這種「AI 研發離不開人」的現象,與當前「AI 將取代人類」的敘事形成了一種諷刺的對比。
針對 Qwen 3.5 模型本身的表現,社群內部的評價呈現兩極化。支持者認為 Qwen 3.5 在代碼編寫與代理任務(Agentic tasks)上表現優異,特別是 35B 規模的模型,在處理 Rust 或 Elixir 等語言時,展現出極強的邏輯性與錯誤修正能力,甚至被認為是同量級模型中的佼佼者。然而,反對者則質疑這些模型可能存在針對評測基準(Evals)過度擬合的問題。有使用者分享其在實際開發環境中的挫敗經驗,認為模型在處理廣泛需求時缺乏靈活性,傾向於從零開始撰寫代碼而非調用現成工具。對此,有經驗的開發者建議,開源模型通常需要更明確的提示詞工程或規劃框架輔助,才能發揮其應有的實力。
此外,關於人才去向與地緣政治的討論也相當熱絡。有觀點好奇為何美國的 AI 實驗室沒有砸重金挖角這些頂尖研究員,但隨即有反駁指出,這群核心成員若在中國本土創業,背靠龐大的內需市場,其潛在收益可能遠超受僱於美國公司。社群普遍擔心,若這群專家轉向閉源創業,將是全球開源社群的重大損失。同時,也有人提到歐洲極度需要類似 Qwen 這樣具備競爭力的模型,以對沖對美國技術的過度依賴與潛在的政治風險。
最後,針對在個人電腦(如 Mac)上運行大型模型的實用性,社群也展開了辯論。部分評論者批評,媒體與部落客常宣稱某些模型可以在筆電上運行,但實際上運行速度往往慢到難以在生產環境中使用,這種說法有誤導消費者購買昂貴硬體之嫌。然而,隨著 Qwen 3.5 推出多種尺寸的蒸餾版本,支持者仍對其在有限資源下達成高性能的技術路徑抱持期待,並希望這支團隊無論未來身處何方,都能延續其在輕量化高效模型上的研發精神。
延伸閱讀
在討論過程中,有開發者推薦了 Pi (pi.dev) 作為比 OpenCode 更適合開源模型的開發工具框架,認為其極簡主義的設計更能與能力受限的開源模型契合。此外,討論也提及了 Qwen3-Coder-Next 與 Qwen 3.5 之間的架構演進關係,後者被視為前者的完整訓練成熟版。