GPT-5.4
Hacker News
OpenAI has released GPT-5.4, a frontier model featuring native computer-use capabilities, enhanced reasoning, and state-of-the-art performance in professional tasks like coding and document analysis.
Hacker News
OpenAI has released GPT-5.4, a frontier model featuring native computer-use capabilities, enhanced reasoning, and state-of-the-art performance in professional tasks like coding and document analysis.
AI 生成摘要
我們正式發佈 GPT-5.4,這是一款具備原生電腦操作能力、增強推理功能,並在編程與文件分析等專業任務中達到頂尖性能的前沿模型。
OpenAI 於 2026 年 3 月正式發布 GPT-5.4 系列模型,包含 GPT-5.4 Thinking、Codex 以及針對極致性能設計的 GPT-5.4 Pro。此版本主打專業工作場景,強化了推理、程式碼編寫與代理人工作流,並首度引入原生且具備最先進水準的電腦操作能力,允許 AI 代理人跨應用程式執行複雜任務。
Hacker News 社群對此次更新展現出高度的技術好奇與務實的質疑。討論的核心之一在於 GPT-5.4 推出的電腦操作能力,即透過視覺辨識與座標點擊來操作 UI。部分開發者認為這並非最佳路徑,質疑為何不直接使用 API 進行系統對接,認為視覺操作效率較低且容易出錯。然而,支持者反駁指出,並非所有軟體都提供完善的 API,且許多網頁介面為了防止自動化而設限,AI 具備像人類一樣操作 UI 的能力,能大幅提升其在現實經濟活動中的通用性。更有觀點認為,這種繞過封閉生態系的能力,是對抗當前網路平台過度商業化與封閉化的一種手段。
在模型效能與定價方面,社群對 GPT-5.4 Pro 顯著調漲的價格感到震驚。部分用戶推測這反映了模型規模的擴大或推理成本的增加,甚至有人戲稱這是針對政府或大型企業的定價策略。儘管價格高昂,但社群中對於 Codex 版本的評價普遍優於競爭對手,特別是在處理大型程式碼庫與長文本上下文時,Codex 被認為比 Anthropic 的 Opus 模型更具架構理解力且使用限制更為寬鬆。不過,對於 1M 超長上下文的實際表現,資深用戶仍持保留態度,認為隨著上下文增加,模型往往會因雜訊干擾而失去焦點,目前的自動壓縮技術是否能真正解決此問題仍待觀察。
此外,關於模型「擬人化」的爭論也十分熱烈。有用戶反應 GPT-5 系列模型的寫作風格變得越來越生硬、缺乏人性,甚至在情感回應上變得極度保守與說教。這引發了部分用戶對舊版模型(如 4o)的懷念,認為新模型雖然在專業技能上有所提升,但在創意寫作與日常互動的「氛圍感」上卻有所退步。整體而言,社群共識傾向於認為底層模型的競爭已進入高原期,各家廠商的技術差距正在縮小,未來的勝負關鍵將在於產品化程度、記憶機制以及如何將 AI 深度整合進現有的工作流程中。
在討論中,用戶提到了幾項值得關注的資源與工具。針對模型評測,有用戶推薦參考 OpenRouter 的定價與文檔以獲取更透明的 API 成本資訊。在技術實踐上,GitHub 上的 ghidra-cli 專案被提及作為測試長上下文模型在逆向工程應用中的案例。此外,關於「模型卡」(Model Cards)的命名由來,留言中也引用了 2018 年由 Margaret Mitchell 等人提出的學術論文,解釋了這種透明化報告框架的歷史脈絡。針對偏好使用 X 平台以外介面的讀者,社群也分享了 xcancel.com 作為替代的瀏覽方案。