GPT-5.4 正式發佈：專為專業工作設計

Hacker News

大約 6 小時前

AI 生成摘要

我們正式發佈 GPT-5.4，這是一款具備原生電腦操作能力、增強推理功能，並在編程與文件分析等專業任務中達到頂尖性能的前沿模型。

openai.com

introducing gpt 5 4

openai.com

gpt 5 4 thinking system card

x.com

2029620619743219811

背景

OpenAI 於 2026 年 3 月正式發布 GPT-5.4 系列模型，包含 GPT-5.4 Thinking、Codex 以及針對極致性能設計的 GPT-5.4 Pro。此版本主打專業工作場景，強化了推理、程式碼編寫與代理人工作流，並首度引入原生且具備最先進水準的電腦操作能力，允許 AI 代理人跨應用程式執行複雜任務。

社群觀點

Hacker News 社群對此次更新展現出高度的技術好奇與務實的質疑。討論的核心之一在於 GPT-5.4 推出的電腦操作能力，即透過視覺辨識與座標點擊來操作 UI。部分開發者認為這並非最佳路徑，質疑為何不直接使用 API 進行系統對接，認為視覺操作效率較低且容易出錯。然而，支持者反駁指出，並非所有軟體都提供完善的 API，且許多網頁介面為了防止自動化而設限，AI 具備像人類一樣操作 UI 的能力，能大幅提升其在現實經濟活動中的通用性。更有觀點認為，這種繞過封閉生態系的能力，是對抗當前網路平台過度商業化與封閉化的一種手段。

在模型效能與定價方面，社群對 GPT-5.4 Pro 顯著調漲的價格感到震驚。部分用戶推測這反映了模型規模的擴大或推理成本的增加，甚至有人戲稱這是針對政府或大型企業的定價策略。儘管價格高昂，但社群中對於 Codex 版本的評價普遍優於競爭對手，特別是在處理大型程式碼庫與長文本上下文時，Codex 被認為比 Anthropic 的 Opus 模型更具架構理解力且使用限制更為寬鬆。不過，對於 1M 超長上下文的實際表現，資深用戶仍持保留態度，認為隨著上下文增加，模型往往會因雜訊干擾而失去焦點，目前的自動壓縮技術是否能真正解決此問題仍待觀察。

此外，關於模型「擬人化」的爭論也十分熱烈。有用戶反應 GPT-5 系列模型的寫作風格變得越來越生硬、缺乏人性，甚至在情感回應上變得極度保守與說教。這引發了部分用戶對舊版模型（如 4o）的懷念，認為新模型雖然在專業技能上有所提升，但在創意寫作與日常互動的「氛圍感」上卻有所退步。整體而言，社群共識傾向於認為底層模型的競爭已進入高原期，各家廠商的技術差距正在縮小，未來的勝負關鍵將在於產品化程度、記憶機制以及如何將 AI 深度整合進現有的工作流程中。

延伸閱讀

在討論中，用戶提到了幾項值得關注的資源與工具。針對模型評測，有用戶推薦參考 OpenRouter 的定價與文檔以獲取更透明的 API 成本資訊。在技術實踐上，GitHub 上的 ghidra-cli 專案被提及作為測試長上下文模型在逆向工程應用中的案例。此外，關於「模型卡」（Model Cards）的命名由來，留言中也引用了 2018 年由 Margaret Mitchell 等人提出的學術論文，解釋了這種透明化報告框架的歷史脈絡。針對偏好使用 X 平台以外介面的讀者，社群也分享了 xcancel.com 作為替代的瀏覽方案。