newsence
來源篩選

AGI is Here

Lesswrong

I believe that with the release of models like Claude Opus 4.6 and GPT-5.3, we have reached the threshold of 'minimum viable AGI' based on their reasoning, planning, and goal-achieving capabilities. While they lack full embodiment, their performance in complex tasks suggests that AGI is already here, and I fear we are not prepared for the consequences.

newsence

通用人工智慧(AGI)已經到來

Lesswrong
8 天前

AI 生成摘要

我認為隨著 Claude Opus 4.6 和 GPT-5.3 的發布,根據其推理、規劃和達成目標的能力,我們已經達到了「最小可行性通用人工智慧(AGI)」的門檻。雖然它們尚不具備完整的實體化能力,但其在複雜任務中的表現顯示 AGI 已經到來,而我擔心我們尚未對此做好準備。

我有些猶豫是否要寫這篇文章,因為我擔心其核心主張會被誤解,但我認為現在說出來很重要,所以還是寫了。

Claude Opus 4.6 於 2 月 5 日發布。GPT-5.3 也在同一天推出。我們使用這些模型已經兩個多星期了,而在過去的一兩天裡,我和其他人開始意識到,AGI(通用人工智慧)已經到來。

現在,我不想誇大我所表達的意思,所以讓我明確說明我所使用的標準。如果我回到 2018 年,在 GPT-2 發布之前,如果你問我 AGI 具備什麼樣的能力,我可能會這樣回答:

  • 能夠 思考(並進行新穎的推理)
  • 能夠 規劃(並為前所未有的行動制定計劃)
  • 能夠 達成目標(包括由其自身設定的工具性目標)
  • 足夠 靈活,能夠有意義地嘗試人類能完成的大多數任務

很難否認 Opus 4.6 和 GPT-5.3 能夠做到第 1 到第 3 點。唯一值得真正辯論的是第 4 點,因為有些事情是我能做而 Claude 和 ChatGPT 做不到的,比如做一個花生醬三明治。但考慮到這些模型展現出的能力,這感覺更像是它們所處環境(harnesses)的限制,而非模型本身的限制。如果給予幾週時間和機器人技術的一些進展,我有信心目前的模型可以用來製作三明治,儘管代價可能是數百萬個 token。

明確地說,這些模型並非我們預期中的那種 AGI。當人們談論 AGI 時,通常是指完整體,即完全解決了持續學習和遷移學習、具備全光譜多模態感知,並以機器人介面的形式具備實體。相反地,我們現在擁有的是更像 最小可行性 AGI(minimum viable AGI),這意味著它是一種足夠通用的 AI,讓我們應該開始有意義地為其貼上 AGI 的標籤。

回想起來,我們或許應該更早做出這項聲明。也許應該是在 Opus 4 或 GPT-5 發布時,又或者是 Claude Code 推出時。但那些模型在我所有四項標準上的表現都較差,這使得當時很難說它們已經跨越了 AGI 的門檻,而那些當時就這麼說的人也更容易被忽視。

現在,這些主張已變得難以否認。我每天都與這些模型一起編寫程式碼,我能委派給它們的工作量令人難以置信,甚至超過了我對一名初級工程師的預期。它們甚至有能力構建一個,寫下這句話令人感到恐懼。在接下來的幾週和幾個月裡,這些模型只會變得越來越強大,隨著它們的增強,事情將會變得越來越怪異。

你可能認為我現在就宣布 AGI 到來為時過早,或許確實如此。但我希望你能同意,如果它還沒到,AGI 也即將來臨,而我擔心我們對此還遠未做好準備。

後續文章: