newsence
來源篩選

Clarifying Changes in AI Timeline Forecasts Since AI 2027

Lesswrong

We are clarifying misunderstandings in recent media reports regarding our AI timelines, emphasizing that while our models have updated, we remain highly uncertain and never predicted a definitive 'doom' date of 2027. This post provides a detailed comparison of our past and current forecasts for AGI and ASI to ensure our views are accurately represented.

newsence

釐清自AI 2027以來AI時間線預測的變化

Lesswrong
大約 1 個月前

AI 生成摘要

我們正在澄清近期媒體報導中對我們 AI 時間線預測的誤解,並強調雖然我們的模型有所更新,但我們始終保持高度不確定性,且從未斷言 2027 年就是確定的「毀滅」日期。本篇文章提供了我們過去與現在對 AGI 和 ASI 預測的詳細對比,以確保我們的觀點得到準確呈現。

最近的一些新聞文章討論了自《AI 2027》發布以來,我們對 AI 時間線預測的更新,最值得注意的是我們新的時間線與起飛模型:(參見)。^() 雖然我們很高興看到關於 AI 時間線的更廣泛討論,但這些文章在報導中存在重大錯誤。請不要假設其內容準確代表了我們所寫或相信的觀點!本文旨在澄清我們過去和現在的看法。^()

涉及的文章包括:

  • 衛報 (The Guardian):
  • 獨立報 (The Independent):
  • Inc:
  • 華盛頓郵報 (WaPo):
  • 每日鏡報 (Daily Mirror):

我們的核心觀點

我們在 2025 年 4 月發布《AI 2027》時所相信、且至今仍然相信的重要觀點:

  • 通用人工智慧 (AGI) 和人工超智慧 (ASI) 最終將被製造出來,且可能很快就會實現,因此我們應該為其近期出現做好準備。
  • 我們對於 AGI 和 ASI 何時建成存在高度不確定性,我們絕對無法自信地預測具體的某一年。

在過去的 9 個月裡,我們的想法具體發生了哪些變化?以下是重點。請參閱 查看相同的表格,其中包含大多數預測的來源連結。

*以下是 Daniel 目前對 TED-AI 的綜合考量分佈:

如果您想查看包含更多指標以及我們模型原始輸出的更完整表格,我們在製作了一個更大的表格。

我們還製作了這張 Daniel 和 Eli 的 AGI 中位數隨時間變化的圖表,追溯到更久以前:

關於此圖表背後的數據,請參見

糾正常見誤解

將報導我們工作的文章中的誤解/誤導歸類如下:

暗示我們曾確信 AI 里程碑(例如 SC、AGI 或 ASI)會在 2027 年發生(衛報、Inc、每日鏡報)。 我們已盡力明確表示,我們從未確信 AGI 會在 2027 年到來。例如,我們在《AI 2027》中多次強調了我們的不確定性,為了更加清晰,我們最近在《AI 2027》的前言中增加了一個段落來解釋這一點。

將我們舊的「眾數預測」與新模型的「中位數參數預測」進行比較(衛報、獨立報、華盛頓郵報、每日鏡報),並將我們舊的眾數預測與 Daniel 在推文中陳述的新中位數 SC/AGI 預測進行比較(華盛頓郵報)。 這是錯誤的,但由於我們沒有非常顯眼地報告我們的新眾數或舊中位數,因此這很棘手。透過這篇部落格文章,我們希望能讓這一點更加清晰。

暗示 上預設顯示的預測代表 Daniel 的觀點,而該預測在文章發表前一直使用 Eli 的中位數參數(衛報、獨立報、華盛頓郵報、每日鏡報)。 在我們最初的網站上,左上角的說明中清楚地寫著預設顯示的里程碑是使用 Eli 的參數。儘管如此,我們已將預設更改為使用 Daniel 的參數以減少困惑。

過去時間線預測的詳細回顧

2025 年 4 月以來的預測

下面我們提供了 2025 年 4 月及近期時間線預測的全面回顧。我們在表格下方解釋了各行各列。請參閱 查看相同的表格,其中包含大多數預測的來源連結和更大的文字。

*第一行中的里程碑定義見腳註。

解釋第二行中的摘要統計數據:

  • 眾數年份 (Modal year) 是指我們認為某個里程碑最有可能達到的年份。
  • 中位數到達日期 (Median arrival date) 是指有 50% 的機率該里程碑已經實現的時間點。
  • 中位數參數下的到達日期 (Arrival date with median parameters) 是指如果我們將所有參數設置為其中位數值時模型的輸出。有時這會導致與蒙地卡羅模擬的中位數有顯著差異。這不適用於「綜合考量」的預測。

解釋其餘各行中的預測來源:

  • 綜合考量預測 (All-things-considered forecasts): 我們對世界上將發生什麼的預測,包括在時間線和起飛模型輸出之上的調整。
  • 2025 年 4 月時間線模型輸出、基準與差距 以及 2025 年 4 月時間線模型輸出、時間跨度擴展 包含了我們隨《AI 2027》發布的兩個變體的輸出。
  • 2025 年 12 月 AI Futures Model 輸出 包含了我們的輸出。

2018-2026 AGI 中位數預測

下面我們概述了 Daniel 和我 (Eli) 對 AGI 中位數到達日期預測的歷史,最早可追溯到 2018 年。這是我們擁有最多關於自身觀點的過去數據(包括許多公開聲明)的摘要統計指標。

Daniel

除非另有說明,否則對於上述圖表,我假設對特定年份的預測是該年中旬的中位數(例如,如果 Daniel 說 2030 年,我假設為 2030.5),因為我們沒有記錄該預測是指該年內的哪個時間點。

2013-2017:未知。 Daniel 大約在 2013 年開始思考 AGI 並關注 AI 領域。他認為 AGI 在他有生之年到來是一個合理的可能性,但我們找不到他當時做出定量預測的任何記錄。
2018:2070。 在 Metaculus 上,Daniel 對 給出了 30% 的機率,這可能意味著中位數在 2070 年左右?(請注意,這個問題的達成可能早於我們對 AGI 作為 TED-AI 的定義,但當時 Daniel 將其解釋為類似 TED-AI 的東西)
2020 年初:2050。 Daniel 將 2040 年實現 HLMI 的機率更新為 40%,這可能意味著中位數在 2050 年左右。
2020 年 11 月:2030。 「我目前認為有大約 50% 的機會在 2030 年前達到無法回頭的臨界點。」(
2021 年 8 月:2029。 「當我寫這個故事時,我的 AI 時間線中位數大約是 2029 年。」(
2022 年初:2029。 「當我在 2022 年初加入 OpenAI 時,我的時間線已經相當短了(中位數 2029 年),而事情的發展大多如我所料。」(
2022 年 12 月:2027。 Daniel 於 2022 年底加入 OpenAI,他的中位數降至 2027 年。「自從我寫了這個故事以來,我的整體時間線有所縮短……當我寫這個故事時,我的 AI 時間線中位數大約是 2029 年。」(
2023 年 11 月:2027。 2027 年作為「目前 99% 的全遠端工作可被自動化的中位數估計」。(
2024 年 1 月:2027。 這是我們開始撰寫《AI 2027》初稿的時候。
2024 年 2 月:2027。 「我預計在未來 3 年內的某個時候會需要這筆錢,因為那大約是我們達到 AGI 50% 概率的時候。」(
2025 年 1 月:2027。 「我對 AGI 的中位數年份仍然是 2027 年。」(
2025 年 2 月:2028。 「順便說一下,我的 AGI 時間線中位數現在是 2028 年,高於自 2022 年以來一直保持的 2027 年。這有很多原因,但主要原因是我被 Eli Lifland 和 Nikola Jurkovic 一直在開發的『基準+差距』論點所說服。(但我被說服的原因可能是我的直覺受到了預訓練放緩等事件的影響)」。(
2025 年 4 月:2028。 「從去年夏天項目開始到現在,Daniel 對智慧爆炸的中位數從 2027 年轉移到了 2028 年。」(
2025 年 8 月:2029 年底 (2030.0)。 「昨天與 @RyanPGreenblatt 就 AGI 時間線進行了很好的交談。我推薦並在方向上同意他在這裡的看法;我的底線數據略有不同(中位數約為 2029 年底),正如他在腳註中所描述的那樣。」(
2025 年 11 月:2030。 「是的!事情似乎比《AI 2027》的情景進展得慢一些。我們發布時的時間線比 2027 年要長,現在又更長了一點;我最近的說法是『2030 年左右,但有很大的不確定性』。」(
2026 年 1 月:2030 年 12 月 (2030.95)。

Eli

除非另有說明,否則對於上述圖表,我假設對特定年份的預測是該年中旬的中位數(例如,如果我說 2035 年,我假設為 2035.5),因為我們沒有記錄該預測是指該年內的哪個時間點。

2018-2020:未知。 我在 2018 年開始思考 AGI,但並未投入大量時間。2020 年我在 Metaculus 上預測弱通用 AI 的中位數為 2041 年,不確定我當時對 AGI 的看法,但可能更晚。
2021:2060。 「之前我的 TAI(轉型 AI)時間線與 Holden 在的看法大致相似:『在 15 年內(到 2036 年)看到轉型 AI 的機率超過 10%;在 40 年內(到 2060 年)看到的機率約為 50%;在本世紀內(到 2100 年)看到的機率約為 2/3』。」()。我當時通常應用一種啟發式方法,認為投入 AI 和 AI 安全的人會偏向/被篩選為支持短時間線。
2022 年 7 月:2050。 「我(和群眾)嚴重低估了 MATH 和 MMLU 的進展……我現在認為到 2036 年的機率約為 20%;我的中位數現在約為 2050 年,儘管仍然帶有肥尾。」(
2024 年 1 月:2038。 我在我們的情景研討會調查中報告了 2038 年的中位數。我忘記了具體為什麼我更新為更短的時間線,可能是因為進展比預期快,例如 GPT-4,或許還有
2024 年年中:2035。 我忘記了為什麼更新,我想至少部分原因是花了很多時間在那些支持短時間線的人身邊。
2024 年 12 月:2032。 根據預測比我預期更短時間線的早期版本模型進行了更新。此外,RE-Bench 的分數也高於我的猜測。
2025 年 4 月:2031。 根據《AI 2027》時間線模型的兩個變體給出的 2027 年和 2028 年超人程式設計師 (SC) 中位數進行了更新。我的 SC 中位數是 2030 年,高於模型內的中位數,因為我認為模型可能存在困惑、框架不佳、遺漏因素等。我還給予了其他啟發式方法和替代模型一些權重,這些模型總體上指向更長的時間線。我將中位數從 SC 往後推了一年,以獲得 TED-AI/AGI 的中位數。
2025 年 7 月:2033。 根據對我們時間線模型的修正和 進行了更新。
2025 年 11 月:2035。 根據 的中間結果進行了更新。(
2026 年 1 月:2035 年 1 月 (~2035.0)。對於自動化程式設計師 (AC),我的綜合考量中位數比模型的輸出晚大約 1.5 年。對於 TED-AI,我的綜合考量中位數反而比模型的輸出早 1.5 年*,因為我認為模型的起飛速度太慢,原因在於它既沒有模擬硬體研發自動化,也沒有模擬廣泛的經濟自動化。請參閱我的預測。我推遲 AC 日期的理由在第一個「Eli 關於其綜合考量預測的筆記」展開欄中,而將起飛調整為更快的理由在第二個中。

  • 在這篇文章中,我們主要討論通往 AI 里程碑的時間線,但我們也認為,從 AGI 或全自動程式設計到遠超人類的 AI(例如 ASI)的「起飛」過程至少與預測時間線同樣重要,儘管它受到的關注要少得多。我們關注時間線是因為那是新聞文章關注的焦點。

  • 根據反饋,我們也認為除了這些文章的作者之外,其他人也難以理解我們的觀點和模型的輸出自《AI 2027》以來發生了哪些變化,這給了我們進一步的動力來撰寫這篇文章。