釐清自AI 2027以來AI時間線預測的變化

Lesswrong

大約 1 個月前

AI 生成摘要

我們正在澄清近期媒體報導中對我們 AI 時間線預測的誤解，並強調雖然我們的模型有所更新，但我們始終保持高度不確定性，且從未斷言 2027 年就是確定的「毀滅」日期。本篇文章提供了我們過去與現在對 AGI 和 ASI 預測的詳細對比，以確保我們的觀點得到準確呈現。

最近的一些新聞文章討論了自《AI 2027》發布以來，我們對 AI 時間線預測的更新，最值得注意的是我們新的時間線與起飛模型：（參見）。^() 雖然我們很高興看到關於 AI 時間線的更廣泛討論，但這些文章在報導中存在重大錯誤。請不要假設其內容準確代表了我們所寫或相信的觀點！本文旨在澄清我們過去和現在的看法。^()

涉及的文章包括：

衛報 (The Guardian)：
獨立報 (The Independent)：
Inc：
華盛頓郵報 (WaPo)：
每日鏡報 (Daily Mirror)：

我們的核心觀點

我們在 2025 年 4 月發布《AI 2027》時所相信、且至今仍然相信的重要觀點：

通用人工智慧 (AGI) 和人工超智慧 (ASI) 最終將被製造出來，且可能很快就會實現，因此我們應該為其近期出現做好準備。
我們對於 AGI 和 ASI 何時建成存在高度不確定性，我們絕對無法自信地預測具體的某一年。

在過去的 9 個月裡，我們的想法具體發生了哪些變化？以下是重點。請參閱查看相同的表格，其中包含大多數預測的來源連結。

*以下是 Daniel 目前對 TED-AI 的綜合考量分佈：

如果您想查看包含更多指標以及我們模型原始輸出的更完整表格，我們在製作了一個更大的表格。

我們還製作了這張 Daniel 和 Eli 的 AGI 中位數隨時間變化的圖表，追溯到更久以前：

關於此圖表背後的數據，請參見。

糾正常見誤解

將報導我們工作的文章中的誤解/誤導歸類如下：

暗示我們曾確信 AI 里程碑（例如 SC、AGI 或 ASI）會在 2027 年發生（衛報、Inc、每日鏡報）。 我們已盡力明確表示，我們從未確信 AGI 會在 2027 年到來。例如，我們在《AI 2027》中多次強調了我們的不確定性，為了更加清晰，我們最近在《AI 2027》的前言中增加了一個段落來解釋這一點。

將我們舊的「眾數預測」與新模型的「中位數參數預測」進行比較（衛報、獨立報、華盛頓郵報、每日鏡報），並將我們舊的眾數預測與 Daniel 在推文中陳述的新中位數 SC/AGI 預測進行比較（華盛頓郵報）。這是錯誤的，但由於我們沒有非常顯眼地報告我們的新眾數或舊中位數，因此這很棘手。透過這篇部落格文章，我們希望能讓這一點更加清晰。

暗示上預設顯示的預測代表 Daniel 的觀點，而該預測在文章發表前一直使用 Eli 的中位數參數（衛報、獨立報、華盛頓郵報、每日鏡報）。 在我們最初的網站上，左上角的說明中清楚地寫著預設顯示的里程碑是使用 Eli 的參數。儘管如此，我們已將預設更改為使用 Daniel 的參數以減少困惑。

過去時間線預測的詳細回顧

2025 年 4 月以來的預測

下面我們提供了 2025 年 4 月及近期時間線預測的全面回顧。我們在表格下方解釋了各行各列。請參閱查看相同的表格，其中包含大多數預測的來源連結和更大的文字。

*第一行中的里程碑定義見腳註。

解釋第二行中的摘要統計數據：

眾數年份 (Modal year) 是指我們認為某個里程碑最有可能達到的年份。
中位數到達日期 (Median arrival date) 是指有 50% 的機率該里程碑已經實現的時間點。
中位數參數下的到達日期 (Arrival date with median parameters) 是指如果我們將所有參數設置為其中位數值時模型的輸出。有時這會導致與蒙地卡羅模擬的中位數有顯著差異。這不適用於「綜合考量」的預測。

解釋其餘各行中的預測來源：

綜合考量預測 (All-things-considered forecasts)：我們對世界上將發生什麼的預測，包括在時間線和起飛模型輸出之上的調整。
2025 年 4 月時間線模型輸出、基準與差距以及 2025 年 4 月時間線模型輸出、時間跨度擴展包含了我們隨《AI 2027》發布的兩個變體的輸出。
2025 年 12 月 AI Futures Model 輸出包含了我們的輸出。

2018-2026 AGI 中位數預測

下面我們概述了 Daniel 和我 (Eli) 對 AGI 中位數到達日期預測的歷史，最早可追溯到 2018 年。這是我們擁有最多關於自身觀點的過去數據（包括許多公開聲明）的摘要統計指標。

Daniel

除非另有說明，否則對於上述圖表，我假設對特定年份的預測是該年中旬的中位數（例如，如果 Daniel 說 2030 年，我假設為 2030.5），因為我們沒有記錄該預測是指該年內的哪個時間點。

2013-2017：未知。 Daniel 大約在 2013 年開始思考 AGI 並關注 AI 領域。他認為 AGI 在他有生之年到來是一個合理的可能性，但我們找不到他當時做出定量預測的任何記錄。
2018：2070。在 Metaculus 上，Daniel 對給出了 30% 的機率，這可能意味著中位數在 2070 年左右？（請注意，這個問題的達成可能早於我們對 AGI 作為 TED-AI 的定義，但當時 Daniel 將其解釋為類似 TED-AI 的東西）
2020 年初：2050。 Daniel 將 2040 年實現 HLMI 的機率更新為 40%，這可能意味著中位數在 2050 年左右。
2020 年 11 月：2030。「我目前認為有大約 50% 的機會在 2030 年前達到無法回頭的臨界點。」（）
2021 年 8 月：2029。「當我寫這個故事時，我的 AI 時間線中位數大約是 2029 年。」（）
2022 年初：2029。「當我在 2022 年初加入 OpenAI 時，我的時間線已經相當短了（中位數 2029 年），而事情的發展大多如我所料。」（）
2022 年 12 月：2027。 Daniel 於 2022 年底加入 OpenAI，他的中位數降至 2027 年。「自從我寫了這個故事以來，我的整體時間線有所縮短……當我寫這個故事時，我的 AI 時間線中位數大約是 2029 年。」（）
2023 年 11 月：2027。 2027 年作為「目前 99% 的全遠端工作可被自動化的中位數估計」。（）
2024 年 1 月：2027。這是我們開始撰寫《AI 2027》初稿的時候。
2024 年 2 月：2027。「我預計在未來 3 年內的某個時候會需要這筆錢，因為那大約是我們達到 AGI 50% 概率的時候。」（，）
2025 年 1 月：2027。「我對 AGI 的中位數年份仍然是 2027 年。」（）
2025 年 2 月：2028。「順便說一下，我的 AGI 時間線中位數現在是 2028 年，高於自 2022 年以來一直保持的 2027 年。這有很多原因，但主要原因是我被 Eli Lifland 和 Nikola Jurkovic 一直在開發的『基準+差距』論點所說服。（但我被說服的原因可能是我的直覺受到了預訓練放緩等事件的影響）」。（）
2025 年 4 月：2028。「從去年夏天項目開始到現在，Daniel 對智慧爆炸的中位數從 2027 年轉移到了 2028 年。」（）
2025 年 8 月：2029 年底 (2030.0)。「昨天與 @RyanPGreenblatt 就 AGI 時間線進行了很好的交談。我推薦並在方向上同意他在這裡的看法；我的底線數據略有不同（中位數約為 2029 年底），正如他在腳註中所描述的那樣。」（）
2025 年 11 月：2030。「是的！事情似乎比《AI 2027》的情景進展得慢一些。我們發布時的時間線比 2027 年要長，現在又更長了一點；我最近的說法是『2030 年左右，但有很大的不確定性』。」（）
2026 年 1 月：2030 年 12 月 (2030.95)。（）

Eli

除非另有說明，否則對於上述圖表，我假設對特定年份的預測是該年中旬的中位數（例如，如果我說 2035 年，我假設為 2035.5），因為我們沒有記錄該預測是指該年內的哪個時間點。

2018-2020：未知。我在 2018 年開始思考 AGI，但並未投入大量時間。2020 年我在 Metaculus 上預測弱通用 AI 的中位數為 2041 年，不確定我當時對 AGI 的看法，但可能更晚。
2021：2060。「之前我的 TAI（轉型 AI）時間線與 Holden 在的看法大致相似：『在 15 年內（到 2036 年）看到轉型 AI 的機率超過 10%；在 40 年內（到 2060 年）看到的機率約為 50%；在本世紀內（到 2100 年）看到的機率約為 2/3』。」（）。我當時通常應用一種啟發式方法，認為投入 AI 和 AI 安全的人會偏向/被篩選為支持短時間線。
2022 年 7 月：2050。「我（和群眾）嚴重低估了 MATH 和 MMLU 的進展……我現在認為到 2036 年的機率約為 20%；我的中位數現在約為 2050 年，儘管仍然帶有肥尾。」（）
2024 年 1 月：2038。我在我們的情景研討會調查中報告了 2038 年的中位數。我忘記了具體為什麼我更新為更短的時間線，可能是因為進展比預期快，例如 GPT-4，或許還有。
2024 年年中：2035。我忘記了為什麼更新，我想至少部分原因是花了很多時間在那些支持短時間線的人身邊。
2024 年 12 月：2032。根據預測比我預期更短時間線的早期版本模型進行了更新。此外，RE-Bench 的分數也高於我的猜測。
2025 年 4 月：2031。根據《AI 2027》時間線模型的兩個變體給出的 2027 年和 2028 年超人程式設計師 (SC) 中位數進行了更新。我的 SC 中位數是 2030 年，高於模型內的中位數，因為我認為模型可能存在困惑、框架不佳、遺漏因素等。我還給予了其他啟發式方法和替代模型一些權重，這些模型總體上指向更長的時間線。我將中位數從 SC 往後推了一年，以獲得 TED-AI/AGI 的中位數。
2025 年 7 月：2033。根據對我們時間線模型的修正和進行了更新。
2025 年 11 月：2035。根據的中間結果進行了更新。（）
2026 年 1 月：2035 年 1 月 (~2035.0)。對於自動化程式設計師 (AC)，我的綜合考量中位數比模型的輸出晚大約 1.5 年。對於 TED-AI，我的綜合考量中位數反而比模型的輸出早 1.5 年*，因為我認為模型的起飛速度太慢，原因在於它既沒有模擬硬體研發自動化，也沒有模擬廣泛的經濟自動化。請參閱我的預測。我推遲 AC 日期的理由在第一個「Eli 關於其綜合考量預測的筆記」展開欄中，而將起飛調整為更快的理由在第二個中。

在這篇文章中，我們主要討論通往 AI 里程碑的時間線，但我們也認為，從 AGI 或全自動程式設計到遠超人類的 AI（例如 ASI）的「起飛」過程至少與預測時間線同樣重要，儘管它受到的關注要少得多。我們關注時間線是因為那是新聞文章關注的焦點。
根據反饋，我們也認為除了這些文章的作者之外，其他人也難以理解我們的觀點和模型的輸出自《AI 2027》以來發生了哪些變化，這給了我們進一步的動力來撰寫這篇文章。

Clarifying Changes in AI Timeline Forecasts Since AI 2027