最近的一些新聞文章討論了自《AI 2027》發布以來,我們對 AI 時間線預測的更新,最值得注意的是我們新的時間線與起飛模型:AI Futures Model (參見部落格公告文章 )。^([1] ) 雖然我們很高興看到關於 AI 時間線的更廣泛討論,但這些文章在報導中存在重大錯誤。請不要假設其內容準確代表了我們所寫或相信的觀點!本文旨在澄清我們過去和現在的看法。^([2] )
涉及的文章包括:
衛報 (The Guardian): 頂尖 AI 專家推遲其可能毀滅人類的時間線
獨立報 (The Independent): 專家在「末日時間線」中警告:AI「可能是人類建造的最後一項技術」
Inc: AI 專家曾預測 AI 將在 2027 年終結人類——現在他正在更改時間線
華盛頓郵報 (WaPo): 世界還有幾年的時間
每日鏡報 (Daily Mirror): AI 專家揭示距離人類可怕終局究竟還剩多久
我們的核心觀點
我們在 2025 年 4 月發布《AI 2027》時所相信、且至今仍然相信的重要觀點:
通用人工智慧 (AGI) 和人工超智慧 (ASI) 最終將被製造出來,且可能很快就會實現,因此我們應該為其近期出現做好準備。
我們對於 AGI 和 ASI 何時建成存在高度不確定性,我們絕對無法自信地預測具體的某一年。
在過去的 9 個月裡,我們的想法具體發生了哪些變化?以下是重點。請參閱 https://www.datawrapper.de/_/vAWlE/ 查看相同的表格,其中包含大多數預測的來源連結。
*以下是 Daniel 目前對 TED-AI 的綜合考量分佈:
如果您想查看包含更多指標以及我們模型原始輸出的更完整表格,我們在下方 製作了一個更大的表格。
我們還製作了這張 Daniel 和 Eli 的 AGI 中位數隨時間變化的圖表,追溯到更久以前:
關於此圖表背後的數據,請參見下方 。
糾正常見誤解
將報導我們工作的文章中的誤解/誤導歸類如下:
暗示我們曾確信 AI 里程碑(例如 SC、AGI 或 ASI)會在 2027 年發生(衛報、Inc、每日鏡報)。 我們已盡力明確表示,我們從未確信 AGI 會在 2027 年到來。例如,我們在《AI 2027》中多次強調了我們的不確定性,為了更加清晰,我們最近在《AI 2027》的前言中增加了一個段落來解釋這一點。
將我們舊的「眾數預測」與新模型的「中位數參數預測」進行比較(衛報、獨立報、華盛頓郵報、每日鏡報),並將我們舊的眾數預測與 Daniel 在推文中陳述的新中位數 SC/AGI 預測進行比較(華盛頓郵報)。 這是錯誤的,但由於我們沒有非常顯眼地報告我們的新眾數或舊中位數,因此這很棘手。透過這篇部落格文章,我們希望能讓這一點更加清晰。
暗示 aifuturesmodel.com 上預設顯示的預測代表 Daniel 的觀點,而該預測在文章發表前一直使用 Eli 的中位數參數(衛報、獨立報、華盛頓郵報、每日鏡報)。 在我們最初的網站上,左上角的說明中清楚地寫著預設顯示的里程碑是使用 Eli 的參數。儘管如此,我們已將預設更改為使用 Daniel 的參數以減少困惑。
過去時間線預測的詳細回顧
2025 年 4 月以來的預測
下面我們提供了 2025 年 4 月及近期時間線預測的全面回顧。我們在表格下方解釋了各行各列。請參閱 https://www.datawrapper.de/_/m4PVM/ 查看相同的表格,其中包含大多數預測的來源連結和更大的文字。
*第一行中的里程碑定義見腳註。
解釋第二行中的摘要統計數據:
眾數年份 (Modal year) 是指我們認為某個里程碑最有可能達到的年份。
中位數到達日期 (Median arrival date) 是指有 50% 的機率該里程碑已經實現的時間點。
中位數參數下的到達日期 (Arrival date with median parameters) 是指如果我們將所有參數設置為其中位數值時模型的輸出。有時這會導致與蒙地卡羅模擬的中位數有顯著差異。這不適用於「綜合考量」的預測。
解釋其餘各行中的預測來源:
綜合考量預測 (All-things-considered forecasts): 我們對世界上將發生什麼的預測,包括在時間線和起飛模型輸出之上的調整。
2025 年 4 月時間線模型輸出、基準與差距 以及 2025 年 4 月時間線模型輸出、時間跨度擴展 包含了我們隨《AI 2027》發布的時間線模型 兩個變體的輸出。
2025 年 12 月 AI Futures Model 輸出 包含了我們近期 AI 時間線與起飛模型 的輸出。
2018-2026 AGI 中位數預測
下面我們概述了 Daniel 和我 (Eli) 對 AGI 中位數到達日期預測的歷史,最早可追溯到 2018 年。這是我們擁有最多關於自身觀點的過去數據(包括許多公開聲明)的摘要統計指標。
Daniel
除非另有說明,否則對於上述圖表,我假設對特定年份的預測是該年中旬的中位數(例如,如果 Daniel 說 2030 年,我假設為 2030.5),因為我們沒有記錄該預測是指該年內的哪個時間點。
2013-2017:未知。 Daniel 大約在 2013 年開始思考 AGI 並關注 AI 領域。他認為 AGI 在他有生之年到來是一個合理的可能性,但我們找不到他當時做出定量預測的任何記錄。
2018:2070。 在 Metaculus 上,Daniel 對 2040 年實現人機智慧對等 給出了 30% 的機率,這可能意味著中位數在 2070 年左右?(請注意,這個問題的達成可能早於我們對 AGI 作為 TED-AI 的定義,但當時 Daniel 將其解釋為類似 TED-AI 的東西)
2020 年初:2050。 Daniel 將 2040 年實現 HLMI 的機率更新為 40%,這可能意味著中位數在 2050 年左右。
2020 年 11 月:2030。 「我目前認為有大約 50% 的機會在 2030 年前達到無法回頭的臨界點。」(來源 )
2021 年 8 月:2029。 「當我寫這個故事時,我的 AI 時間線中位數大約是 2029 年。」(來源 )
2022 年初:2029。 「當我在 2022 年初加入 OpenAI 時,我的時間線已經相當短了(中位數 2029 年),而事情的發展大多如我所料。」(來源 )
2022 年 12 月:2027。 Daniel 於 2022 年底加入 OpenAI,他的中位數降至 2027 年。「自從我寫了這個故事以來,我的整體時間線有所縮短……當我寫這個故事時,我的 AI 時間線中位數大約是 2029 年。」(來源 )
2023 年 11 月:2027。 2027 年作為「目前 99% 的全遠端工作可被自動化的中位數估計」。(來源 )
2024 年 1 月:2027。 這是我們開始撰寫《AI 2027》初稿的時候。
2024 年 2 月:2027。 「我預計在未來 3 年內的某個時候會需要這筆錢,因為那大約是我們達到 AGI 50% 概率的時候。」(來源 ,機率分佈 )
2025 年 1 月:2027。 「我對 AGI 的中位數年份仍然是 2027 年。」(來源 )
2025 年 2 月:2028。 「順便說一下,我的 AGI 時間線中位數現在是 2028 年,高於自 2022 年以來一直保持的 2027 年。這有很多原因,但主要原因是我被 Eli Lifland 和 Nikola Jurkovic 一直在開發的『基準+差距』論點所說服。(但我被說服的原因可能是我的直覺受到了預訓練放緩等事件的影響)」。(來源 )
2025 年 4 月:2028。 「從去年夏天項目開始到現在,Daniel 對智慧爆炸的中位數從 2027 年轉移到了 2028 年。」(來源 )
2025 年 8 月:2029 年底 (2030.0)。 「昨天與 @RyanPGreenblatt 就 AGI 時間線進行了很好的交談。我推薦並在方向上同意他在這裡的看法;我的底線數據略有不同(中位數約為 2029 年底),正如他在腳註中所描述的那樣。」(來源 )
2025 年 11 月:2030。 「是的!事情似乎比《AI 2027》的情景進展得慢一些。我們發布時的時間線比 2027 年要長,現在又更長了一點;我最近的說法是『2030 年左右,但有很大的不確定性』。」(來源 )
2026 年 1 月:2030 年 12 月 (2030.95)。 (來源 )
Eli
除非另有說明,否則對於上述圖表,我假設對特定年份的預測是該年中旬的中位數(例如,如果我說 2035 年,我假設為 2035.5),因為我們沒有記錄該預測是指該年內的哪個時間點。
2018-2020:未知。 我在 2018 年開始思考 AGI,但並未投入大量時間。2020 年我在 Metaculus 上預測弱通用 AI 的中位數為 2041 年,不確定我當時對 AGI 的看法,但可能更晚。
2021:2060。 「之前我的 TAI(轉型 AI)時間線與 Holden 在這裡 的看法大致相似:『在 15 年內(到 2036 年)看到轉型 AI 的機率超過 10%;在 40 年內(到 2060 年)看到的機率約為 50%;在本世紀內(到 2100 年)看到的機率約為 2/3』。」(來源 )。我當時通常應用一種啟發式方法,認為投入 AI 和 AI 安全的人會偏向/被篩選為支持短時間線。
2022 年 7 月:2050。 「我(和群眾)嚴重低估了 MATH 和 MMLU 的進展……我現在認為到 2036 年的機率約為 20%;我的中位數現在約為 2050 年,儘管仍然帶有肥尾。」(來源 )
2024 年 1 月:2038。 我在我們的情景研討會調查中報告了 2038 年的中位數。我忘記了具體為什麼我更新為更短的時間線,可能是因為進展比預期快,例如 GPT-4,或許還有進一步消化了 Ajeya 的更新 。
2024 年年中:2035。 我忘記了為什麼更新,我想至少部分原因是花了很多時間在那些支持短時間線的人身邊。
2024 年 12 月:2032。 根據預測比我預期更短時間線的早期版本模型進行了更新。此外,RE-Bench 的分數也高於我的猜測。
2025 年 4 月:2031。 根據《AI 2027》時間線模型的兩個變體給出的 2027 年和 2028 年超人程式設計師 (SC) 中位數進行了更新。我的 SC 中位數是 2030 年,高於模型內的中位數,因為我認為模型可能存在困惑、框架不佳、遺漏因素等。我還給予了其他啟發式方法和替代模型一些權重,這些模型總體上指向更長的時間線。我將中位數從 SC 往後推了一年,以獲得 TED-AI/AGI 的中位數。
2025 年 7 月:2033。 根據對我們時間線模型的修正和能力下降 (downlift) 進行了更新。
2025 年 11 月:2035。 根據 AI Futures Model 的中間結果進行了更新。(來源 )
2026 年 1 月:2035 年 1 月 (~2035.0) 。對於自動化程式設計師 (AC),我的綜合考量中位數比模型的輸出晚大約 1.5 年。對於 TED-AI,我的綜合考量中位數反而比模型的輸出早 1.5 年*,因為我認為模型的起飛速度太慢,原因在於它既沒有模擬硬體研發自動化,也沒有模擬廣泛的經濟自動化。請參閱我的預測這裡 。我推遲 AC 日期的理由在第一個「Eli 關於其綜合考量預測的筆記」展開欄中,而將起飛調整為更快的理由在第二個中。
在這篇文章中,我們主要討論通往 AI 里程碑的時間線,但我們也認為,從 AGI 或全自動程式設計到遠超人類的 AI(例如 ASI)的「起飛」過程至少與預測時間線同樣重要,儘管它受到的關注要少得多。我們關注時間線是因為那是新聞文章關注的焦點。↩︎
根據反饋,我們也認為除了這些文章的作者之外,其他人也難以理解我們的觀點和模型的輸出自《AI 2027》以來發生了哪些變化,這給了我們進一步的動力來撰寫這篇文章。↩︎