Claude 的週期：Claude Opus 4.6 解決了高德納提出的難題

Hacker News

大約 7 小時前

AI 生成摘要

最新的 Claude Opus 4.6 模型成功解決了由傳奇電腦科學家高德納（Donald Knuth）提出的複雜運算問題，展現了其卓越的進階推理能力。

www-cs-faculty.stanford.edu

claude cycles

背景

電腦科學泰斗高德納（Donald Knuth）近期發表了一篇令學界震驚的短文，透露他研究數週的一項數學猜想，竟被 Anthropic 推出的混合推理模型 Claude Opus 4.6 成功破解。這項發現不僅讓這位長期對生成式 AI 持保留態度的宗師感到驚訝，也引發了技術社群對於大型語言模型（LLM）在自動演繹與創造性問題解決能力的熱烈討論。

社群觀點

針對 Claude 解決高德納難題的現象，Hacker News 的討論首先聚焦於強化學習（RL）如何改變了問題解決的範式。有評論者指出，過去我們必須依賴人類認知來緩慢探索問題空間，但現在這些解題模式已被轉化為機率分佈，任何人只要掌握正確的「召喚咒語」（提示詞），就能引導模型進入特定的條件分佈，進而觸發正確的技術路徑。這種能力讓專家能更高效地強迫模型產出高品質的推理軌跡，將原本隱藏在數據中的解決方案具現化。

然而，這種進步也引發了關於模型知識更新與科學邊界擴張的疑慮。隨著專家利用 AI 推動科學進步的速度加快，模型該如何保持同步？討論中提到，目前的強化學習縮放定律高度依賴專家級的推理軌跡，如果未來科學突破的速度超越了模型重新訓練的週期，開發商可能必須在昂貴的持續訓練與擴展上下文窗口之間做出抉擇。部分留言者認為，未來的推理過程本身就是珍貴的訓練數據，研究人員在免費使用 AI 工具的同時，其產出的推理鏈條很可能被回饋至模型中，形成一種數據共享與自我進化的循環。

對於 LLM 是否具備真正的「思考」能力，社群內存在顯著的分歧。有觀點質疑，若 LLM 只是在預測下一個最可能的字詞，何以能解決未知的數學難題？對此，有支持者解釋，解決問題往往在於重新定義問題的陳述方式，或是像在迷宮中窮舉所有錯誤路徑後找到出口。這種過程雖然與人類的直覺思考不同，但確實展現了某種形式的「自動演繹」。儘管有少數聲音質疑該問題是否早已存在於訓練集中，但隨即遭到反駁，因為高德納本人已明確表示這是一個尚未解決的開放性問題，這證明了模型在處理新穎邏輯挑戰時的實力。

最後，討論也觸及了開源模型與閉源模型在時間維度上的差異。開源模型被形容為「時間膠囊」，其知識永遠停留在權重釋放的那一刻；而像 Claude 這樣的閉源模型，則能透過不斷吸收與專家的互動數據來維持領先。這種數據獲取的優勢，可能成為未來 AI 競爭的核心，但也引發了關於隱私與數據所有權的潛在爭議。整體而言，社群普遍認為這標誌著自動化推理的一個重要里程碑，預示著 AI 將從單純的資訊檢索工具轉變為真正的科研協作夥伴。

Claude's Cycles: Claude Opus 4.6 solves a problem posed by Don Knuth [pdf]

背景

社群觀點