Jeremy Howard argues that LLMs excel at compositional creativity through interpolation but fail at true innovation outside their training distribution, making them less effective for advanced R&D and complex software engineering.
播客訪談:Jeremy Howard 對大語言模型持悲觀看法
Lesswrong
大約 5 小時前
AI 生成摘要
Jeremy Howard 認為大語言模型擅長透過內插法進行組合式創意,但在超出訓練分佈的真正創新上表現不佳,這使得它們在處理先進研發與複雜軟體工程時效果有限。
Jeremy Howard 最近^() 接受了 Machine Learning Street Talk 播客的採訪:、、。
Jeremy 在 ,並教授了優秀的 線上課程(這在我學習機器學習時非常有幫助)。他一直在使用 LLM,例如他 90% 的新程式碼是由 LLM 編寫的(見下文)。
例如,我昨天正和 聊到 。他們說:「噢,這是一個潔淨室(clean-room)開發的 C 編譯器。你可以看出它是潔淨室開發的,因為它是用 Rust 創建的。」Chris 創建了現今可能最廣泛使用的 C / C++ 編譯器 Clang,它建立在 LLVM 之上,而 LLVM 是最廣泛使用的編譯器基礎。他們覺得:「Chris 沒有使用 Rust。我們也沒有給它任何編譯器源代碼的訪問權限。所以這是一個潔淨室實現。」
但這誤解了 LLM 的運作方式。對吧?事實是:Chris 所有的工作都在訓練數據中,出現了無數次。LLVM 被廣泛使用,許多東西都建立在它之上,包括大量的 C 和 C++ 編譯器。將其轉換為 Rust 是訓練數據各部分之間的內插。這是一個風格遷移(style transfer)問題。所以這充其量只是組合創意,如果你還能稱之為創意的話。當你查看時,你就能看到這一點。它複製了部分 LLVM 代碼,而 Chris 今天會說:「噢,我犯了個錯誤。我不應該那樣做。沒人會那樣做。」噢,哇。看。Claude C 編譯器是唯一一個也那樣做的。這不是偶然發生的。這發生是因為你實際上並不是在發揮創意。你實際上只是在訓練數據中尋找 Rust 相關事物和構建編譯器相關事物之間的非線性平均點。……
問題在於,這些人最近都不是軟體工程師。我不確定 Dario 是否曾經擔任過軟體工程師。軟體工程是一門不尋常的學科,很多人誤以為它等同於在 IDE 中輸入代碼。編碼是另一種風格遷移問題。你獲取要解決的問題的規範,你可以利用你的組合創意找到訓練數據中經過內插後能解決該問題的部分,並將其與目標語言的語法進行內插,然後你就得到了代碼。
幾十年前 Fred Brooks 寫過一篇非常有名的文章《》(No Silver Bullet),聽起來簡直就像是在談論今天。他指出了一個非常相似的現象,在那個年代,大家都在說:「噢,看看這些新的第四代語言之類的東西,你知道,我們不再需要任何軟體工程師了,因為軟體現在這麼容易編寫,任何人都能寫。」他說,他猜測你最多能獲得 30% 的提升。他特別提到在未來十年內提升 30%,但我認為他不需要限制得那麼死。因為軟體工程中的絕大部分工作並不是輸入代碼。