2025 年 11 月,當我在 Lighthaven 會議中心 舉辦的實驗性「2025 Inkhaven 寫作/部落格駐點計畫」擔任寫作教練時,Experimental History 的 Adam Mastroianni 採訪了我,探討我的靈感來源(這對 Inkhaven 的參與者很有意義,因為他們被要求每天寫超過 500 字)以及我如何發展我的作品。這可以看作是我與 Dwarkesh Patel 訪談 的後續。
主題包括:
近期的詩作如何從 LLM 協作與意外驚喜中誕生;孵化期與等待靈感「到位」;病態的好奇心與跨領域閱讀;我的維基百科學徒生涯;作為簡易科學與統計練習的自我實驗;解釋為何微小優勢會複合成巨大產出差異的「管道模型」;如費曼演算法和「否定後件」(modus tollens )反轉等思考工具;「部落格大腦」與將經驗與文章進行模式匹配;文章寫作的兩個方向(普遍 → 具體 vs 具體 → 普遍);以及我對維基(wiki)優於部落格的偏好,並將發布視為另一種編輯。
以下是我的訪談和觀眾問答的簡要編輯紀錄(經過濃縮、澄清並增加了參考資料)。
*,由 Gwern Branwen 於 2026-01-30 使用 Google Nano Banana Pro 修改,透過縮放、將色調從深褐色改為彩色,並將杯子換成馬克杯,用作頁面縮圖。
2025 年初,Lightcone 的工作人員(主要是 Inkhaven 的組織者 Ben Pace)向我提議,希望我能參與一場將於 2025 年 11 月在加州柏克萊 Lighthaven 會議中心舉行的、不同尋常的實驗性寫作訓練營/靜修會。這個想法是,這不是一個普通的寫作靜修會,而是專注於部落客*,為了消除拖延並訓練定期寫作的能力,參與者被要求每天寫 500 字,否則將被退學。
我覺得這是一個很酷的主意,值得一試,所以我承諾以寫作教練的身份參與,並讓他們宣傳我的加入。(這有助於 Inkhaven 的啟動。)
我協助篩選了幾位申請者,並做了一個簡短的開場演講;但我主要負責「辦公時間」(大約每隔一天花 1-2 小時與任何到場的人討論任何事情)以及隨處找人聊天;雖然我的回饋通常是負面的,但我認為整體進展順利。^([1] )(我打算參加計劃於 2026 年 4 月舉行的第二屆 Inkhaven,但參與程度不會那麼高;我發現這比我預期的更占用寫作時間,無意中印證了我對隊列與每日寫作時間如何相互作用的看法。)
在那一個月裡,有許多「特別嘉賓」,如 Scott Aaronson 或 Dwarkesh Patel 。Adam Mastroianni 在第一週左右到訪,並希望就寫作和獲取靈感的主題採訪包括我在內的幾位參與者。
以下是我在 2025 年 11 月 5 日下午辦公時間前,在約十幾位 Inkhaven 參與者面前與他進行的問答。音訊經過錄音,由商業服務轉錄,然後由我本人為 Gwern.net 進行編輯。
開場演講
……我想我只強調寫作的三個重點:
你應該不斷嘗試對自己進行預測,並問「為什麼 X 是 X ,而不是 Y ?」「我預測的是 Z ,但結果卻是 A ;這意味著什麼?」
你身邊到處都是有趣的事情,但前提是你必須思考它們,直到感到驚訝為止。
人們一直在說有趣的事情,這些都是部落格文章的良好起點。問題在於他們笑完後就立刻忘得一乾二淨。
下定決心永遠不要浪費一個幽默的句子、一個好問題或一段長篇大論,無論那是洗澡時的靈光一現、線上聊天還是面對面的交談。
對話中可能充滿了絕佳的寫作提示。例如,劉宇熙(Yuxi Liu) 對對話有著驚人的記憶力,並記錄了一些灣區的活動,你可以看到有多少地方可以延伸發揮(當然,並非所有好的評論都出自於我!):1 、2 、3 ;如果劉沒有把它寫下來,誰會記得那些呢?
三則法則 :如果你(或其他人)已經把同一件事解釋了 3 次,那就是時候把它寫下來了。
這顯然有趣到讓你不斷回頭審視,而且你現在已經有幾個草稿可以參考了。
如果你已經做了某件事 3 次,或者就同一個論點進行了 3 次長篇辯論,那麼可能是時候更仔細地思考它,將其自動化或寫成一篇完整的文章。我發現這對寫作很有用,因為如果某件事出現了 3 次,這表示它很重要且尚未被充分探討,而且從長遠來看,現在寫下來可能會為你節省時間。
(這是我關於記憶為何以間隔重複 方式運作的個人理論:現實世界的資訊似乎遵循某種長尾(或可能是混合)分佈,其中存在大量可以安全遺忘的瞬時事實,以及會以較大間隔重複出現的長期事實;因此,忽略密集 呈現但保留間隔 出現的事實(這些事實會在很長一段時間後再次出現)比單純按接觸總次數來加強記憶更有效率。)
遵循這三個原則,你肯定永遠不會缺乏寫作素材。
詩歌與孵化
Adam Mastroianni: 我一直在和一群作家討論部落格文章的靈感來源以及一般的部落格寫作過程,因為這裡(Inkhaven)的每個人都在寫部落格 ,都想讓自己的部落格和寫作變得更好。很多東西你可以透過閱讀優秀的作品來學習。你可以在頁面上看到,「哦,他們說了這件事。它有這樣的結構。」
但你看不見起源。那些都消失在時間的迷霧中了。我們可以聊聊你的靈感來自哪裡,以及你通常如何寫部落格。首先,我想問問你最近的文章,你是否記得它們是從哪裡來的,是如何產生的?
Gwern: 當然。最近的文章是我寫的兩首詩 [“Silver Bird Above San Francisco” 和 “Tilakkhana : The 3 Scars of Existence” ]。所以我可以告訴你我是怎麼寫出那些詩的。
A: 好。
G: 最近的一首是因為我一直是波蘭詩人 切斯瓦夫·米沃什(Czesław Miłosz) 的粉絲。他在其中一首詩 中有一段關於上帝與聖人對話的有趣小對白。我突然想到我可以為 LLM(大型語言模型) 和 AI 研究人員改編這段對話。於是我把它輸入到各種 LLM 中,配上詩歌提示詞,試圖得到一些有趣的東西,但完全失敗了。基本上出於挫折感,我只是要求它們就這個主題隨便寫一首詩。
然後 Kimi K2 寫出了這首有趣的詩,關於 AI 的擬人化,討論煤炭如何被燃燒,如何拆解了葉子或拆解了陽光,來為運行它的 GPU 提供動力。我被這個意象和隱喻震撼了。詩本身並不好,但那裡有一個很棒的種子。所以我繼續圍繞它創作。
然後我意識到,我之前已經扔掉了最初寫的那首關於上帝聖人對話的詩。但在研究 Kimi 的詩一段時間後,我意識到,等等,我可以寫一首三部分 的詩。這三個部分對應於 LLM 訓練和部署的階段,我在第一部分使用那段戲仿對話——只需稍加調整,然後填補中間部分,最後將「拆解」作為第三部分的核心。從那時起,我就一直與 LLM 合作來完成那一首。
那一首有點像是……我有個特定想做的事,但在過程中意外地從 LLM 那裡得到了一個輸出,這完全改變了軌跡,導致寫出了一首與我最初意圖完全不同的詩。
所以我對那個結果很滿意,它最終比我預想的更具佛教色彩和倫理意味,但也比我最初構想的要好得多。這就是一個典型的「美麗的意外」 例子。
在那之前的一首,“Silver Bird Above San Francisco”,是因為 2025 年 6 月我參加完這裡的會議 [Less Online 和 Manifest ] 飛回去的時候。那天下午我從 SFO(舊金山國際機場) 起飛,不知為何,起飛後的飛行路線在灣區上空繞了一個巨大的螺旋,在燦爛的陽光下不斷傾斜轉彎。我心想,如果我在地面上看著這一切,我會看到這隻巨大的銀鳥,正朝著永恆螺旋上升。我心想,我可以聽著手機裡的音樂睡著,看著人們玩平板電腦,這一切是多麼不可思議;我們中沒有人哪怕有一丁點擔心我們會像歷史上那麼多飛機一樣墜毀在地。
那是飛機技術、航空公司、FAA、飛行員和所有人的偉大勝利,我們讓航空旅行變得如此令人難以置信地無聊,以至於我們把它們變成了天空中擁擠的巴士,在那裡最值得思考的事情是:「天哪,他們托運一件行李竟然收我 35 美元」,或者「該死,我錯過了空姐發的蝴蝶酥零食。」
這簡直是個絕對的奇蹟。絕對的奇蹟。
G: 對於那一首,我只是想傳達這種情緒,這種我在離開 SFO 的那一刻感受到的對航空旅行的敬畏和奇蹟感。
所以我開始與 LLM 合作。其中一個模型在某個時刻建議使用 威廉·卡洛斯·威廉斯(William Carlos Williams) 的 《紅色手推車》(The Red Wheelbarrow) 這首詩。我當時想:「沒錯,就是它 。這就是這首詩的框架。」然後我只是不斷地與它們迭代,要求更多的建議並進行挑選。最終我得到了一首讓我滿意的詩。
這就是最近的兩首。
Adam: 這和你寫非詩歌類文章的過程相似嗎?
G: 我會說有點相似,通常我會有一段很長的孵化期 ,我只是在觀察某些事情,等待足夠的資訊累積到我可以使之結晶的程度。在某個時刻,它通常會突然到位,我會想:「沒錯,就是它!這 就是這裡的核心想法,這就是讓這件事變得有趣 的角度,這能把這堆混亂的筆記變成有趣的東西。」
我曾在 Dwarkesh Patel 的播客中簡短討論過擴展假設(scaling hypothesis) ,這件事在某些方面我早在 2011 年就開始了,比如閱讀 尤爾根·施密德胡伯(Jürgen Schmidhuber) 和 漢斯·莫拉維克(Hans Moravec) 。但直到 2020 年,這個論點才真正到位,即「或許所有的 AI 進步都只是算力」,而這些花哨演算法之下的一切,最終真的 只是算力,或者是算力賦予的試錯能力帶來的實際進步。當然,這具有重大意義。
在那之前,我經常看到它,我也一直看到暗示這一點的論文,或者顯示一旦保持其他條件不變,演算法的重要性就不如原始算力。有許多單獨的數據點讓我一直想:「嘿,那裡肯定有些什麼。」就像,這難道不有趣嗎?更多的算力似乎總是隱藏在這麼多突破背後,卻一直被排除在故事之外,人們會承認說:「哦,對,那實際上 是因為我有 100 個 GPU,我可以嘗試一堆想法,所以它才成功了。」?
但直到 2020 年 GPT-3 論文 問世並橫掃各項基準測試,我才終於——我終於有了可以讓一切到位的東西,我把它全部寫了下來,剩下的就是歷史了。
博學家
A: 這些故事讓我印象深刻的一點是,你處理的資訊是如此分散。你談到讀了很久的波蘭詩人,談到「我是否應該使用威廉·卡洛斯·威廉斯的東西?」。你同時也在閱讀關於 LLM 和 GPU 數量的論文。情況一直都是這樣嗎?這些東西是從哪裡來的,為什麼它們會聯繫在一起?
G: 我不知道它們是否必須聯繫在一起。我相信很多作家可以專注於特定的領域,但我一直有著病態的好奇心。甚至在小時候,我就是那種典型的書蟲,只想盡可能讀完圖書館裡的每一本書,我每週會借 15 本書,全部讀完,然後還回去再借下 15 本。
所以我不知道是否必須如此。這只是我的做法。對我來說,閱讀無數的東西是很自然的。如果我整天都在閱讀隨機有趣的論文,遲早我會知道各種奇怪的事情,而這些事情最終會聯繫在一起。所以你永遠不知道什麼東西會在跨領域建立聯繫時派上用場。
只是也許你可以寫……我相信你可以用很多其他方式寫作。有很多很多的專家。這只是我個人的運作方式。
A: 是的。我的意思是,有趣的是我今天交談過的人都在做某種形式的這種事。我不知道這是否只是因為我們被篩選成了這裡的這類作家。
G: 我想這是一個很大的因素。
A: 是的。
G: 我們絕對不是在篩選最優秀的專家。如果你只是一個純粹的 AI 專家,我不認為你有太多理由來到這裡,因為 Lighthaven 有多少 GPU?沒多少,對吧?
學徒生涯
A: 是的。我要問什麼來著?哦,對了。很多人都有這種特質。很多人都想讀完圖書館所有的書。這並不罕見。
罕見的是能把這些資訊在腦中孕育,轉化為部落格文章並發布到網路上。你為什麼開始這樣做?
G: 我認為很多人不記得他們讀過什麼。即使你閱讀廣泛,如果你記不住那些奇怪的小細節、那些分散的事物,那麼你就無法從閱讀中獲得太多。我一直對語言有很好的視覺記憶。我經常能背誦書中的內容,或者至少以後能查到。這是關鍵。事實上,我確實能記住很多讀過的東西,並能以此把碎片拼湊起來。
但也正如你所說,我、Scott Alexander 和許多其他部落客,最終都對寫作有一種興趣、衝動或著迷,這最終促使你堅持寫很長時間,直到獲得認可。
因此,笑話總是說「在短短 10 年的努力中獲得一夜成名」。
A: 是的。
G: 就像沒有人真的 在從未寫過東西的情況下開始寫部落格,然後瞬間獲得巨大成功。
通常在某個地方總會有某種學徒期。
我有過我的英文維基百科 階段,在那裡我寫了很長時間的維基百科,只是為了嘗試分享知識和資訊,並為人們提供各種主題的良好參考資料,比如《新世紀福音戰士》 之類的。
A: 是什麼讓你從維基百科寫作轉向建立自己的網站?
G: 這是因為我對維基百科的編輯環境越來越不滿。
那裡環境嚴苛,而且對我喜歡的事物進行限制 。我喜歡有題詞。我喜歡引用有趣的文本塊。而那裡的態度越來越敵視這些。
而且在維基百科上,沒有什麼是固定的。任何東西都是可以刪除的,即使你寫出了世界上最好的文章,5 年後也可能有人過來把它刪掉,字面意義上的刪除整篇文章。所以我很大程度上被擠出了維基百科。
但同時我也被吸引走了,因為我越來越想做自己的綜合、原創分析、研究和寫作,以及自我實驗 ,並提供文件和論文的副本。而所有這些在維基百科上都是不被接受的。你應該只是總結別人的寫作。你不應該做任何自己的分析或綜合。
這是推力和拉力的結合。我當時所做的寫作正被排擠,而我想做的寫作在那裡絕對是不被允許的。
自我實驗
A: 你提到了自我實驗,這非常獨特,而且我認為在部落格圈中令人驚訝的是,對於那些對科學、知識如何產生、如何正確操作如此感興趣的人來說,並沒有太多的原始數據被收集和呈現。
你為什麼要這麼做?
G: 我這麼做只是因為這看起來顯然是正確的,而且……是的。我的意思是,這看起來確實顯然是正確的。你有這些補給品,你有所有這些關於你認為補給品對你的睡眠 有什麼作用的說法,那就去測量它,對吧?科學是什麼,不就是把事情記錄下來嗎?
歸根結底,如果你不把它寫下來,那就不是科學。無論你做多少分析工作,如果沒有寫成報告,那它就從未發生過。所以從這個意義上說,科學很容易。你只需要把它寫下來。我就想:「好吧,為什麼我不能那樣做?我可以寫東西。我很擅長把事情寫下來。」
A: 等等,所以你是在日常生活中就在做這些事,而決定只是把它們寫下來?決定並不是……
G: 不,不,不。我以前不做隨機實驗 。我做實驗的部分原因就是為了有東西可以寫,因為另一面是,既然這件事這麼容易做,為什麼不去做然後把它寫下來呢?現在你就有東西可以寫了。
如果你沒有好的寫作靈感,那就對自己做個實驗,選一個沒人做過的獨特實驗很容易,砰,現在你有東西可以寫和分析了。
這也是一個極好的統計練習。為了做某個特定的自我實驗,我從學習統計學中獲得了巨大的價值。我會想:「哦,對於這一個,我將使用一些因素分析 。對於這一個,我將學習序數模型 。對於這一個,我將嘗試從貝氏推理中加入一個資訊先驗 ,我會在 JAGS 中使用它。」
這是一個美妙的、自我分配的作業來源,這比在課堂上重新分析一些虛假數據集或只做理論練習要有趣得多。我發現分析自己的數據很有動力。
現在你可能會問:為什麼沒有更多的人這樣做?當然,對很多人來說,原因是他們並不真正關心正確答案是什麼,這占了很大一部分,但很大一部分也只是因為他們沒有完成事情。
我發現很多人在進行到一半時會聯繫我,我會聽說:「我正在做一個 LSD 微劑量實驗 !」,然後我就再也沒聽到他們的下文了。
我會說至少有 5-6 個人說他們開始了一個自我盲測的 LSD 微劑量實驗,試圖證明我是錯的,然後我就再也沒聽到他們的消息了。
A: 他們劑量吃太大了。
G: 嗯,即使是 LSD,一天後藥效也會消失,對吧?
A: 是的。
G: 所以我認為寫作有一個問題:人們經常開始一些事情,然後不完成它們。這對愛好和個人項目來說都是如此。人們會開始它們,然後不完成它們,或者他們完成了,但沒有透過正確地寫出來來完成它們。
我一直在和那些完成過相當具有挑戰性、令人印象深刻的技術項目或 AI 項目的人交談,如果他們能把剛才在聊天中告訴我的內容 轉化為部落格文章,那將是一份有意義、有價值的貢獻,然而他們卻沒有。^([2] ) 所以沒有其他人知道這件事。這樣的情況有很多。
所以,我認為人們低估了完成事情有多難。就像有這麼多人在這個意義上是「掉鏈子」的。他們開始了事情,但他們沒有完成 事情。
寫作管道
A: 這對你來說不是問題嗎?
G: 我的意思是,在完成項目方面,這對我來說肯定也是個問題,但我也有很多項目,而且我有動力去完成它們,因為我不相信沒做完的東西是真的,而且我想有東西可以展示給別人看。而且,寫作對我來說比對其他人容易得多。所以我不知道那是怎麼回事。
我只知道我會完成事情,所以我的產出比許多比我聰明得多、比我有才華得多、比我有趣得多的人要大得多;然而沒有人會知道,或者只有他們的朋友會知道,或者只有他們的公司會知道,因為他們不完成事情並將其公之於眾。
這裡有一個有用的模型,我稱之為「管道模型」 ,這就是為什麼你會得到令人驚訝的對數正態分佈 產出,因為每件事都是一系列階段,你必須完成每個階段才能有一個最終產出,而只有最終產出才算數。最初的模型就像 Shockley1957 用於模擬科學論文的寫作——你必須有一個想法,你必須執行實驗,你必須分析結果,你必須把它寫下來,你必須把它發送到期刊,然後你必須經歷整個過程才能有一篇發表的論文。如果你在過程中的任何一步失敗了,在任何一步,你最後都一無所有。
所以如果你有一個科學家在每個階段完成的機率是 50%,而另一個科學家是 60%,這看起來差別不大,50% 對 60%。但當你看到最後時,就像,這個人職業生涯發表了 1 篇論文,而那個人發表了 10 篇;那個微小的差異在每個階段相乘,最後變成了巨大的差異。所以我覺得答案可能只是我在每個階段都有一點小優勢,所以這就是為什麼在一天結束時我有 10 篇部落格文章,而那個人只有一篇。
這在做項目中是普遍存在的。一個項目有多個階段。每個階段都必須完成。對其他人來說,除非項目完成,否則整個項目就不存在。
所以你看向四周,你會看到有些人有一大堆項目,而有些人一個也沒有。但另一個人有一大堆半途而廢的項目,他沒有完成。他們並沒有那麼大的不同,只是第一個人在完成事情的每一步都稍微更有責任感一點。所以他也有「墳墓」,但沒那麼大。
思考工具
A: 是的。這是一個很有用的分析,我想知道,你認為你進來時就有這種優勢嗎?這是你培養出來的東西嗎?因為很多人看到這一點,他們會想:「我想提高我的結案率。」你有過這樣的想法並採取了一些行動來提高你的結案率嗎?
G: 我覺得如果我把現在的自己和 2010 年剛開始寫部落格時相比,我不認為我當時有很多想法。
我想也許自我實驗在某種程度上是對此的反應。「好吧,我不知道有什麼有趣的東西可以寫。我想我會看看咖啡因對我睡眠的影響 。」因為這是一件無聊、顯而易見的事情,我可以按部就班地完成實驗,對吧?就像如果我不知道該做什麼,好吧,我可以做個自我實驗。在某些方面,那是獲得素材的一種支撐。
當然,現在我有無數個可行且有趣的想法,我還有整頁的免費點子 ——請拿走我的點子,採用它並給它一個好歸宿!
我覺得在某種程度上,我變得更擅長觀察事物和更努力思考預測。此外,還有一件事,一段時間後,每個想法都會自我滋養並建立在自身之上,你喜歡收集一整套有用的想法,並將其應用到所有事情上。我喜歡……吉安-卡洛·羅塔(Gian-Carlo Rota) 有一段很好的話 描述他如何做研究,他說:「每個人都有兩個應用於每個問題的心理工具,而一個偉大的數學家會有三個。」
然後他說,他也稱之為「費曼問題解決演算法」 ,那就是 理查·費曼(Richard Feynman) 在任何特定時間腦子裡都會帶著大約 10 個有趣的問題。每當他遇到一個新的結果、一個新的方法或一個新的工具時,他都會在心理上嘗試將其應用於每個懸而未決的問題,看看是否有幫助。每隔一段時間,他就會中一次。然後他會告訴別人,別人會說:「天哪,費曼,你是個天才。你是怎麼做到的?」答案是「我腦子裡有一大堆懸而未決的問題和有趣的觀察。每當我遇到一個新的定理之類的,我就在每個問題上試一下,看看是否有幫助。」
一段時間後,靈感就不再是問題了。
A: 你覺得你有類似的東西嗎,那兩三個你應用於每個新資訊或問題的工具?
G: 是的,絕對有。肯定有類似的東西。我想我得更努力思考它們具體是什麼,但你說得對,有一些東西我……我覺得我的論點往往是典型化的,我一直在重複使用同一個。
比如其中一個可能是「一個人的肯定前件(modus ponens)是另一個人的否定後件(modus tollens)」 。這絕對是我會反射性地應用到各處的一個。
A: 我假設觀眾中很多人都能理解,但你能為沒聽過的人解釋一下嗎?
G: 一個好的、簡單直觀的解釋……哦,這有點難,因為非形式邏輯其實挺簡單的。
通常人們會提出一個論點,結論是「A 、B 、C ,因此 X 、Y 、Z 」。然後我會說:「好吧,Z 顯然是錯誤的。因此,你最初的論點中某處有一個錯誤的前提。你的哪個前提是錯誤的?」「嗯,可能是 A 。」我會說:「謝謝你給了我一個關於 非-A 的有趣新證明。」
就像,「如果那是真的會很有趣。然而,那顯然不是真的,因此這也不是真的。」
那是我會反射性說的話,類似於批評科學寫作 ——如果有人報告了一個相關性結果,我會自動在腦子裡把它反過來。
假設有人說「吃巧克力與壓力較低相關」。我會在腦子裡把它反過來,說「壓力較低預測會吃巧克力」,然後看看我對此有什麼看法。那只是一種反應。每當有人給你一個相關性,反轉詞序,然後思考它。這是一種你可以做的有趣的反射性論證。
或者每當有人給你一個數字,你可以直接乘以或除以 10 ,然後看看這是否改變了什麼。如果這沒有改變任何事情,那麼那個數字就是無關緊要的。
A: 這非常有趣,我不想讓你為難,但你能想到有哪篇文章特別是透過應用這些工具產生的嗎?我的意思是,我想像如果你一直在使用它們,這已經融入了你寫的很多文章中,但我只是好奇。
G: 不,我現在想不出具體的,抱歉。
部落格大腦:「那可以寫成一篇」
A: 但你所描述的我覺得非常有趣。這讓我想起……我曾短暫使用過 Instagram ,發現它給了我「Instagram 大腦」。
我的意思是,我走在世界上會想:「我可以把什麼變成 Instagram 的照片?」然後我開始透過如何將世界轉化為 Instagram 貼文的鏡頭來看待世界。
現在我寫部落格,我覺得我有「部落格大腦」,我走在世界上,有些事情會跳出來,會有一些啟示,比如:「哦,這是一篇。那也是一篇。」這對你有共鳴嗎?你覺得你有這個嗎?
G: 絕對有。我在這裡一直在這麼做。我一直到處對人說:「對,那可以寫成一篇。對,那是一篇完全可讀的部落格文章。」你的朋友有一個專門辯論天空照片的 Discord 頻道?寫成文章!
A: 你覺得有什麼部分是你可以清晰表達出來的嗎?
因為對我來說,這有點像辨別小雞性別(chicken sexing) ,你說不出為什麼你知道這隻雞是雌是雄。大師只需要在你做錯時拍打你的手,隨著時間的推移,潛意識就會弄明白。
是那樣的嗎,還是說,我有一些明確的工具可以用來告訴你為什麼那個 Discord 貼文可以寫成文章?
G: 我想在 Discord 貼文的例子中,我知道它是一篇文章,因為我立刻想到了 XKCD 的《鑑賞家》(Connoisseur)漫畫 。這篇漫畫挑出了一個普遍現象:如果你在任何主題上花費大量時間,你都會對其產生異常強烈的看法,而局外人完全無法理解。所以她當時在談論為什麼積雨雲(cumulonimbus) 之類的客觀上是最好的 雲,因為它有最有趣的 3D 外觀。
我當時想:「對,這就像那篇 XKCD 漫畫。」就像,好,現在你有一篇文章了!你有一個沒人知道的奇怪小眾領域,它沒有完全對應的先例,以前沒人寫過,但你可以把它連結到某個更廣泛的普遍觀點,在這個例子中是關於發展審美偏好和鑑賞力。
單單那個頻道本身很有趣,有點意思,但如果你能把它變成一個普遍原則的具體實例,現在你就有一篇文章了。現在你有一篇貼文了。一篇好的文章通常會將普遍性具體化,或者從具體走向普遍,看哪個方向更合適。
所以在這個例子中,我們有一個普遍性,即「人們如何發展偏好」,我們有那個具體的「雲頻道」,這是一小群人發展出某種奇怪的專業知識和偏好的例子。
這裡的元原則是,我能夠將這個具體的、奇怪的事物與一個有趣的、抽象的、非顯而易見的普遍原則聯繫起來。這就是閱讀這篇文章會產生的洞察樂趣所在,即看到一個你以前可能不理解的事物的實例。
如果非要說我寫文章的一個一般原則,通常就是收集一個普遍原則的例子,這個原則你以前可能見過但不理解。但透過投入足夠的火力,我可以讓你理解它。
最好的例子可能是我那篇「商品化你的互補品」(Commoditize Your Complement) 的文章,這只是採用了 喬爾·斯波爾斯基(Joel Spolsky) 一篇關於科技經濟學的經典文章,人們讀的時候並不真正理解它,然後提供如此多 的例子,讓你不得不 理解它。一旦你做到了這一點,突然間你就會以完全不同的方式看世界 。這就像戴上眼鏡,突然間你理解了為什麼科技公司會做這些他們所做的事情——一旦我提供了足夠的例子,一旦我把它強行灌入你的腦袋。
如果我只是說:「聰明的公司會商品化他們的互補品,他們試圖讓互補產品免費,以便為他們自己的商品創造互補品之類的。」就像,「好吧,這只是經濟學胡言亂語。我不知道你在說什麼。我直覺上感受不到。」
但如果我給你無數個例子,從「酒店」到「Xbox」到「AI 軟體」到「Windows」到「Netscape」,那麼最終 在某個時刻,它肯定會滲入你的腦海:「哦,是的,現在 我知道他們在做什麼了。」他們正試圖摧毀那些可能對他們形成壟斷的競爭對手。他們不是朋友,他們是敵人!他們正試圖摧毀他們。
然後你開始看到了。「為什麼 Facebook 會發布那個 免費的東西?」嗯,因為他們正試圖摧毀那家 特定的科技公司。一旦你有了那種啟蒙體驗,現在你就理解了。
文章原型:普遍 ↔ 具體
A: 這感覺像是一種文章類型,比如:我要拿一個普遍原則,並向你展示這麼多例子,讓你理解那個原本抽象的普遍原則。
還有其他種類的文章嗎?你覺得你腦子裡有文章的原型嗎?
G: 嗯,在那個例子中,那是比較容易的一種,因為你已經有了普遍原則。難的是那些你試圖釘住例子和普遍原則的時候……所以你可能會累積很多例子,想著:「我知道這些不知為何 是有聯繫的,但我還不知道是怎麼聯繫的。」
「擴展假設」就是一個困難的例子,我可以感覺到所有這些分散的例子之間有某種聯繫,在這些圖像分類器和這些 RL 代理之間,在這一篇 n -grams 擴展論文和 Transformers 之間,它們似乎沒有任何聯繫,但經過足夠的時間,最終它會結晶,最終你會得到統一所有這些例子的普遍原則。在這個例子中,最終證明基本上就是算力擴展。
A: 一個方向是,我知道原則是什麼,現在我需要找到讓原則變得清晰易懂的例子。另一個方向是,我有一堆例子,我如何推導出普遍原則,我覺得這裡有些東西,但我正在從具體中尋找普遍。
G: 是的。所以,正如我之前所說,肯定有兩個方向可以走,對吧?
你可以從普遍走向具體,也可以從具體走向普遍。
是的,有時我會收集一堆例子,然後決定,好吧,是的,它們看起來似乎有某種聯繫,但,不,那裡沒有普遍性。
去年我寫了一篇「取消排序」(unsorting)的文章 ,因為我以為我看到了某種通用的概念,比如為了各種統計目的而「取消事物的排序」。我以為那裡有些東西,我收集了很長時間的例子,但後來我意識到:不,那裡什麼都沒有,這只是一個巧合。有一種模糊的相似之處,但實際上並沒有任何普遍原則。
然後我把它寫下來,讓自己滿意,不,那裡什麼都沒有——這是一篇很奇怪的文章。讀它的人會說:「那挺蠢的」,但無所謂。
A: 你覺得你是為自己寫還是為觀眾寫?
G: 我為自己寫。從頭到尾,幾乎都是為了我自己。
偶爾我會試圖說服別人,但那是例外而不是常態。我的大部分東西都是自我放縱的。我寫香水評論 是因為我喜歡香水評論。我寫那些詩 是因為那些是我喜歡讀的詩,而我想寫它們。如果沒有其他人喜歡或閱讀它們,那對我來說無關緊要,因為我認為它們很好。
我的確寫了「擴展假設」來試圖觸及所有的 EA 和 AI 安全領域的人,所以那確實有一個目標受眾,只是為了喚醒大家。但同樣,那是例外。
A: 我想問的最後一件事是,你的產量非常驚人。
所以我認為人們可能會……我對你日常生活的想像就是你的手指一直放在鍵盤上,不斷產出文章,其餘時間則是資訊輸入。
但如果我們在一個隨機的週二找到你,你都在做什麼?
G: 我會說我 99% 的時間都在閱讀,可能只有 1% 的時間在寫作。
A: 有趣。
G: 是的。這是一個極端的比例。我每天會花 10 個小時閱讀論文、讀書、讀評論、讀貼文,讀一切。
然後在平均的一天裡,我也許會在剩下的 30 分鐘裡寫點東西。
很多天我什麼都不寫。
聲音:作為耳蟲的想法
A: 當到了寫作的時候,想法在多大程度上是在頁面上發展出來的,還是說當你開始寫時它已經發展成熟了?
G: 對於我的大部分作品,我不是在對現有的文章進行小幅編輯,就是在給文章添加一個新連結,所以它根本沒有在發展。它在變大,但沒有在發展。對於新的東西,它幾乎總是在我腦子裡就已經相當完整了。
事實上,我在我的一個頁面上寫了一小段話 ,關於對我來說,寫作通常是轉錄一個已經重複了一段時間的聲音。字面意義上聽見有人在朗誦這篇文章,或者至少是文章的大部分,或者關鍵段落之類的。就像耳蟲,就像音樂耳蟲 ,我會聽到這篇文章連續幾天自我重複,直到最終我會想:「好吧,行吧 ,我要把它寫下來。」只有一旦被寫下來,它才會消失。
A: 我的體驗非常相似,每個想法都感覺像是一種惡魔附身,它需要某種咒語才能結束附身。而那個咒語就是那篇正確的部落格文章。
G: 是的。肯定有一種感覺,它是一個揮之不去的待辦事項,除非你妥善處理了它,否則你無法忘記它 ,而妥善處理它,就是以適當的方式把它寫出來。
我喜歡引用印第安納·瓊斯(Indiana Jones) 的父親 在電影 裡說的話:「我把它寫下來是為了能忘記它。」我就是那樣的:我寫下事情是為了忘記它們。
觀眾問答
模態與比較優勢
A: 是的。你願意接受提問嗎?
G: 是的,絕對願意。是的。我現在沒什麼特別的地方要去,所以我可以接受提問。我的嗓子還撐得住。
觀眾 #1: 我喜歡你早些時候說的關於我們這少數在網上做實證工作的人。你對此提出了很多很棒的問題。
但你也指出我們大多數人都遵循,你叫它什麼來著,「一種形式」?
A: 是的,「一種模態」。
#1: 一種模態。有什麼原因讓你覺得你如此專注於自我實驗,而不做其他模態的實證工作嗎?
G: 我認為對於其他模態,實證工作需要花費大量的精力。
我做了相當多的調查,因為我可以透過已停用的 Google Surveys 或透過 Prolific 來做,那很容易。我喜歡它。但其他種類的模態將是巨大的時間投入,比如做濕實驗室工作,那需要數年的工作和設備,我怎麼在家裡做那個 ?
而且我有那麼多其他想寫的東西。我不缺其他想讀、想寫或想做的事情。我並沒有被束縛在一個特定的主題上,以至於我遇到死胡同,必須做某種特定要求的繁重工作。
所以,我對做各種實證工作的人懷有極大的敬意,因為我永遠無法坐下來花 5 年時間在印度做田野調查,採訪村民,只為了寫一篇論文的一部分。我對現實世界中所有做實證數據收集的人懷有極大的敬意,這也是為什麼我對自我實驗感到奇怪的部分原因,因為這就像是獲得所有這些數據和研究的作弊碼,我就覺得,不應該讓這件事變得這麼 容易,對吧?不應該讓獲得有趣的結果變得這麼容易。我覺得和那些為了更深奧、更小的數據集而付出這麼多努力的人相比,我是在作弊。所以只是除了自我實驗之外,通常它需要太多的工作和數據,會擠掉很多我更想做的事情。
如果是像我的廣告 A/B 測試 那樣,我可以讓它們在後台運行一兩年並獲得數百萬數據,那是另一回事。但除此之外,我不想花時間去做更複雜、更投入的事情,因為我可以寫詩,我可以寫短篇小說 ,我可以提出新的貓心理學理論 ,或者我可以直接看動漫 。有這麼多我可以做的事情,而我並沒有被迫去做那種特定的實證工作。
對那些這樣做的人表示極大的敬意。如果其他人不做這些,我讀什麼呢?我讀什麼?
但我自己在那方面並沒有比較優勢 。我想這是最簡單的答案,就是比較優勢。就像我擅長自我實驗,而且對我來說成本很低,所以我就做了。而其他人出於某種原因不做,所以根據顯示性偏好(revealed preferences) ,這對他們來說一定是成本很高的。
發布門檻
觀眾 #2: 你如何決定在你的眾多想法中,哪一個要進行開發、完善並發布?
G: 我很懶,所以基本上是看哪一個最讓我煩心。哪一個聲音最讓我煩心,我就會覺得:「好吧,是的,我要寫這一個。」這是隨機且臨時的。
我絕對不聲稱自己在這方面是一個好的榜樣。我只希望從長遠來看,你對我的作品感到滿意。如果不滿意,去你的,我本來就不是為你寫的。
觀眾 #4: 你提到對於想法,是看當時什麼最煩人。做編輯時也是類似的過程嗎,還是那是另一種過程?
G: 編輯確實更像是一個臨時的過程,偶爾腦子裡會突然冒出一些東西,我會想:「哦,我可以把這個加到那篇文章裡」,然後我就會去加。或者我讀到一些東西,會說:「啊,是的,這對這篇文章來說會是一個有趣的補充。」
那都是隨機進行的。每天我都會在各篇文章中添加幾個連結之類的。有時我讀到一些東西會覺得:「哦,那措辭太差了。」然後我就會當場修改。
我的網站設置方式讓我經常發現自己在滾動瀏覽舊文章或註釋,我會搜索一些東西,然後注意到一些東西,接著就當場編輯。但那只是一個非常普通、磨人、乏味的日常工作——這裡加幾個字,那裡加幾個字,但最終往往會累積成相當可觀的內容。
但那個過程沒什麼特別或有趣的。你只是必須在想到它的時候就去做,否則你會忘記。
把它與那種「大爆炸式」的寫作相比,我在一小時的寫作環節中傾倒出一整篇文章——那是完全不同的過程。這只是普通的、日常的、磨人的維護,以及傾倒進新的東西。磨人,磨人,磨人,維護,傾倒進新東西。
那很無聊且沒意思,但你必須做,因為這對於品質控制、確保拼寫正確、連結沒有失效,以及讓它與新研究保持同步至關重要。
維基 vs 部落格
觀眾 #3: 我注意到當你的想法產出時,它們顯得特別成熟和完整,在我這個讀者看來,所有的思考、對沖、腳註和一切都擺在那裡——研究全面且成型,我把它與另一種部落格模式相比,後者只是像,這裡有一個關於這件事發展的半成型的通訊式更新。
我很好奇,你什麼時候設定「好到可以發布」的門檻?因為看起來——
G: 我通常一有東西就會推送到我的網站上。我通常沒有那些與網站分開、在某個單獨文件夾裡擱置的草稿。
只是所有東西都以草稿的形式存在於網站上。這甚至不是一個會出現的問題,即哪一個……這也是我建立自己網站的原因之一,我不想要那種受限的部落格二元論,即某樣東西要麼發布了,要麼沒發布。
我只是覺得這對我自己的寫作來說是不可接受的,因為通常我不確定某件事是完成了還是沒完成,或者只是完成了一半。我還在等待結晶的發生。我還在尋找這組連結的普遍原則是什麼。
所以對我來說,部落格這種範式根本不適合我的寫作。
#3: 我主要看到的是那些你花了很多年編輯和更新的作品。
G: 我確實經常回頭微調,有時我會突然傾倒進一個全新的章節,因為它突然結晶了,那個聲音完成了它。但通常我甚至不知道某件事是否完成了,直到 10 年後我會想:「好吧,我很久沒有對這篇進行有意義的編輯了。我想它完成了。」
我只是覺得「已發布、未發布」這種離散性對我正在做的事情沒有幫助。
我覺得這在 Scott Alexander 的部落格中也有體現,他經常只是對他反覆提到過的事情給出一個小更新,除非你讀過之前所有的篇章,否則這對你來說沒什麼意義,因為它還沒完 。他只是必須 點擊「發布」,因為那是 Substack 或 WordPress 唯一讓他能做的事。
他們只是在建立這種硬編碼的假設,即事情是以離散單元完成的,這對報紙來說是真的,對吧?報紙今天發布一些東西,那就是今天的報紙,你別無選擇只能那樣做。
但在其他種類的寫作中,那不是真的。不一定有某個點是事情完成了。它們更像是維基,只是很多很多微小的編輯,有時它會完成,也許有時你回頭看會說:「好吧,我想它完成了。」
我不認為事情是發布或未發布、完成或未完成,因為那只是強加的凍結類別,除非我掉進部落格的心智陷阱,認為「哦,我必須每天推出一個離散的完成單元」,否則這些類別不必應用於我的寫作。你不必那樣做。
A: 有些人必須。
G: 不,你是自由的——
觀眾 #7: 我們必須。
G: ——隨時可以離開 Inkhaven!
#7: 是真的,但那是相當——
G: [咧嘴笑] 讀讀你的協議。
你們隨時可以自由離開,別讓任何人告訴你不行!
#7: 是真的,我們需要徹底的自由。
#1: 不,但你關於「完成」的說法是對的。這也是為什麼這一個月是一個很好的練習,因為你完全正確,大多數人在完成事情上有困難。我們完成 500 字的東西。
G: 是的,但是,好吧,說認真的,這裡的約束對於打破你的完美主義和「某件事必須完成並發布」的信念也是有好處的,因為你被迫每天吐出 500 字。
對於你們中的一些人,我覺得這有助於說服你們「發布」並不重要。
#1: 哦。
G: 把它本質上當作一個隨機的要求,你被學校和出版的聲望 給迷惑了,以為「哦,是的,發布是一件大事。哦,我剛發布了我的部落格。」
「哦,我應該參加你在紐約市的發布會嗎?會有小酒杯裝的小開胃菜嗎?」
#3: 我覺得這裡有一個「完成 vs 不完成」和「分享 vs 不分享」的事情。你是支持分享的,而完成對你來說並不超級重要,除非那是對某件事的研究。
G: 是的,我支持分享。我覺得每個人都應該有一個維基,並隨寫隨推。
對大多數人來說,寫部落格並不是一個很好的範式。除非你寫的是有時效性的東西,比如新聞、每日日誌、現場反應、預測——否則「部落格」格式是一個尷尬的約束。它固化了一種離散性和可變現的規律性,而很多長期思考並不適合這種形式。
這就是我對此的感覺,為什麼我以「部落格作者」的身份來到這裡,但我並不寫「部落格」。它不是「按時間倒序排列、定期更新」的短小內容。它更像是一個維基或一個個人主頁。
#3: 關於這個我有最後一個問題。如果你回想某一天,你必須決定是否在分享之外推廣你的作品,那是什麽樣的?你會想:「哦,這已經準備好發送給人們,或在論壇上分享了」,之類的?
G: 是的,通常是因為我想和某個特定的人分享。通常我會針對一個提案、一個想法或一份報告有一個特定的人選,然後我會說:「好吧,做最後的衝刺來完善並完成它。讓我們獲得更多回饋。」然後我會說,好,那是我想把它提交到 Hacker News 之類地方的時候。
我不認為那是「完成」,那只是下一步。我會在 Hacker News 上獲得更多評論,然後我會查看它們,也許我會修復那樣的東西。但重點是我現在有東西可以發給某人,並且那會達成我預期的目的。所以我就是這麼想的。
就像即使某樣東西發布了,它也不是發布了 ,那只是下一個階段。就像開源軟體:當然,你有版本控制,但那不是什麼大事,對吧?今天你發布另一個版本,獲得一些錯誤報告,添加更多補丁,最終你會再發布另一個版本,獲得錯誤報告,再修補一些,再發布另一個版本……並沒有一個「大爆炸」時刻是它發布了,從此永遠不能再動了。
A: Gwern,非常感謝你的交談。謝謝大家來到這裡。
G: 好的。我想我需要吃點零食了!
LLM 後續問題
隨附的是我做的一個訪談。請閱讀並總結它,然後提出有趣且資訊豐富的後續問題。目標是總共至少 20 個問題。對於每個問題,想像 3 個我(Gwern Branwen)可能會給出的答案,以及你的後續問題會是什麼;根據它們的有趣程度或資訊豐富程度對其進行評分,並以此挑選出前 5 個問題。
Gemini-3-pro-preview: 你引用了「商品化你的互補品」 作為透過暴力破解例子來教授普遍原則的例子。
如果我們將該模型應用於 Gwern.net 本身:你的內容是商品(免費、開放)。你試圖商品化(或摧毀)的互補品 是什麼,而你試圖建立的壟斷又是什麼?
G: 好問題——泰勒·柯文(Tyler Cowen) 會贊同這個問題。
我的基礎設施工作專注於全文、引文驗證、獲取原始數據、可重複的代碼、複雜材料(如詩歌)的正確渲染、存檔和連結失效、正確性和品質控制、速度以及迎合權力使用者。簡單來說,我試圖閱讀,並讓其他人閱讀已經被記錄下來的東西。
所以,我想我試圖商品化的是資訊 ,而我的互補品是分析 ——或者更準確地說,「綜合」或「意義建構」。在資訊豐富的地方,注意力和理解力必然變得稀缺。「洞察色情」(insight porn) 標籤並不像看起來那麼像個玩笑。
從長遠來看,我也許更像是一個由 LLM 體現的觀點。
Claude-4.5-opus: 你強烈提倡維基,但承認部落格占主導地位。是什麼阻礙了維基變得比部落格更普遍?
G: 大多數人不進行那種需要維基的思考。他們不需要「思考工具」 。他們想站在事物的頂端,而不是底端(借用 高德納(Donald Knuth) 的話)。
維基在追蹤更新方面也有一個討厭的問題。從來沒有人發明過一種好的「閱讀維基更新」的方法。原始編輯列表是沒希望的——去瀏覽一下英文維基百科的 Special:Recent Changes 就知道了!我想我們需要某種摘要層級結構 。
關於本次訪談的詳盡參考書目可以在 Gwern.net 上的本次訪談規範頁面 中找到。
^(^ ) 在兩次對 Inkhaven 參與者的調查中,我都獲選為最佳教練;一些參與者對我有正面評價(例如 1 、2 /3 、4 ),儘管有些人形容我的回饋非常嚴厲 ,有時甚至到了幫倒忙的程度 。
^(^ ) 我創建的一個旨在幫助解決此問題的工具是 seriate.py :一個用於獲取筆記轉儲,並在任何編輯或重寫之前 按邏輯流重新排序的工具。在我看來,開始工作 最令人反感的部分是當你有一堆混亂的筆記時;而現在,其餘的大部分工作都可以外包給 LLM。