newsence
來源篩選

Finding Cruxes: Let Reality Challenge Your Thinking

Lesswrong

The core of rationality is finding 'cruxes'—specific pieces of information that would actually change your decisions—and allowing reality to challenge your thinking as quickly as possible.

newsence

尋找關鍵點:讓現實來給你一記當頭棒喝

Lesswrong
23 天前

AI 生成摘要

理性思維的核心在於尋找「關鍵點」,也就是那些能真正改變你決策的具體資訊,並讓現實盡快挑戰你的想法。

找出「到底什麼會真正讓你改變主意?」是理性技能中較為重要的一項。

能夠改變主意本身就是一個巨大的工程。但是,能夠快速做到這一點,比單純能做到要有用得多。因為這樣你就能將「什麼會改變我的想法?」這個問題,嵌入到其他更複雜的規劃或思考中。

我發現,當我具體思考什麼會改變我關於決策的看法時,這種技能更容易「真正」學會。當然,我可以改變對抽象哲學、物理或政治的信念……但其中大部分並不會真正影響我的行為。如果我錯了,現實也沒有辦法對我產生「反作用力」。

相比之下,我每天都要做很多決定。其中一些決定的成本很高——需要一小時或更多的精力。如果我要花一小時在某件事上,通常值得花一兩分鐘問問:「這是利用這一小時的最佳方式嗎?」我通常至少有一次機會練習尋找顯著的關鍵點(cruxes)。

前情提要:「流暢且具關鍵性的預測」與「雙重關鍵點(Double Crux)」

雖然這篇文章可以獨立閱讀,但它是作為的後續篇章。在該文中,我主張不僅要「能夠」而且要「流暢」地做到以下幾點:

  • 找出什麼會真正改變你的決定(「尋找關鍵點」)
  • 將其操作化為可觀察的賭注
  • 在 Fatebook 上對其進行預測,這樣無論你如何決定,隨著時間推移,你對自己決策的校準能力都會提高。

其中的每一步都需要克服一些阻力。

但大部分的短期價值來自於第 1 點,以及第 2 點的模糊提示。將第 2 點轉化為可以在 Fatebook 上評分的東西,其額外付出的努力只有在長期才會得到回報。

因此,我更新了觀點:你或許應該專注於「尋找關鍵點」,並將其初步操作化到足以輔助當下思考的程度即可,而不必過於擔心如何將 Fatebook 融入生活。^()

尋找關鍵點(Finding Cruxes)

遺憾的是,我還沒有一套統一的尋找關鍵點理論——對於任何給定的決策集,我比較它們的方式在某種程度上是因情況而異的。但這其中確實有一種竅門。

尋找關鍵點並不是要找一個「紙面上看起來很體面的原則性理由」。尋找關鍵點是為了找到某些你可以學習到的資訊,而這些資訊會真正改變你的決策

當你有更多時間去思考和表達時,它應該是合乎邏輯的。但很多時候,你沒有太多時間去搞清楚——你擁有大量的隱性資訊、直覺和背景信念。如果每次做決定都要把這一切都變得清晰可見,那就太笨重了。你需要學會理解你的直覺。

根據我的經驗,尋找關鍵點涉及兩大類技能:

  • 變得更擅長向自己提問。
  • 了解某件事具有「關鍵性」時是什麼感覺。

讓現實往你臉上揍一拳

如果你在尋找「什麼會改變我的決策」,你能得到的最清晰信號之一,就是想像一個讓你發出「喔,該死」感嘆的可能結果,那種感覺就像腹部挨了一拳。某些會讓你覺得「哇,我真的應該做點不一樣的事」的東西。

新創公司 vs 非營利組織

我從同事 Jacob 那裡學到了「現實往你臉上揍一拳」的概念。他最近加入了 Lightcone,但之前他創辦了一家向其他國家銷售新冠研究以協助制定政策的公司。

在 Lightcone,我們試圖用長期且令人困惑的方法來解決長期且令人困惑的問題,目前還不清楚是否有成效,也不清楚我們的反饋迴路應該是什麼。

在 Jacob 的新冠研究公司,他每天醒來都會感到被現實揍了一拳。他會發現承包商沒有按時完成任務,或者他試圖銷售的機構突然退出。如果他不能在快速變化的市場中夠快地開發出好產品,他的公司就會倒閉。計劃有著明確的利害關係。

他的故事讓我心生敬畏。我驚訝於自己竟然如此不確定 Lightcone 所做的事情是否有用。開發 LessWrong 的新功能有幫助嗎?招募更多 AI 安全研究人員有幫助嗎?在 Lighthaven 舉辦具有特定氛圍的定製活動有幫助嗎?

我不知道,老兄。我真的沒概念。我曾幻想自己花了好幾年時間研究各種看起來可能有幫助的項目,然後有一天醒來發現 AI 已經把我殺了,而我所做的一切都毫無意義——不,我根本不會醒來。

世界上大多數重要的項目似乎都是這樣的。而「給自己建立一些明顯的反饋迴路」這種天真的解決方案也是一個陷阱。像「招募更多 AI 安全研究人員」這種顯而易見的事情,在我看來,確實已經被證明

這給了我一個目標:弄清楚在從事長期、令人困惑的項目時,如何讓現實儘早往你臉上揍一拳。

人生哲學

另一個例子:大約 10 年前,我曾與 爭論同理心的重要性。我提出了幾個關於同理心為何重要的論點:「我認為這不僅僅是更友善,它還會讓你更有生產力,你會更了解你的員工,他們會感到被傾聽,等等。」

Habryka 說:「所以,你預測如果伊隆·馬斯克(Elon Musk)投入精力變得更有同理心,他的工作表現會變得更好?」我突然感到眼前出現了一個巨大的深淵,心想「喔,糟了,我那套關於同理心是好事的美好抽象世界觀突然變得可證偽了。」我不知道答案,但我可以想像我對伊隆目前同理心程度的估計(並不高),然後想像他投入精力去改變這一點。接著想像他第二天去上班時會發生什麼。

(那是多數人對伊隆的第一印象還是「雄心勃勃、患有自閉症的工作狂,讓火箭飛上天」的年代。)

我可能仍然認為學習同理心對他來說有超過 50% 的機率是淨正向的,但我不會給出 9 比 1 的勝率。而且我不會重倉押注這會比他可以發展的大多數其他替代技能更有效利用他的名聲。

玩具問題(Toy Problems)

「直擊靈魂的關鍵點」在小型玩具範例中也能發揮作用:

當我去練習思考某些現實領域的問題時,我可能會花很長時間思考各種感覺很聰明的策略,卻永遠得不到關於什麼有幫助的明確確認。但如果我是在謎題中制定計劃,並試圖在第一次嘗試時就得到正確答案,現實會給我一個明確的答案,告訴我我的策略是否有幫助。我前幾次做這類練習時,花了大量時間進行各種感覺很聰明的思考,結果得到了殘酷的答案:「實際上,那些都不重要。」

後來,我學會了在這種練習中詢問:「這個策略真的會有回報嗎?」,有時會意識到「喔,這根本不可能成功,因為謎題中有一個約束條件,我目前的計劃完全沒有考慮到。」

尋找關鍵點的技能,就是為那些更模糊、時間跨度更長的計劃找到對應的東西。

步驟說明

第一步:尋找替代方案

你首先需要對你原本打算做的事情有一些實際的替代計劃。這又是另一個複雜的技能和博文主題。

但現在的一個提示是:

「假設你回頭看,發現你目前的決定肯定行不通。你會改做什麼?」替代方案不一定要合情合理或有正當理由,只要是你真的會去做的真實事實即可。

(我試著準備至少 3 個替代計劃,其中一個要與其他的截然不同,這樣我就不會被鎖定在最初的框架中。如果我目前正鑽研工作中的某個特定項目,兩個替代計劃可能是「使用其他策略來完成該項目」和「轉向其他項目,或者去和老闆談談我到底該做什麼,或者休息一下」。)

第二步:問自己一些隨機的問題。

好,你如何讓自己儘快被現實打臉?

我還沒有一種優雅的方法來搜尋這類關鍵點,它們非常依賴於情境。

我目前的解決方案是問自己一些隨機的問題,並感受哪些問題讓你覺得很有料/有啟發性,或者哪些讓你感到害怕去思考。我還沒有「嘗試一堆問題,並培養出對當下哪些問題相關的感覺」的捷徑。

一些「直擊靈魂」的問題範例包括:

  • 如果我確切知道沒人會用我正在開發的這個項目,我還會做嗎?
  • 如果我知道這件事的成本會比我模糊想像的高出 10 倍,它還值得嗎?那 100 倍呢?
  • 我目前的計劃可能獲得的最大回報是什麼?

一些「有料/有啟發性」的問題類型通常是:

  • 為了讓這個替代計劃真正優於我目前的計劃,必須發生什麼令人驚訝/奇蹟般順利的事情?(是否有一個不那麼奇蹟的版本是我可以做的?)
  • 替代計劃可能獲得的最大回報是什麼?
  • 如果某些關於世界的事實是真的(或假的),可能會完全改變我處理這個問題的方法?
  • 如果外面有什麼資訊可以改變我的主意,我最可能在哪裡找到它?(與人交談?閱讀類似項目的資料?)

一些不那麼激烈但通常很有用的提示:

  • 這些計劃中是否有哪一個更有時效性?
  • 這些計劃中是否有哪一個具有明顯更多的下行風險?
  • 哪個計劃的反饋週期最短?
  • 哪個計劃對未來的計劃來說更像是瓶頸?
  • 你更願意付錢讓哪件事現在就辦好?

3. 嘗試尋找標量單位(Scalar Units)。

上週我正在建立一些基礎設施,以協助處理一件煩人的事情。「它是否能成功讓這件事變得不那麼煩人?」這個問題既模糊又絕對,很難推理。我多久會被煩一次?這種煩惱會耗費多少時間?

如果我將煩惱成本降至 0,是否能讓我更頻繁地執行一些我原本因為太討厭而避開的任務?我實際上會執行多少次那個以前很煩人的任務?答案最高可能是多少?最低又是多少?

...

有時我做某件事是為了讓自己開心,或讓別人開心。我/他們會有多開心?他們願意為此付多少錢?他們願意花多少天的工作時間來換取它?

4. 在極端情況之間進行內插,並找到關鍵點的閾值

假設我認為計劃 A 需要一個月並且「大致可行」。如果我知道計劃 A 需要一年,我還會做嗎?可能不會。那 6 個月呢?3 個月呢?(在 3 個月時,也許就開始取決於計劃 B 有多好了。)

...

如果我知道真的有 0 個人會使用這個項目,它還值得嗎?如果我知道有 20,000 人會使用它,也許它完全值得。100 個人呢?也許這取決於他們是誰。我在 工作。有時為 10 個核心用戶開發東西是值得的,但他們最好是非常優秀的核心用戶。

...

我顯然願意為計劃 A 的結果支付超過 10 美元。我會付 10,000 美元嗎?不?那 1,000 美元呢?100 美元呢?

(你不必精確地釘死關鍵答案——你可以找到一個範圍。「嗯,它顯然價值超過 50 美元,顯然低於 500 美元。中間的部分我不確定。」)

...

4. 檢查你的直覺預測

現在思考過了……你實際上預期最終會得到什麼數字?(使用你的直覺又是另一篇完整的博文)。

...

5. 獲取更多資訊

你不必僅憑目前已知的資訊做決定。你可以……直接查資料。或者與更多人交談。或者詢問大型語言模型(LLM)。

...

6. 做出決定,但保持觀察

歸根結底,即使資訊不完全,你還是得決定怎麼做。但是,留意那些顯示你錯了的早期預警信號是件好事。

方法將此正式化,通過做出明確的預測並在隨後跟進。但是,如果你沒有時間做出明確的預測,或者你對如何實際操作感到困惑,你仍然可以通過思考「什麼會改變我這裡的決定」並模糊地留意外部世界的資訊,或在執行計劃時留意模糊的不安感,從中獲得很大收益。

思考這一切有助於潤滑你思維的齒輪,幫助你更容易察覺到現實是否正準備以一種緩慢而微妙的方式往你臉上揍一拳。看看你是否能直視它,挨一拳,說聲「喔唷」,然後重新評估。

...

附錄:「雙重關鍵點」不是第一步。

這篇文章的動機是意識到「流暢且具關鍵性的預測」一次引入了 個複雜技能。你知道還有什麼也一次引入了多個技能嗎?最初的「雙重關鍵點」(Double Crux)技術,也就是「關鍵點」概念被引入 LessWrong 的地方。

是一種讓你和對話夥伴共同尋找各自關鍵點,並理想地找到一個雙方都認同的單一關鍵點的技術。但多人尋找關鍵點要複雜得多,而且你經常會轉向「進行常規辯論或爭論」,因為對大多數人來說那是一個更自然的框架。

如果你使用關鍵點來改變自己的計劃,而不用擔心向其他人證明自己的合理性,那麼關鍵點的用途就會明顯得多。

「你自己」和「計劃」這兩個部分都很重要。要弄清楚什麼會改變你對「我是否相信上帝?」或「我的政治信仰是否正確?」的看法是有點令人困惑的,因為這些並不會真正對你的日常生活產生反作用力。對於那些直接與你的行動掛鉤的信念,這一點要明顯得多,你可以看到一個信念不僅是錯誤的,而且它確實產生了影響。

  • ^()人們通常會覺得 Fatebook 在前幾週很有趣,我認為定期花一段時間集中精力使用它是值得的,但不要因為丟掉 Fatebook 的習慣而感到太大壓力。當你再次覺得有趣時,可以隨時回來。但你確實應該對丟掉「識別關鍵點」的習慣感到壓力。