newsence
來源篩選

A Simple Rule for Determining Causation

Lesswrong

I propose a simple heuristic for causal inference: if everything related to A is also related to B, we can be moderately confident that A causes B, whereas finding even one variable related to A but independent of B falsifies this claim. This rule relies on observational data and conditional dependencies, though it can be subverted by coincidences or intentional control systems.

newsence

判斷因果關係的簡單法則

Lesswrong
3 天前

AI 生成摘要

我提出了一個判斷因果推論的簡單啟發式規則:如果所有與 A 相關的事物也都與 B 相關,我們就能適度相信 A 是 B 的因果上游;反之,只要發現任何一個與 A 相關但與 B 獨立的變數,就能推翻 A 導致 B 的假設。這個規則依賴於觀測數據與條件依賴關係,但在巧合或刻意設計的控制系統中可能存在例外。

這裡有一個關於因果推論(causal inference)的簡單啟發式規則:

  • 如果我們發現哪怕只有一個事物 X 與 A 相關^(),但與 B 獨立,我們就可以得出結論:A 並非處於 B 的因果上游。
  • 因此,如果所有與 A 相關的事物也與 B 相關,我們就可以適度地相信 A 處於 B 的因果上游。如果我們測量了許多事物,且因果圖可能很複雜(大多數變量都有許多成因和影響),我們的信心可以更高。

例如,考慮「下雨導致我帶傘」這個主張:

  • 應該不可能想到一個與下雨相關、卻不與我帶傘相關的事物。^()
  • 反之,應該可以找到與帶傘相關但與下雨無關的事物。例如,我在某天的懶惰程度可能與帶傘呈負相關,即使我的懶惰與下雨無關。

這個規則有一些例外,我將在最後一節討論。

規則的推導

假設 A 和 B 相關(非獨立)。我們想要區分以下三種可能性:

  • A 導致 B
  • B 導致 A
  • 兩者互不導致(僅存在共同原因)

現在假設我們想純粹使用觀察數據來區分這些情況。特別地,我們可以針對各種額外變量 X,觀察 {A, B, X} 的聯合分佈。

具體來說,我們將觀察這三個變量之間的條件依賴關係。這包含六個問題:

  • A 和 B 是否獨立?
  • B 和 C 是否獨立?
  • A 和 C 是否獨立?
  • 在給定 C 的條件下,A 和 B 是否獨立?
  • 在給定 A 的條件下,B 和 C 是否獨立?
  • 在給定 B 的條件下,A 和 C 是否獨立?

如果我們要求 A 和 B 相關,且 C 至少與其中之一相關,那麼這組問題最終只有 6 種可能的答案。要麼所有的依賴關係都存在(1 種選項),要麼恰好有一個是獨立的(5 種選項,因為我們已經假設 A 和 B 相關)。^()

以下表格顯示了哪些依賴結構與 A 和 B 的三種因果假設相容:

*在 {A, B, C} 之間的條件依賴關係中,沒有任何可能的值可以排除「僅限共同原因」。然而,其他兩個假設中的每一個都可以被單次觀察所證偽。

獲得「A 導致 B」假設的高信心的唯一方法,是努力尋找 C 與 A 相關但與 B 無關的情況。如果 A 不導致 B,我們預期最終會找到這樣的情況,因此沒找到通常是因果關係的強有力證據。

反例總是出現在 C 是以下情況時:

  • A 的一個與 B 無關的成因
  • 或者是該成因的一個影響

在下一節中,我將通過為每個「允許」的單元格提供因果圖來推導該表格。然後我將討論核心主張的兩個實際例外。

表格的視覺化推導

例外

例外 1:「巧合」與控制系統^()

一般來說,因果圖可以告訴你兩個變量何時必須獨立,但它不能排除當因果圖顯示兩個變量不應獨立時,它們卻「因巧合」而獨立。

如果因果關係的內容是從連續的選項空間中隨機選擇的,那麼這種巧合的概率為零。然而,在刻意設計的控制系統中,因果路徑是有可能相互抵消的。

例如,考慮一個恆溫器。恆溫器在時間 $t+1$ 的輸出電壓肯定對房間在時間 $t+1$ 的溫度有因果影響。然而,如果恆溫器運作完美,統計上看起來可能像是輸出電壓並不處於未來室溫的因果上游。讓我們通過因果圖來研究這個例子:

我們的恆溫器因果模型

現在讓我們應用我們的規則。我們想要驗證 A 是否處於 B 的因果上游。既然 XA 相關,它也應該與 B 相關。然而,如果恆溫器運作良好,XB 實際上將是獨立的!時間 $t+1$ 的溫度(「B」)將僅取決於恆溫器的設定點,而不取決於時間 $t$ 的溫度(「X」)——這就是恆溫器運作良好的定義!

圖表顯示 XB 有兩條因果路徑(藍色直接箭頭和經過恆溫器的橘色路徑),但這些路徑會因恆溫器的設計而相互抵消。

對於隨機生成的系統來說,這種設計好的抵消將是概率為零的巧合。

例外 2:除了與 B 的共同原因外,沒有可測量的 A 的成因

這兩個圖表在觀察上是無法區分的:

問題在於 A 除了與 B 共享的成因外,沒有其他成因。

如果我們改用這個圖表,我們就可以通過測量 D 與 A 相關但與 B 獨立,來排除「A 導致 B」。

如果由於某種原因 D 無法測量,我們可以改為測量 D 下游與 B 和 C 無關的變量。但如果出於某種系統性原因,沒有此類變量可供測量,我們的規則將錯誤地得出 A 導致 B 的結論。

感謝 Thomas Kwa 指出控制系統的例外情況,並鼓勵我寫下這篇文章。感謝 Lukas Finnveden 提供有用的反饋。


  • ^()在整篇文章中,我將使用「相關」(related)作為「非獨立」(not independent)的準確同義詞,以簡化語言。

  • ^()我實際的意思是「非獨立」,但我認為用「相關」(correlated)這個詞會讓句子更容易閱讀。

  • ^()我在此假設變量只有在因果圖結構要求它們獨立時才是獨立的。最後一節討論了此假設的例外情況。

  • ^()感謝 Thomas Kwa 指出控制系統的例外情況,並鼓勵我寫下這篇文章 :)