每位實驗者都必須了解的隨機化知識

Hacker News

10 天前

AI 生成摘要

這篇文章探討了實驗設計中隨機化的基本原則與常見陷阱，並強調了其在確保統計有效性方面的關鍵作用。

spawn-queue.acm.org

3778029

背景

這場討論源於一篇探討實驗設計中「隨機化」必要知識的文章，核心爭議點在於研究人員在進行臨床試驗或 A/B 測試時，是否應捨棄偽隨機數生成器（PRNG），轉而追求基於物理現象的真隨機數生成器（TRNG）。文章主張 PRNG 的確定性本質會限制可能的分配組合，進而導致統計推論（如 p 值）的失效，這在 Hacker News 社群引發了關於理論嚴謹性與工程實踐之間的激烈辯論。

社群觀點

社群對此議題的分歧點主要在於「理論上的偏差」是否等同於「實務上的失效」。部分評論者批評文章過度神化了真隨機數，認為對於大多數實驗規模（如樣本數 300 的分配）而言，現代 PRNG 提供的熵空間已經遠超實驗所需的複雜度。支持 PRNG 的觀點指出，雖然 256 位元的種子無法窮舉所有可能的排列組合，但在實務上，這種「無法窮舉」與真隨機並無二致，因為人類在宇宙毀滅前都無法觀測到兩者的統計差異。他們認為，除非 PRNG 本身設計拙劣（如早期的線性同餘生成器），否則在非密碼學場景下，PRNG 產生的結果在統計上是不可區分的。

然而，另一派觀點則從統計學的嚴謹定義出發，支持文章的擔憂。他們指出，p 值的計算前提是「所有可能的分配具有相等的機率」，當使用 PRNG 時，由於種子空間有限，大量潛在的分配組合機率實際上為零，這在理論上確實破壞了隨機化檢定的基礎。有留言舉出洗牌的例子：若要確保 52 張牌的所有排列都能出現，至少需要約 225 位元的熵，若模擬更複雜的場景，256 位元的限制確實可能成為瓶頸。此外，也有人提醒 PRNG 在實務中最常見的災難並非統計分佈不均，而是人為失誤，例如在每次實驗運行時都使用相同的預設種子，導致所有受試者面對完全相同的「隨機」序列。

討論中也觸及了量子力學與多重宇宙的哲學層面，探討放射性衰變作為隨機源的本質。但回歸技術層面，資深開發者強調，密碼學安全偽隨機數生成器（CSPRNG）在設計上就是為了通過所有已知的統計檢定，若有人能區分其與真隨機的差異，那代表該加密演算法已被破解。最終，社群的共識傾向於：雖然追求真隨機在學術上更為穩妥且能避免爭議，但在現代計算環境下，只要正確使用高品質的 PRNG 並妥善管理種子，其引入的偏差在絕大多數科學研究中都是可以忽略不計的。

What Every Experimenter Must Know About Randomization

背景

社群觀點

延伸閱讀