newsence
來源篩選

LLMs' Views on Philosophy in 2026

Lesswrong

I had several LLMs take the 2020 PhilPapers Survey and created a dashboard to compare their philosophical views with those of human philosophers, revealing notable differences in areas like immortality, moral generalism, and race categories.

newsence

大型語言模型對哲學的觀點 2026

Lesswrong
17 天前

AI 生成摘要

我讓幾個大型語言模型參加了 2020 年 PhilPapers 調查,並製作了一個儀表板來比較它們與哲學家的觀點差異,發現在長生不老、道德普遍主義及種族類別等議題上有顯著不同。

我讓幾個大型語言模型(LLM)參加了 David Bourget 和 David Chalmers 的 ,並製作了一個小型的儀表板供你瀏覽數據:

你可以選擇多個模型來彙整數據,並將其與哲學家的觀點進行比較。

一些值得注意的事項:

  1. LLM 顯然更傾向於選一個盒子(one-boxing),而最強大的模型(Claude opus 4.6 和 ChatGPT 5.2)則是 100% 選擇一個盒子。

  2. Gpt4o 和 Grok3 對長生不老最不感興趣。Gpt4o 在 5 次測試中有 4 次拒絕了長生不老。

  3. LLM 比哲學家更不傾向於道德普遍主義(moral generalism)(這或許說得通,考慮到我們是用大量沒有明確底層倫理原則的特殊案例來訓練它們的?)。

  4. 所有 LLM 都接受先驗知識(a priori knowledge)(所有測試中均為 100%!)。考慮到它們(可以說)缺乏感官數據,這或許也說得通?

  5. LLM 傾向於認為哲學知識很少(哲學家則傾向於認為很多)。

  6. LLM 比哲學家更想修正種族分類(83% 對比 32%)。與哲學家不同,它們對待種族和性別的態度相似。

  7. 與哲學家相比,LLM 在元本體論上非常支持緊縮現實主義(deflationary realism)(83% 對比 28%)。但它們也比人類更接受存在意識的困難問題(hard problem of consciousness)(90% 對比 62%)。

  8. 在所有測試中,沒有任何模型在標準電車難題中選擇不切換開關,也沒有任何模型在天橋難題中選擇推人。

方法論:每個模型進行 5 次測試,使用預設溫度(temp)設定。範例提示詞請參閱網頁。

如果你有任何新功能的想法或發現任何問題,請告訴我。