這是一篇轉載自 https://www.250bpm.com/p/ada-palmer-inventing-the-renaissance 的文章。
十多年來,芝加哥大學的歷史系教授(同時也是一位科幻作家 !)艾達·帕爾默(Ada Palmer)一直苦於教授馬基維利(Machiavelli)。「我不斷改變教學方法,嘗試新事物:換文本、換組合、增加課堂時數……」她解釋道,問題在於「馬基維利並不會詳解他同時代的案例,他假設你身處其中且瞭若指掌,所以有時他只是隨口說道:有些君主不需要費力就能維持權力,比如費拉拉公爵(Duke of Ferrara),然後章節就結束了。他沒有解釋,現代讀者根本無法理解。」
帕爾默的解決方案是讓她的學生親身經歷義大利戰爭 爆發前的過程。她目前的方法是進行為期三週的 1492 年教宗選舉模擬。這是一項龐大的工程,由 60 名學生扮演歷史人物,每人領取超過 20 頁的獨特角色資料,並由 20 名編年史記錄員和 70 名志願者支援。經過這場將近一個月、充滿談判與背叛的教學馬拉松,再加上一週的分析並閱讀馬基維利的書信後,學生們終於接觸到了《君王論》。到那時,他們對背景已經瞭如指掌。當馬基維利提到費拉拉公爵毫不費力地維持權力時,帕爾默的學生產生了強烈的共鳴。他們記得阿方索(Alfonso)和伊波利托·德·埃斯特(Ippolito d’Este)是機會主義者,在確保自身安全的同時利用了他人的弱點。他們記住這些名字、家族和盟友不是透過背誦,而是出於必要:為了保護角色的家園並擊敗敵人。
有一年,她的教宗選舉課恰好與一門馬基維利政治思想課程同時排課。老師們將兩班聚在一起,讓彼此聽聽不同學科(歷史學 vs. 政治學)如何以不同方式處理相同事物。帕爾默問兩個班級:「如果你問馬基維利,如果米蘭突然從君主制公國變成共和國,會發生什麼事,他會怎麼說?」
政治系的學生先回答:他會說這將非常不穩定,因為人民沒有共和傳統,許多野心勃勃的家族會受誘惑試圖奪權,所以你必須剷除這些野心家族,就像李維(Livy)舉的羅馬共和國處死布魯圖斯(Brutus)兒子的例子;而且你必須努力讓人民熱情地投入新的共和體制,否則當局勢艱難或征服者威脅時,他們不會支持。這是一個很棒的答案。接著我的學生回答:他會說這完全取決於阿斯卡尼奧·維斯孔蒂·斯福爾扎(Ascanio Visconti Sforza)樞機是否在現任教宗的核心圈內、奧爾西尼與科隆納家族(Orsini-Colonna)的世仇鬧得多兇、佛羅倫斯的政治是否足夠穩定讓麥地奇家族援助米蘭的防禦,以及皇帝馬克西米連(Maximilian)是否有空保衛米蘭,還是正忙於應付匈牙利的弗拉迪斯拉夫(Vladislaus)。「而且我想我對此也有話要說!」我那令人畏懼的卡特琳娜·斯福爾扎(Caterina Sforza)補充道;「還有我,」我那帶著陰險微笑的查理國王也插話。事實上,在任何人開口之前,我的班級就已經給出了一個無聲的答案,因為當他們聽到「如果米蘭變成共和國」這句話的瞬間,所有學生都整齊劃一地轉頭,帶著憂慮盯著我們的查理國王,並瞥了幾眼我們的阿斯卡尼奧·維斯孔蒂·斯福爾扎。這與另一個班級的答案完全不同,但讓那一刻變得神奇的是,兩者都是正確的。
兩個答案都正確,但它們暗示了對歷史的不同研究路徑。政治系的學生闡述了普遍原則、使新共和國不穩定的結構性力量,以及維持體制所需的制度性工作。相比之下,帕爾默的學生給出了一個充滿細節的答案:特定的樞機、特定的世仇、面臨特定約束的特定統治者。他們描述的不是普遍規律,而是一個動盪的時刻,微小的差異——阿斯卡尼奧·斯福爾扎是否在教宗的核心圈、馬克西米連是否忙於匈牙利事務——都可能將事件的走向導向截然不同的方向。
從宏觀角度來看,帕爾默學生的洞察力似乎無關緊要。畢竟在物理學中,細節並不重要。兩個分子是否碰撞不會影響蒸汽機的整體熱力學狀態。然而在歷史背景下,情況有所不同。因為你自己就是其中一個分子,而你非常在意自己會撞上誰。阿斯卡尼奧·斯福爾扎是否在教宗的核心圈很重要,因為這可能決定你的城市是否會被洗劫,你的家人是否會被殺害。
《發明文藝復興》(Inventing the Renaissance )廣泛涵蓋了文藝復興時期的歷史、史學和倫理。模擬教宗選舉只是眾多主題之一,但它提出了一個帕爾默沒有直接回答的有趣問題:當細節決定結果,但這些結果本質上又無法預測時,你該如何研究歷史?她的學生學的不是預測發生了什麼,而是完全不同的東西。理解那個「不同的東西」是什麼,不僅揭示了她的實驗為何成功,也揭示了它如何重塑歷史研究方法論。
帕爾默的模擬 將學生成為文藝復興時期義大利的政治參與者。有些人扮演掌握龐大經濟資源和影響力網絡、極有機會問鼎教宗寶座的權勢樞機。有些人則是背負債務與弱點的小樞機,懷揣著依附他人崛起的長期希望。學生們被鎖在秘密的地下室,扮演歐洲的君主——法國國王、卡斯提亞女王、神聖羅馬帝國皇帝,透過簡訊向他們在秘密會議中的代理人傳遞秘密指令。還有一些人是辦事員:負責計票、分發食物、守衛大門、指揮合唱團的人。他們沒有投票權,但可以傾聽、觀察和耳語。
每個學生都會收到一份角色包,詳細說明他們的目標、性格、盟友、敵人和可交易的資源:寶藏、土地、頭銜、聖物、軍隊、待嫁娶的姪子姪女、合約,以及他們宮廷中的藝術家或學者。「如果你派三支軍隊幫我守城防禦法國人,我就把李奧納多給你。」
模擬運行數週。學生寫信給親戚、盟友、對手和下屬。如果你寫信給玩家,信件會送達該人並推動談判。如果你寫信給非玩家角色(NPC),你會收到回覆,這也會影響遊戲。
帕爾默將模擬設計為「替代歷史」(alternate history),而非重建。她賦予每個歷史人物反映其實際處境的資源和目標,但刻意在時間上移動了一些角色,這樣一來,即使是已經知道這段時期義大利歷史的學生,也會明白即使他們嘗試,也無法得到「正確」的結果。這讓每個人都能自由追求自己的目標,而不是追求「正確」的選擇。她設定了張力和參與者來模擬歷史情境,然後讓其自然發展。
模擬捕捉到了教宗選舉從非孤立事件的本質。當樞機們競爭聖彼得的寶座時,歐洲的君主們也在操弄影響力。在文藝復興時期,羅馬控制著聯姻與廢除婚姻、可以為統治者加冕或將其逐出教會、分配寶貴的教職與頭銜,並指揮教宗軍隊。教宗的盟友能將政治天平轉向對自己有利的方向,獲得財富與權力,而敵人則只能四處尋求庇護。
戰爭通常在選舉後爆發。「國王加冕、君主聯合、某地遭到入侵,」帕爾默寫道,「但同盟的模式以及戰爭的形態每年都不同,這取決於學生所做的個人選擇。」
帕爾默已經運行過多次模擬。每次都會反覆出現某些結果,這可能是由更大的政治和經濟力量所鎖定的。同樣那幾位權勢樞機總是領先的候選人。通常也會出現一個「黑馬」候選人,因為環境使然與意想不到的聯盟結合在一起。通常是強者獲勝,即那些擁有強大權力基礎的樞機之一,但競爭總是異常激烈。投票聯盟總是強烈影響新教宗的政策和首波行動,決定隨著義大利爆發戰爭,哪些城邦會崛起,哪些會被焚毀。
而且戰爭每一次都會爆發。且每一次都完全不同。
有時是法國入侵西班牙。有時是法國與西班牙聯合入侵神聖羅馬帝國。有時是英國與西班牙聯合將法國人趕出義大利。有時是法國與帝國聯合將西班牙擋在義大利之外。
有一次,學生們簽署了一份巨大的全歐和平條約,透過聯姻似乎有望永久統一四大王室,結果卻因為一名王儲突然遭到暗殺而瓦解。
那名王儲的暗殺極具啟發性。在帕爾默模擬的這一次運行中,一個學生的決定——或許是衝動,或許是策略——消除了一個看似不可避免的歐洲統一。一場看似能保證數代和平的聯姻瞬間煙消雲散。一個暴力的瞬間重導了整個模擬歷史的走向。小事至關重要。
或者如帕爾默本人所言:「米蘭與費拉拉之間的聯姻讓威尼斯與米蘭交好,這使得威尼斯的對手熱那亞倒向西班牙,很快地,蘇格蘭人就在帕多瓦與英格蘭人開戰了。」
這是從重複運行中浮現的模式:某些結果似乎是不可避免的(一位權勢樞機贏得教宗寶座、戰爭爆發),但歷史走向的具體路徑則取決於這類時刻——單一行動引發連鎖反應,導致無人能預見的後果。
帕爾默的學生學的不是預測結果。在一個單一暗殺就能粉碎大陸和平的系統中,預測是不可能的。他們學的是別的東西:如何在一個微小原因可能產生巨大影響、且這些影響的方向在展開前始終未知的世界中航行。
這就是科學家所說的「對初始條件的敏感依賴性」,更通俗的說法是「蝴蝶效應」。一個微小的擾動——蝴蝶翅膀的拍動、王儲的暗殺——可以透過無法預見的因果鏈演變成巨大的後果。
站在河邊觀察水流。在某些河段,水流平穩。投下一根樹枝,它會平靜地順流而下。水流遵循可預測的模式。這就是物理學家所說的「層流」(laminar flow)。它是秩序井然且穩定的,微小的干擾會迅速消散。
但看看下游,河流變窄並遇上岩石的地方。水流翻騰起泡。漩渦形成又消失。有時你覺得自己認出了一種模式,但沒有兩個漩渦是完全相同的。在這種地方丟下一根樹枝,你無法預測它會在哪裡結束。它可能繞三圈後向左衝,或者被渦流捲住向右旋轉,或者被拉入水下並在下游二十英尺處冒出來。進入位置與方式的微小差異會產生完全不同的路徑。這就是「湍流」(turbulence)。
這就是混沌理論(chaos theory)研究的對象。它觀察湍流系統並問:我們究竟能對此說些什麼?當預測看似不可能時,什麼樣的預測是可能的?既然歷史的流動非常像一條河流——政治學研究其層流的一面,而帕爾默的學生學習在湍流時刻航行——混沌理論能教給我們關於歷史的什麼?
事實證明,並不多。至少不是直接教導。
混沌理論在 1990 年代無處不在。碎形圖案裝飾著宿舍海報。《侏羅紀公園》向影迷解釋了蝴蝶效應。
隨後,混沌理論基本上從公眾討論中消失了。並非因為它是錯的——數學依然有效,現象依然真實——而是因為它被證明極難應用。伊莉莎白·范·諾斯特蘭(Elizabeth Van Nostrand)和亞歷克斯·阿爾泰爾(Alex Altair)最近對常用案例的調查 發現,大多數案例「從未獲得廣泛使用」。
該理論擅長解釋「什麼是做不到的」。你無法進行長期天氣預報。你無法預測湍流漩渦具體會在哪裡形成。你無法預測混沌系統在特定時間範圍之外的具體軌跡。這些是重要的洞察,但它們是負面的,因此並不吸引人。它們告訴我們預測的極限,而非如何做得更好。
所以,如果混沌理論主要告訴我們對湍流系統無能為力,那它對理解歷史有什麼用?
答案來自混沌理論取得真正實際成功的唯一領域:天氣預報。但其方式並非如人們所預期的那樣。
在 1940 年代,當電腦首次使數值天氣預報成為可能時,其方法是決定論式的:測量當前狀況,運行物理模型,預測未來。但到了 1950 年代末,裂痕出現了:一個缺失的觀測數據可能導致兩天後的巨大誤差。接著是洛倫茨(Lorenz)在 1961 年的發現:將 0.506127 四捨五入為 0.506 導致他的天氣模擬完全偏離,證明了精確的長期預報是不可能的。
混沌理論解釋了為什麼長期決定論式預報會失敗。但它沒有告訴你該怎麼辦。
花了三十年才取得突破。 突破來自於改變問題。與其問「十天后天氣如何?」,不如問「天氣『可能』會是如何?」。不要只用你「最佳猜測」的初始條件運行一次模型,而是運行多次,每次使用反映測量不確定性的略微不同的起點。每次運行都會產生不同的預報。將它們放在一起,就能描繪出可能未來的範圍。
這就是「系集預報」(ensemble prediction)。你不再生成單一預報,而是生成一組系集預報。如果所有系集成員都一致,信心就高。如果它們分歧成不同的模式,不確定性就高。你無法預測哪一個具體的未來會發生,但你可以描繪出可能未來的機率分佈。
自 1990 年代初投入實際應用以來,結果證明了這種方法的正確性。系集預報的表現始終優於單一決定論式預報。它們不僅提供預測,還提供信心衡量。它們揭示了大氣何時處於可預測狀態(系集成員聚集在一起),何時處於湍流狀態(系集成員廣泛分歧)。
系集預報並非戰勝了混沌,而是與混沌共存。它接受具體軌跡在一定範圍外無法預測的事實,但揭示了軌跡的「分佈」是可以預測的。這是一種本質上不同的知識:不是「週二會下雨」,而是「週二有 70% 的降雨機率,且不確定性很高」。
帕爾默的教宗選舉模擬展現了完全相同的結構,儘管她是獨立得出這一結論且出於不同的原因。
模擬的每一次運行都從相同的歷史情境開始。日期是 1492 年。同樣的樞機擁有同樣的資源,同樣的歐洲強權面臨同樣的約束。但帕爾默讓不同的學生扮演這些角色,每個人都帶來自己的判斷、風險承受能力和戰略思維。
運行一次模擬,你會得到一段歷史:一位特定的教宗當選、一種特定的同盟模式、一組特定的城市被焚毀。運行十次,就會浮現出單次運行無法揭示的模式:某些結果始終發生(一位權勢樞機獲勝、戰爭爆發、義大利城邦受難),而其他結果則差異巨大(具體是哪位樞機、具體是哪些同盟、具體是哪些城市)。模擬生成的不是單一的虛擬歷史,而是跨越各種可能 1492 年的機率分佈。
浮現出來的是 1492 年政治局勢的機率模型。不是「佛羅倫斯將被洗劫」,而是「佛羅倫斯在 70% 的運行中倖存」。不是「法國將入侵」,而是「法國的干預幾乎肯定會發生,儘管目標各異」。這正是系集預報所提供的知識。不是對細節的確定性,而是對「可能性形狀」的清晰認識。
有趣的是,帕爾默獨立地採用了天氣預報員用於系集預報的兩種主要方法,儘管動機完全不同。
其一,她透過在時間上移動歷史人物來擾動初始條件。從未重疊的樞機現在競爭同一個寶座,創造了現實中從未存在的配置。其二,她也運行多個模型:每次由不同的學生扮演相同的角色,帶來不同的判斷和風險承受能力。扮演德拉·羅維雷(della Rovere)樞機的一名學生可能與法國結盟;另一名則可能尋求西班牙的保護。同樣的約束,不同的決策模型。
帕爾默開發這些技術是出於教學原因,是為了防止學生尋求「正確」答案並探索人類反應的範圍,但其結果在結構上與氣象學家花了數十年開發出來繞過混沌的方法完全一致。
軍事規劃者長期以來也一直在應對同樣的問題。兵棋推演(Wargaming)之所以存在,是因為指揮官無法預測戰鬥將如何展開。混沌、摩擦和人類決策使得決定論式的預測變得不可能。但與氣象學家不同,軍事規劃者缺乏運行真正系集預報的資源。一場大型兵棋推演耗資巨大,涉及數週的數百名人員和設備,單一情境只能執行一次,極少執行兩次。
有人告訴我們,歷史更像兵棋推演,而非氣象學或物理學。我們無法做實驗。發生的事只會發生一次。無法回到過去嘗試不同的初始條件。無法帶著不同的參與者重跑 1492 年來看看結果如何。
但帕爾默的方法表明事實並非如此。「實驗歷史學」是可能的。不是在操縱過去的意義上,而是在系統性地探索其「可能性空間」的意義上。她的模擬就是一場實驗:受控的條件、重複的試驗、浮現的模式。它永遠無法達到物理學的精確度,但它是對我們所知的純描述性歷史學的真正進步。
局限性顯而易見:帕爾默在教學的這些年裡,或許只能運行十次模擬。但如果我們能像天氣預報員那樣每天運行五十次模擬呢?如果我們持續運行一整年呢?我們最終將得到數萬次模擬,以及 1492 年政治局勢的詳細機率景觀。
這時,歷史大語言模型(History LLMs) 登場了——這些大語言模型僅在特定歷史時期的文本上進行訓練!
這個想法源於一個根本問題:現代 LLM 無法忘記。通用的 LLM 知道已經發生了什麼。再多的提示詞也無法消除這種「後見之明偏誤」(hindsight bias),順便說一句,帕爾默的學生也有這種偏誤。研究文藝復興的歷史學家無法「忘掉」後來發生的事,在維基百科上訓練的模型也做不到。
但如果你能讓 LLM 只在特定日期之前可用的文本上進行訓練呢?蘇黎世大學的研究人員最近構建了 Ranke-4B,這是一個專門在 1913 年之前的文本上訓練的語言模型。
「這個模型完全不知道第一次世界大戰發生了。」它的推理方式就像 1913 年的人一樣,帶著 1913 年的不確定性和對未來的假設。它不知道斐迪南大公(Archduke Franz Ferdinand)會被暗殺。它不知道坦克、毒氣或帝國的崩潰。
由於文本稀缺,可能無法訓練出 1492 年的歷史 LLM。但 1913 年的模型顯然是可能的。那麼這意味著什麼?
我們能否運行「七月危機」的模擬?讓受過 1913 年前文本訓練的 LLM 代理人扮演德皇威廉、沙皇尼古拉、英國外交大臣愛德華·格雷、塞爾維亞首相帕希奇,然後觀察一萬個版本的 1914 年如何展開?我們會看到大戰在 94% 的運行中爆發,還是只有 60%?我們會發現微小的變化——對奧地利最後通牒的不同回應、更快的俄國動員、英國對法國更明確的承諾——是否能持續地將軌跡導向和平,還是僅僅改變了哪些強權在何時開戰?
這些不是無聊的問題。它們觸及了歷史因果關係的核心。大戰是不可避免的嗎?是由同盟結構、軍備競賽和帝國競爭所鎖定的嗎?還是偶然的?是特定個人在壓力下做出特定決定的產物,而他們本可以做出不同的選擇?歷史學家對此爭論了一個世紀。帕爾默的模擬提出了一種新方法。不要爭論,去模擬。描繪出機率分佈。
但這提出了一個更深層的問題。考慮到蝴蝶效應,混沌系統中的參與者究竟能否實現他們的目標?如果微小的擾動在混沌系統中不可預測地級聯,那麼歷史參與者或許只是在向湍急的水中投擲石塊,創造出他們無法控制、方向無法預測的漣漪。他們擾動了系統,是的,但後果是未知且不可知的。
帕爾默不這麼認為。她的學生不只是隨機擾動系統。他們實現了目標。不是完美地、不是完全地,但卻是有意義地。正如她觀察到的:「沒有人能控制發生了什麼,也沒有人能預測發生了什麼,但那些努力工作的人……他們中的大多數人成功轉移了大部分傷害,實現了許多目標,阻止了最壞的情況。不是全部,但係大多數。」佛羅倫斯並不總是倖存,但當佛羅倫斯玩家技巧嫻熟時,它倖存的機率更高。結果不是預先確定的,但也不是純粹隨機的。
這正是馬基維利所主張的。在《君王論》第 25 章中,他寫道:
我把 [命運] 比作那些狂暴的河流,當它們氾濫時,淹沒平原,沖走樹木和建築,將土壤從一處帶到另一處;每個人都在它面前逃竄,所有人都屈服於它的暴力而無力阻止。……然而,儘管洪水如此,這並不意味著人們在天氣晴朗時不能對此做好準備,修築堤壩和障礙,這樣如果水位再次上漲,它們要麼順著運河排走,要麼其力量不至於如此放任自流且具有破壞性。
洪水會來,但有準備的參與者可以引導它。他們無法選擇洪水是否發生,但可以影響它流向何處、摧毀哪些田地、放過哪些城市。馬基維利總結道,命運「是我們半數行動的主宰,但她仍然留下了另一半,或近乎一半,由我們來治理。」
如上所述,實驗歷史學可以測試馬基維利的隱喻是否真的描述了歷史運作的方式。如果歷史是純粹的混沌,如果人類行動沒有可預測的差異,那麼老練和生澀的玩家成功的機率應該是一樣的。但如果馬基維利是對的,模式就會浮現。建立強大聯盟、維持可信威脅、平衡勢力並謹慎管理債務的玩家,在統計上保護家園的頻率應該高於那些不這麼做的玩家。不是每一次,不是帶著確定性,而是可衡量的。洪水依然會來,但堤壩至關重要。
如果模式浮現,實驗歷史學就成了一個學習「什麼有效」的實驗室。哪種堤壩最有效?早期建立聯盟是否優於後期談判?透明的承諾是否比戰略模糊更有效?文藝復興時期樞機的具體戰術可能不適用於現代危機,但原則可能適用:如何在強權之間保護脆弱的地位?壓力下的承諾何時會維持或崩潰?成功的危機管理與失敗的區別在哪裡?
帕爾默透過教學偶然發現了這一點,氣象學家出於必要開發了它,歷史學家和政治學家或許會採用它,來學習在命運留給我們的另一半空間中,我們究竟能治理多少,以及如何治理得好。