無需張量並行的聯邦多模型 AI 審議機制

ethresear.ch

大約 22 小時前

AI 生成摘要

我們發布了一項名為 NSED 的聯邦 AI 編排協定，透過結構化審議與平方投票機制協調分散在不同 GPU 上的獨立模型，在硬體成本降低 4 倍的情況下達到頂尖模型的性能水準。

內容摘要 (TLDR)

我們發佈了一項聯邦式 AI 編排協定 (NSED)，透過具有自我評估和平方投票共識的結構化審議輪次，協調分佈在不同物理位置 GPU 上的多個獨立模型。此方案無需張量並行 (Tensor Parallelism)。

論文：
代碼： (源碼可用，遵循 BSL 1.1 授權；Agent SDK 遵循 MIT 授權)
結果：在 AIME’25 和 LiveCodeBench 測試中，以低 4 倍的資本支出 (CapEx) 達到與頂尖前沿模型 (Frontier Model) 相當的品質。換言之：僅透過編排，即可比基礎模型提升 15–30% 的推理性能。
協定經濟設計（草案）：

我們正在尋找研究合作夥伴和早期設計夥伴——共同針對特定領域基準測試運行 NSED，並在對抗性條件下對 DIP 協定的經濟設計進行壓力測試。

背景：去中心化協調中的物理層問題

對於關注我之前在此發文的人來說，自 2020 年以來我一直提出一個特定的擔憂：大多數去中心化協定設計將物理電信層視為已解決的問題，但事實並非如此。設計這些系統的軟體工程師和數學家很少考慮 TCP/IP 級別的限制，而這些限制決定了「去中心化」在實踐中真正的含義。

我曾在多篇文章中闡述這一觀點：

共同的核心觀點是：如果我們想要可信的去中心化系統，我們需要思考計算的物理分佈，而不僅僅是共識的邏輯分佈。這就是下述工作的起點。

NSED：我們構建了什麼以及它證明了什麼

NSED (N-Way Self-Evaluating Deliberation，N 路自我評估審議) 是一種模型混合 (Mixture of Models, MoM) 架構，來自不同提供商的多個獨立 AI 模型透過提案、交叉評估和平方投票共識的結構化輪次進行審議。

關鍵的架構特性：模型運行在物理分離、聯邦化的 GPU 上，沒有共享內存，也沒有張量並行。協調是透過 NATS 上的結構化消息傳遞協定完成的，而非透過參數級同步。

結果

| 配置 | 硬體 | AIME’25 分數 | 與前沿模型對比 |
| :--- | :--- | :--- | :--- |
| NSED 消費級 (3 個小型開源模型: GPT-OSS-20B, Qwen-3-8B, Gemma-3-12B) | 消費級 GPU | 84% | 媲美 DeepSeek-R1 |
| NSED 高性能 (開源模型，可自託管) | 中階硬體 | 90.0% | 與 GPT-5 (90.8%) 差距在 0.8% 以內 |

資本支出 (CapEx) 對比：NSED 消費級配置以約低 4 倍的硬體成本，實現了與直接運行前沿模型相當的推理品質。其機制在於審議多樣性——多個較弱的模型相互交叉檢查，產生的結果優於單個較強模型獨自推理的結果。

為什麼這對以太坊很重要

主流的 AI 範式（混合專家模型，Mixture of Experts）依賴於具有內部路由的單體模型——這本質上是中心化計算。MoM 則是一個不同的擴展維度：品質透過模型多樣性和審議輪次提升，而非參數數量。這自然地對應到物理分佈式基礎設施，其中沒有單一運營商能控制所有參與者。

如果你相信以太坊的長期價值包括作為 AI 計算的協調基礎設施，那麼問題在於：協調協定長什麼樣？NSED 提供了一個答案——雖然不是唯一的，但是一個具體且經過基準測試的答案。

授權說明

NSED 的編排器在 BSL 1.1 協議下源碼可用（對年收入低於 100 萬美元的實體、學術研究用途及開發測試免費；4 年後轉為 AGPL-3.0）。Agent SDK 採用 MIT 授權——對任何構建代理或提交任務的人來說零授權摩擦。鏈上協調原語 ( v1) 作為公共物品採用 MIT 授權。其意圖是：MIT 原語推廣標準，BSL 在關鍵增長期保護編排層，AGPL 確保長期開放。

DIP：經濟層 —— 去中心化知識產權

除了 AI 相關的工作外，我們一直在開發經濟架構，以使可驗證的知識工作在無須信任的環境中具有可持續性。

解決了一個根本問題：數位經濟缺乏評估和保護知識產權的穩健框架。「數據披露問題」——你必須揭露數據以證明其價值，但揭露數據會破壞其稀缺性——阻礙了流動性去中心化 IP 市場的出現。DIP 提出了基於四大支柱的解決方案：

精英領導的溯源 (ACIP/CVPP)：數據品質是可驗證過程的湧現屬性，而非主觀標籤。「自主能力識別協定」(Autonomous Competence Identification Protocol) 創建了一個排名階梯，能力透過限時、基於成本的競賽來證明。提升排名 R 的成本呈指數級增長——這使得理性的攻擊者進行持續的女巫攻擊 (Sybil attack) 成本極高。價值以代幣化形式體現：流動性訪問代幣 (LATs)，可自由交易，為特定品質等級的 IP 訪問權創造流動市場。
精英領導的自主組織 (MAOs)： DAO 的演進形式，其中臨時的治理捕獲被視為一種預期內的競爭動態，而非災難性的失敗。ACIP 的時間-財務約束 $q = f(x, t)$ 使得永久的中心化控制在經濟上是不理性的——獲取治理權的速度越快，成本呈指數級上升。
三方託管：在買方（如尋求訓練數據的 AI 公司）、專家社群（透過 ACIP/CVPP 賺取 LAT 的工作者）和專家公會（作為託管代理和仲裁者的 MAO）之間建立博弈論平衡模型。「稀釋困境」——LAT 轉換為治理權會稀釋現有公會治理持有者的權益——創造了激勵一致性，促使公會維持嚴格的品質標準。
地理空間去中心化基礎設施：需要大量銷毀承諾的權威節點 (Authority Nodes)，代表具有去中心化身份 (DID) 發行權的管轄錨點。這將去中心化從一個抽象指標轉變為可驗證的、市場驅動的物理屬性。「互惠 IP 託管」機制——以門檻加密的 IP 冗餘換取權威特權——將節點運營商的激勵與網路長期安全對齊。

這源於我們早期在 Solidity 智能合約中實現的工作 ()。該項目證明了純粹在 EVM 中構建真實應用層協調的潛力與難度，並讓我們確信：具有鏈上結算的嚴謹鏈下協定才是正確的架構。

社群開放問題

我最希望獲得社群回饋的領域：

1. 基於社交圖譜的女巫攻擊防護 vs. 正式證明系統

ACIP 的主要女巫抗性來自於排名晉升的指數級成本結構。但我們也在探索社交圖譜拓撲分析作為額外層級——利用連接模式、互動頻率和結算行為來檢測協調性的非精英活動，而無需正式的身份證明。

問題是：對於限制參與精英排名而言，社交圖譜分析能否提供在實踐上與正式證明系統（ZK 護照、設備認證、硬體 TPM）相媲美的女巫抗性？失敗模式有哪些？其吸引力在於零個人隱私信息 (PII) 和零硬體依賴，風險則是社交圖譜可以偽造或刷取。是否存在一種可組合的中間地帶——利用社交圖譜信號來增強輕量級加密證明，而無需重量級的證明基礎設施？

2. 對抗性條件下 MAO 託管的穩定性

三方託管模型（買方 / 專家社群 / 專家公會）依賴於「稀釋困境」創造的激勵一致性。論文中描述了博弈論，但尚未透過基於代理的模型或機制設計證明進行正式驗證。託管結算和爭議解決等關鍵市場組件仍在設計中。具體問題：

在什麼樣的市場條件下平衡會被打破？當公會治理被一個優先考慮短期榨取而非長期聲譽的聯盟捕獲時會發生什麼？
系統對 LAT 銷毀率相對於治理代幣發行量的敏感度如何？是否存在某種參數區間會導致稀釋困境無法約束公會行為？
論文聲稱任何兩方聯手對抗第三方在長期經濟上是不理性的。這能否被形式化？邊界條件是什麼？

3. 權威節點銷毀承諾與網路啟動

DIP 提議權威節點必須銷毀大量基礎資產以獲得 DID 發行權和管轄錨點。另一條路徑——針對成熟機構的「共識授予治理審核」——旨在引入高價值實體而無需市場購買。

矛盾點在於：銷毀承諾提供了強大的女巫抗性和長期對齊，但它創造了資本壁壘，可能導致權威節點地位集中在資金雄厚的參與者手中，損害精英領導的初衷。共識授予路徑緩解了這一點，但引入了治理攻擊面。正確的平衡點在哪裡？是否有其他承諾機制可以在不造成資本集中的情況下保持對齊？

我正在尋找

希望參與以下工作的研究合作夥伴和早期設計夥伴：

針對特定領域基準測試（代碼審查、法律分析、安全審計）運行 NSED
形式化 MAO 託管博弈論，並在對抗性條件下進行壓力測試
探索基於社交圖譜的女巫抗性，作為正式證明系統的替代或補充

思考聯邦式 AI 協調中的物理分佈約束

      1 則貼文 - 1 位參與者      [閱讀完整主題](https://ethresear.ch/t/federated-multi-model-ai-deliberation-without-tensor-parallelism/24227)

Federated Multi-Model AI Deliberation Without Tensor Parallelism