全腦模擬已取得顯著進展

Lesswrong

大約 1 個月前

AI 生成摘要

最近在果蠅神經連結組的繪製與模擬方面取得了重大突破，證明了全腦模擬正成為一個可以解決的技術挑戰，儘管要擴展到更大的大腦仍需克服掃描速度和生物建模上的重大瓶頸。透過結合形態學與基因表達數據，我們正朝著準確預測神經元行為並實現功能性大腦模擬的目標邁進。

摘要

我們在[相對]近期內掃描了整個果蠅大腦並進行了模擬，證實了其神經活動僅受形態學的高度約束。其他研究團隊也一直致力於光學技術和遺傳學研究，以加快掃描過程並提高模擬的準確性。

享受果蠅時光

以使用序列切片電子顯微鏡繪製出而聞名。常被忽視的是，另一個團隊利用這些資訊創建了。雖然該模擬使用的是漏電整合觸發（leaky integrate and fire）神經元，且未模擬果蠅的身體，但這仍是一項巨大的技術成就。該論文的第一作者隨後前往工作，該公司的目標非常明確地指向人類全腦模擬。

他們在模擬中做了一些很酷的事情。其中之一是洗牌（shuffled）突觸權重，以觀察這會如何改變神經活動。結果顯示影響相當大。這是一件好事，因為這意味著他們關於突觸權重如何體現在形態學上的觀點可能是正確的。

雖然使用正確連接體進行建模時，當糖感官神經元以 100 Hz 激活，100% 的模擬都能產生 MN9 的強健激活，但在 100 次洗牌模擬中只有 1 次成功（補充表 1d）。因此，我們計算模型的預測準確性取決於果蠅連接體的實際連接權重。

我建議閱讀整篇論文。我認為在摘要中提供中等程度的細節會損害其價值。對於如此簡單的模型，他們獲得了令人驚嘆的優異結果，這確實讓我看到希望：實際的模擬層面可能比我曾經認為的要容易處理得多^()。

連接體追蹤的現狀與近期未來

目前連接體追蹤的兩個最大問題是速度和準確性。成像所有樣本需要很長時間，且由於電子顯微鏡價格昂貴，並行化過程的成本極高。至於準確性，要求比電子顯微鏡提供更高解析度似乎是不合理的。這雖然沒錯，但因為所有影像都是灰階的，分割（segmentation）變得極具挑戰性。流程中最大的瓶頸之一是人工對數據進行校對。我們有來處理這件事，但在第一輪處理後仍需要大量的人力投入。整個果蠅大腦耗費了約 33 年的人工校對時間才完成。在最樂觀的情況下，若無人工參與，準確性維持在 90% 左右。從果蠅到小鼠大腦時間的簡單推算，將需要約 10,000 年的校對時間，這顯然不是最優解。此外，許多校對人員受過神經解剖學訓練，這進一步增加了為此過程聘僱人力工人的難度。所以，我真的希望有人能解決這個問題，這對我來說非常重要。

我認為由於這些因素以及稍後將討論的其他因素，電子顯微鏡並非未來的發展方向。儘管如此，它仍是目前唯一經過驗證的技術，未來可能會有混合方法的空間：由光學顯微鏡使用傳統染色提供部分資訊，而電子顯微鏡提供最高解析度。

樣本製備和你使用的電子顯微鏡類型也存在問題。樣本必須在軸向上切得非常薄，因為掃描式顯微鏡無法看到表面下的細節，而穿透式顯微鏡的穿透深度有限。如果樣本是機械切割的，通常會產生偽影，使跨邊界的分割更具挑戰性。樣本可以用離子束切削（ion milling）破壞或進行光降解處理，這能為下一層成像留下更乾淨的表面，但破壞樣本會使多步驟成像變得困難。

若想了解更多細節，我建議閱讀這篇關於成像整個小鼠大腦所需條件的。

多模態數據分析

果蠅模擬有兩個明顯的局限性。第一是它甚至沒有嘗試模擬果蠅身體的其他部分。我對此表示接受，人們幾十年來一直試圖模擬 秀麗隱桿線蟲，但至今仍未建立完整的生物物理模型。這是一個巨大的挑戰，但不是我的主要興趣所在。第二個局限性在於其細胞模型本身。他們使用的是對每個神經元都相同的漏電整合觸發模型。我理解他們為什麼這麼做，且我不認為利用現有數據他們能做得更好，但他們也公開承認這是一個局限。不過，最近有一些進展填補了這一空白。

神經元在許多方面是不均質的。一是電活動，兩個神經元在給予相同的電流刺激時會產生不同的脈衝。另一是基因表達。已知有許多控制著決定神經元電活動的。一個很自然的問題是：是否可以根據基因表達來預測神經元的電生理特性？正試圖回答這個問題。我認為與此相關的主要結論是：

……基因表達水平的變化可用於在家族層面準確預測電生理特性，但在細胞類型層面的準確性較低。

儘管如此，我仍然對這種技術在生成單個神經元模型方面的可行性充滿信心。為什麼？因為他們用來測量基因表達的技術。其他測量基因表達的方法（我支持 MERFISH^()）則。如果這些技術仍然不準確或本身不足夠，傳統的似乎有可能允許直接測量離子通道密度^()。

我也想明確表示，我對他們所做的工作深感欽佩。我使用部分相同的數據來實現基因表達向生物物理模型的轉換，可以證實這確實非常具有挑戰性。他們的論文中有很多我希望自己曾嘗試過的內容，而且我認為可讀性很高。特別是，我讚賞他們嘗試擬合一個相對簡單的模型。當我閱讀神經科學論文時，最令我沮喪的一點就是人們試圖回答那些他們顯然還沒打好基礎的問題。

現在，即使實現了這一點，我們仍會缺失一些重要因素，例如激素或肽如何影響神經元的活動。但這是朝著正確方向邁出的一步。了解帶權重的連接體能讓你走得很遠，建立特定的細胞模型能讓你更接近，了解激素、肽、血流、神經膠質細胞的作用等雖然重要，但其集體影響可能比前兩個因素小。我不確定這種說法的把握有多大，生物學是一個深不可測的複雜深淵，某些高階效應可能比我意識到的重要得多。但這一切其實都圍繞著我的核心觀點（我強烈支持這一點）：對於大腦中的大多數神經元，我們需要一個比單一模板的漏電整合觸發神經元更具體的模型，而我們很可能利用當代成像技術實現這一點。

E11 Bio

是一家專注於研究連接體繪製的重點研究機構（FRO）。他們擁有一項結合了的酷炫技術，使追蹤神經元變得更加容易。

我在上文討論了電子顯微鏡的局限性。擴展顯微鏡是繞過這些問題的一種巧妙方法。樣本可以被水凝膠滲透，水凝膠膨脹會導致整個樣本大致均勻地擴大。如果我沒記錯，單步擴展可達 10 倍，但最酷的是如果你願意，可以進行多次擴展。E11 Bio 正在進行 5 倍擴展，我相信這足以滿足他們的需求。遺傳條碼是一種擁有功能上無限顏色通道的方法，以便唯一識別每個神經元。我天生不是搞遺傳學的，所以我可能會總結錯，但我的理解是每個神經元都被注入大腦的隨機病毒子集感染。每種病毒編碼一種可以與抗體染色結合的特定蛋白質。通過順序染色然後洗掉與螢光探針結合的抗體，你可以為每種可能的病毒對樣本進行一次成像。對於每一種給定的病毒，每個神經元要麼被感染，要麼未被感染，因此在每一輪染色/成像/清洗循環中，它要麼發光，要麼不發光。這給了每個神經元一個獨特的位元字串（bit string），即使在長距離投射中也能識別它。總而言之，這非常酷，而且在計算上比嘗試分割灰階細胞影像更簡單。它僅能略微提高（約 5 倍錯誤減少）自動分割的準確性，仍需嚴重依賴人工校對^()。但儘管如此，這顯然是朝著正確方向邁出的一步，我很高興聽到有人在研究它。

如果擴展倍數過大，確實會開始出現失真問題，但這就變成了工程上的權衡。你寧願讓電腦修正這些失真，還是處理電顯數據帶來的眾多物理和計算挑戰？我承認我有偏見，但這項技術真的很酷，並開啟了廣泛的顯微鏡技術，為成像和後處理速度提供了數量級提升的潛力。如果你對連接體追蹤的可行性感興趣，我推薦，它比較了擴展顯微鏡與電子顯微鏡。他們對小鼠最樂觀的時間表是約 5 天，但對人類大腦則是約 30 年。30 年是一個漫長的等待，速度和成本會有所改善，從而允許更多工作並行進行，但目前尚不清楚在足夠解析度下成像整個人類大腦在短期內是否可行。

我會致力於研究的方向

基於上述內容，我認為如果要實現全腦模擬，有幾個關鍵問題需要解決。這絕非詳盡清單，而是我可以指出的明確缺口。

具有足夠細節的高通量成像，理想情況下各方向均小於 10nm^()
改進機械或破壞性切片，以收集所有必要資訊，同時最大限度地減少邊界處的偽影
速度是最大的考量因素，這可以通過降低成本以使更多顯微鏡並行運作，或在不按比例增加成本的情況下提高單台速度來實現
更多的亞細胞細節
找出特定神經元的離子通道密度
識別神經元之間的縫隙連接（gap junctions）
更準確地識別每個神經元使用的神經遞質^()
一種提取與神經調節相關資訊的方法，這在電顯數據中是不可能或極難實現的
改進自動分割，理想情況是消除任何人工校對的需求
更先進的細胞建模，並驗證上述亞細胞細節能準確重建電活動和化學活動
這是海量的數據，需要大量的存儲和快速傳輸，以避免成為顯微鏡的瓶頸^()

[blocked]^() 我仍然非常擔心生物學習規則，我不認為有人對此有足夠深入的理解，以至於我們能製作一個小鼠的全腦模擬並讓它記住迷宮之類的東西。這是我經常強調的一點，但現在不是深入探討細節的時候，老實說，在做出如此籠統的斷言之前，我應該了解更多。
[blocked]^() 可以通過光學方式測量特定的基因子集。它需要多個步驟來附著和分離抗體，但因為它是光學的，所以可以使用大視野顯微鏡並行完成。我不確定它是否能與 E11 的 PRISM 結合，但如果可以，我認為那會非常棒，且不應增加任何時間。
[blocked]^() 據我所知，還沒有人使用抗體染色來測量離子通道密度並創建相應的、準確的生物物理模型。如果存在這樣的研究，這一節基本上就多餘了，但我會非常樂意閱讀那篇論文。
[blocked]^() 我在那句話或這個腳註中對「準確性」指標的描述並不全面。它被分解為幾個子問題：識別哪個細胞是哪個，以及識別哪些細胞是相連的。存在細胞被錯誤拆分導致部分內容懸空未分配，或部分內容被錯誤合併到錯誤細胞的情況。底線是：如果你知道如何做電腦視覺，你應該研究這個問題，它既重要又酷！
[blocked]^() 如前所述，擴展顯微鏡讓你即使顯微鏡本身沒有那麼高的解析度也能應付。如果你有 10 倍的擴展因子，你可以擁有 100nm 的解析度。果蠅大腦是以 4x4x40 nm 的體素（voxels）繪製的。
[blocked]^() 通常假設神經元只使用一種遞質，這被稱為戴爾定律（Dale's Law），但並非 100% 準確。我不清楚第二或第三種最常用的神經遞質對特定神經元或整體計算有多重要。
[blocked]^() 我猶豫是否要把這一點放在這裡，因為我覺得這是一個在成為全腦模擬的真正問題之前，就會被普通電腦產業解決的問題，但它被提到是一個嚴重的問題，艾位元組（exabytes）等級的數據可不是開玩笑的。

Notable Progress Has Been Made in Whole Brain Emulation

摘要

享受果蠅時光

連接體追蹤的現狀與近期未來

多模態數據分析

E11 Bio

我會致力於研究的方向