實驗室機器人的啟發式方法及其未來發展方向

Lesswrong

18 天前

AI 生成摘要

這篇文章透過綜合產業專家的見解，探討了實驗室機器人技術的現狀與未來軌跡，並為自動化建立了一套啟發式準則。我分析了不同機器人系統之間的權衡，並指出若要克服現有瓶頸，必須在轉譯、硬體及智慧層級這三個關鍵領域進行創新。

註：本文需要與許多人進行交流。以下是（希望是）詳盡且隨機排列的清單，列出了所有對本文觀點有所貢獻的人士：（自動化主管）、（執行長，前創辦人）、（執行長）、（前創辦人）、（執行長）、（執行長）、（執行長）、（營運長）、（現任風險投資人，前共同創辦人）、（麻省理工學院博士生）、（風險投資人）、（執行長）、（研究員）、（哥倫比亞大學博士生）、（現任創辦人，前自動化工程師），以及（初創企業創建者）。*

前言

我從未在濕實驗室（wet lab）工作過。我最接近的一次是在大學一年級的第一個學期，當時我在一個神經刺激小組待了四個月。每天早上 9 點，我會醒來，走向實驗室，將一根電線插入大鼠頭部手術植入的接口中，該接口連接到纏繞在其迷走神經上的金屬環，然後將牠放入。在那裡，這隻生物被迫在幾個小時內辨別十幾種不同的聲音，同時上述神經會被電擊。據稱這對大鼠來說並不痛苦，但牠們顯然對自己的處境並不滿意。當一隻異常躁動的大鼠在我試圖插電時，將整個接口系統從頭骨上扯下來後，我在該實驗室的任期正式宣告結束。

儘管那次經歷非常糟糕，但我不能憑良心將其等同於「真正的」濕實驗室工作，因為那次經歷沒讓我學會討論版上常用的任何術語。

我提到自己缺乏背景背景，完全是因為這對我理解廣泛的實驗室自動化領域產生了一些不幸的後果。具體來說，我非常容易被忽悠。

在生物學的許多其他領域並非如此。到目前為止，我已經建立了一些必要的心理框架，足以拒絕、、等領域人士提出的誇大主張。但實驗室機器人學讓我捉摸不透，因為要理解實驗室機器人學，你需要理解實驗室裡「實際」發生了什麼——字面上的物理動作、儀器的操作方式、材料的儲存方式以及其他一切——而我並不「真正」理解實驗室裡發生了什麼。

沒有這種具身知識（embodied knowledge），我本質上就像是鄉村集市上的土包子，任何承諾其神奇盒子能做任何事情的江湖郎中都能讓我眼花繚亂。人們向我展示機器人旋轉飛舞，我的眼睛立刻充滿光芒，張大嘴巴。值得慶幸的是，我意識到自己是個土包子。所以，儘管這一切看起來多麼令人印象深刻，我一直不敢提出自己的見解。

這篇文章是我試圖修正這一點的嘗試，並向各位解釋我從與該領域許多人的對話中獲得的啟發式方法。這並不全面！但它至少涵蓋了我在該領域專家中所見到的一些主流思想流派。

實驗室機器人學的啟發式方法

有箱型機器人，也有機械臂機器人

這一節內容可能很顯而易見，但我希望能為自己在本文其餘部分引用奠定一些基礎。如果你已經對實驗室自動化領域略有了解，可以放心跳過這部分。

在自動化世界中，存在著「箱子」（boxes）。箱子已經存在了很長很長時間，可以被視為「成熟技術」。我們的遠古祖先（指早期實驗員）嚴重依賴它們，它們已成為許多實驗室的必備品。

舉一個箱子的例子，考慮「」。液體處理器的目的是將液體從一個地方移動到另一個地方。它的任務是從這個管子取出 2 微升放入那個孔位，然後從這 96 個孔位取出 50 微升分配到那 384 個孔位中，並完美地重複執行一萬四千次——這是人類最終會感到厭煩的手動工作。必須為每個任務對它們進行編程，這有點麻煩，但一旦腳本寫好，它就可以永遠（幾乎）完美地運行。

這是一張你可能在一些實驗室看到的液體處理器圖片，這台價值 4 萬至 10 萬美元的機器俗稱為「」。

為什麼要這樣做？液體在生物學中極其重要。考慮一個簡單的藥物篩選實驗：你有一個包含 10,000 種化合物的庫，你想知道哪些能殺死癌細胞。每種化合物都需要添加到含有細胞的孔位中，並設定多個濃度，假設每種化合物設定八個濃度以生成劑量反應曲線。那就是 80,000 個孔位。每個孔位需要接收精確的 1 到 8 微升化合物溶液，然後孵育 48 小時，再接收 10 微升存活試劑（測量細胞生死的東西），再孵育 4 小時，最後由微孔板讀取儀讀取。如果你在第 47,832 號孔位移液了 11 微升，該化合物的劑量反應曲線就會出錯，你可能會推進一個假陽性結果，甚至更糟，錯過一個候選藥物。

這很困難！這就是為什麼自動化在這裡很有用。

還存在許多其他類型的箱子。用於免疫組織化學的自動染色機，它們接收組織切片並進行精確計時的清洗和抗體孵育，否則這需要研究生在實驗台前站上六個小時。微孔板讀取儀（通常用於液體處理器內部）測量數百個孔位的吸光度、螢光或發光。諸如此類。

箱子（內部可能還包含箱子）代表了實驗室工作流程的一個清晰切片，是可以參數化的橫截面——也就是對特定濕實驗室任務的可接受輸入空間、步驟、公差和失敗模式的明確定義。圍繞著這種精細的描述，一個箱子被建造出來，且只有這種明確的參數化任務可以在箱子內運行。許多公司都在製造箱子！除了 Hamilton 公司製造的 Hamilton 之外，還有、、、、等公司製造的箱子；總而言之，箱子生態系統已經成熟、鞏固且極其乏味。

但是，儘管箱子節省了大量時間，它們卻有一個問題。那就是一個不幸的事實：它們最終與宇宙的其他部分隔絕。液體處理器不知道孵箱的存在，讀板機對它讀取的板子從何而來毫無概念。每個箱子都是一座孤島，一個盲目的白痴，完全察覺不到周圍的環境。

這本來沒什麼，但就像規定交響樂團的生產力受限於無法自動化的部分一樣——無論你的票務系統變得多麼高效，你都無法比貝多芬預期的速度更快地演奏貝多芬弦樂四重奏——同樣地，「自動化實驗室」的生產力受限於仍需手動的部分。一台 Hamilton 可以以超人的速度移液，但如果研究生仍然必須把板子從 Hamilton 搬到孵箱，實驗室的吞吐量就會受限於研究生走路的速度。一個實際的實驗不是單個箱子，而是一連串的箱子，必須有人或物在它們之間移動材料。

現在，你可以為箱子添加額外的部件，將其無限擴展到一座小建築的大小，但進入魯布·戈德堡（Rube-Goldberg）領域會帶來一些問題，因為你創造了一個新系統，其失敗模式是每個單獨箱子失敗模式的組合爆炸。

你可能會想到一個絕妙的主意：我們能把箱子連接起來嗎？這樣，每個箱子至少能保持某種程度的獨立。如何連接？也許用某種機器人中介——一個機械研究生——將它們連結在一起，負責將板子從一個島嶼運送到下一個島嶼，開門、裝載平台，並完成構成實驗室物流工作大部分的盲目體力勞動？而且你知道，如果你仔細想想，並不需要整個研究生。他們的軀幹、腿和頭對於手頭的任務來說都是多餘的。也許我們只需要他們的雙臂，從肩膀處乾淨利落地切下，安裝在軌道上，並編程執行構成實驗室物流工作大部分的重複性物理任務。

至此，我們獨立發明了實驗室機器人研究的「機械臂」路線。這有其專門術語：當你使用機械臂和一些調度軟體將多個箱子連接在一起時，生成的系統通常被稱為「工作單元」（workcell）。

事實證明，雖然只有生命科學一個領域受益於液體處理器之類的東西，但許多其他領域也需要機械臂。因此，雖然開發箱子的責任落在我們這個領域，但機械臂受益於汽車製造、倉庫物流、半導體工廠、食品加工以及任何任務為「拿起物品、移動物品、放下物品」的行業的研發合力。這是個好消息！這意味著底層硬體——馬達、關節、控制系統——正在以生命科學單獨無法支撐的規模和速度進行改進。

讓我們考慮一種在實驗室自動化領域相當常用的機械臂：由公司製造的 UR5。它有六個自由度，臂展約 850 毫米，負載能力為 5 公斤，價格在 25,000 到 35,000 美元之間。這是一張圖片：

一旦給這個機械臂裝上握持移液器、拿起板子和點擊按鈕所需的夾具，以及在它們之間切換的能力，你的想像力就會變得瘋狂。

這樣的機器能做什麼？

箱子裡的機械臂？在機器人安裝的平台上加裝輪子，讓它能同時處理多個箱子？一切皆有可能！你可以讓它滾到孵箱前，開門，取出板子，滾到液體處理器前，裝載，等待流程結束，卸載，滾到讀板機前，依此類推，整晚不停歇，而你則在睡夢中。這就是未來的體現。

嗯，也許吧。如果這一切都是真的，為什麼實驗室裡還有真人？為什麼我們還沒把所有事情都外包給這些可愛的機械臂和一堆箱子？

大多數實驗室流程「可以」自動化，只是通常不值得自動化

如果你去問大型語言模型（LLM）關於實驗室機器人學的主題，你會發現它們整體上相當悲觀，主要是因為底層機器使用起來非常煩人。我相信了它們！特別是因為這與我所見所聞相符。例如，在我訪問過的資金雄厚的生物新創公司的實驗室中，重複出現了一個有點滑稽的現象：他們那裡放著一些巨大的液體處理器箱子，我對那些東西有多酷表示驚訝，而我的導遊卻聳聳肩說，根本沒人真正用那玩意兒。

但正如我在中所寫的那樣，事實有點複雜。

首先，我將用一大段文字解釋操作液體處理器意味著什麼。如果你已經了解，可以跳過。

首先，你必須定義你的流程（protocol）。這涉及指定你希望機器執行的每一個操作：從 A1 位置吸取 5 微升，移動到 B1 位置，分配，返回取下一個吸頭。如果你使用的是 Hamilton 的 Venus 軟體，你需要從 seq_source 移液到 seq_destination，並且必須為系統中的每個容器執行類似的操作。其次，你必須定義你的液體類別（liquid classes）。液體類別是一組參數，告訴機器人如何物理處理特定的液體：吸取速度、分配速度、吸取後的延遲、吹出體積、縮回速度，以及其他十幾個必須根據你移液的任何物質的特定流變特性進行調整的設置。水很容易處理，甘油顯然很難，你將在極其反覆的測試過程中發現你的特定液體處於光譜的哪個位置。第三，也是最後，你必須處理實際的物理設置。工作台佈局必須精確定義。每個板子、儲液槽和吸頭架都必須分配到特定位置，且這些位置必須與現實相符。孔位的尺寸、邊緣的高度、體積都必須在軟體中準確詳述。如果你使用的板子來自與預設庫不同的供應商，你可能需要創建自定義實驗器具定義。

而且在任何時候，機器仍可能失敗，因為吸頭未能拿起、液位檢測儀出現假陰性、某處堵塞或其他任何原因。

為了幫助你度過這段險惡的旅程，Hamilton 以其無限的恩慈提供研討會來教你如何使用這台機器，。

是的，這很煩人，特別是如果你將其與手動移液相比。在手動移液中，受過訓練的研究人員拿起移液器，吸取液體，觀察它進入吸頭，如果感覺不對勁就本能地調整，分配到目標孔位，然後繼續。整個操作大約需要十五秒。也許研究人員會對此感到非常厭煩，動作不會特別快，但如果你把足夠多的人聚集在一起，稱之為研究生或助研（RA）職位，你就可以在完全不碰機器人的情況下擴大相當大的規模。通常情況下，這不僅是更有效的選擇，也是更便宜的選擇。

但這裡有一個非常有趣的細微差別：如果任務值得自動化，那麼自動化它其實並不是什麼大不了的事。

從與自動化工程師的交談中，我有一種明顯的感覺：如果我們的實驗室裡有無數的自動化工程師（以及告知他們要求的科學家），那麼普通濕實驗室中的幾乎所有事情都有可能實現自動化。畢竟，離心機、孵箱等都是與自動化相容的！而且我採訪過的工程師實際上並不那麼介意調整箱子和機械臂的繁瑣過程。是的，調整流程可能很困難，但這通常是一個「幾小時內可解決」的問題。在處理與自動化工程師以前見過的流程幾乎沒有相似之處的極端情況下，可能需要幾週時間，但也就僅此而已。

那麼問題出在哪裡？

大多數流程根本沒有運行足夠多次，不足以證明前期投資的合理性。

假設一名自動化工程師需要 40 小時才能完全調好一個新流程，這對於中等複雜程度的任務來說是一個合理的估計。以工程師每小時 100 美元的負擔成本計算，僅僅為了讓它運作就需要 4,000 美元。現在，如果你在下個月要以「完全相同」的方式運行這個流程一萬次，那麼這 4,000 美元分攤到每次運行僅為 40 美分。微不足道！而且，這可能幾乎不可能僅靠人力完成，所以儘管自動化吧。但如果你只打算運行五十次？僅設置成本每次運行就高達 80 美元，那還不如直接找個人來做。

這顯然是極大的簡化。即使濕實驗室任務可以「自動化」，大多數箱子/機械臂仍需要「一點點」看管。但儘管如此！在自動化工程師眼中，機器人容易解決的問題與機器人難以解決的問題之間的界限，與具體的動作/行為/流程關係較小，而與「我會運行這個很多次」還是「我只會運行這個一次」關係大得多。

而大多數實驗室的大多數流程都屬於後者。研究本質上是探索性的。你運行一個實驗，查看結果，意識到需要更改某些內容，然後運行一個不同的實驗。有些實驗室確實以非常「適合機器人」的方式運作，他們的大部分工作字面上就是「用 X 篩選 Y」，然後寫一篇關於結果的論文。他們可以愉快地自動化一切，因為即使他們的工作發生了一些微小的變化，也與（例如）他們之前對液體處理器中液體類別的假設足夠相似。

但許多團隊並非如此運作，可能是因為他們正在進行種類繁多的不同實驗，或者因為他們的工作是迭代的，他們這週運行的流程與下週運行的流程只有微弱的聯繫，或者其他原因。

那麼，如何改進這一點？我們如何才能到達一個自動化極大化的世界？

你可以透過改進轉譯層、硬體層或智慧層來提升實驗室機器人技術

對於在該領域工作的人來說，答案非常明顯：我們必須降低與機器人系統對接所需的活化能。但是，雖然大家似乎大多同意這一點，但對於這種未來如何實現的變革理論卻各不相同。在與十幾個人交談後，似乎存在三個意識形態陣營，每個陣營都提出了自己的解決方案。

但在繼續之前，我想先澄清一點。為了幫助解釋每種意識形態，我會列舉一些感覺屬於該意識形態的公司，而這些分類略顯牽強。事實上，它們都略微融合、混合並相互交錯。雖然在我將它們歸入的陣營中，它們在哲學上似乎是一致的，但你應該記住，我只是試圖在一個非常混亂的領域上覆蓋一張整潔的地圖。

第一個陣營是最簡單的修復：在人類想要什麼與機器能做什麼之間建立更好的轉譯層。換句話說，能夠自動將為具有雙手、眼睛和常識的聰明人類設計的流程，轉換為非常靈活但非常笨拙的機器人可以想像完成的任務。換句話說，自動化工程師不需要花四十個小時來弄清楚這一點，而可能只需要一個小時，甚至可能只要一分鐘。

這是三家值得注意的新創公司的觀點：、和。

於 2011 年在倫敦成立，或許是最早認真對待這一點的公司。他們開發了 Antha，這本質上是一種與設備無關的編程語言，也就是說，用 Antha 編寫的流程可以在 Hamilton、Tecan 或 Gilson 上運行而無需修改，因為抽象層處理了轉譯。你只需拖放你的工作流程，系統就會計算出液體類別和工作台佈局，然後你就可以回家，讓機器人去移液。

於 2024 年年中推出，。它最初並不是作為科學家與機器人之間的轉譯層，而是作為科學家與自動化工程師之間的轉譯層。他們的軟體使用 LLM 將科學家編寫的自然語言流程（包含所有隱含假設、缺失參數和必須填補的內容）轉換為自動化團隊可以使用的結構化、一致的格式。但從那以後，該團隊擴展了其範圍，允許這些自動生成的流程（以及對其進行的修改）直接在任意箱子和機械臂上運行，並配合驗證檢查以確保流程在物理上確實可行。

是這三者中最年輕的，於 2024 年底宣布，其運作的抽象層級比 Briefly 和 Synthace 更高。用戶不需要編寫板子之間轉移的命令，而是透過描述高層級動作（如組合試劑或應用離心等轉換）來定義實驗。然後，他們指定該次運行的樣本、變量、條件和對照。從這種意圖層級的描述中，Tetsuwan 完全編譯成機器人就緒的代碼，自動做出所有困難的下游工藝工程決策，包括預混（mastermixing）、體積縮放、死體積、板子佈局、實驗器具、調度和液體處理策略。其結果可由負責該過程的科學家完全編輯，允許他們指定對成本、速度和準確性權衡的偏好。

這就是第一個陣營。

第二個陣營也承認轉譯層必須改進，但認為物理基礎設施將是其中的重要組成部分。這是一個奇怪的類別，因為我不認為這個陣營是在建造根本上新穎的箱子或機械臂（例如），而是在建造將現有箱子和機械臂縫合在一起的、物理上可觸及的「東西」，使之成為大於其各部分總和的整體。

這種哲學的精髓可以從兩家特定公司所建造的東西中看出：和。

Automata 有點令人困惑，但這是我解釋他們業務的最佳嘗試：他們是一個「垂直整合的實驗室自動化平台，由模組化機器人工作台、調度引擎和數據後端組成的服務」企業。他們還將這種服務的物理實現稱為「LINQ 工作台」，其設計旨在模擬傳統實驗室工作台的大小和形狀，以便在無需重大翻修的情況下放入現有的實驗室空間。它使用機器人臂和傳輸層將儀器機器人化地連接起來，並建立了一個磁懸浮系統，用於在工作台上高速多向傳輸板子。系統上的軟體處理工作流程創建、調度、錯誤處理和數據管理。對於弄清楚他們到底為客戶做了什麼非常有啟發性。

當然還有 Ginkgo。是的，對於熟悉其過往歷史的人來說，Ginkgo 是一個輕微的迷因過敏原，但我確實鼓勵你觀看他們。非常精彩！該演示的目的是推廣 Ginkgo 的實驗室自動化解決方案——，簡稱 RACs——但也為了解建立更好的實驗室自動化的痛點提供了一個不錯的視角。RACs 到底是什麼？基本上是一個大型、模組化、標準化的推車，可以插入箱子（及其他東西），並直接安裝了一個機械臂：

隨附的軟體（）可以幫助你使用機器，但他們的重點似乎是以硬體為中心。

這是 Ginkgo 的主要自動化策略，儘管 RACs 和調度軟體實際上，後來被 Ginkgo 收購。而且，就在前幾天，他們透過展示了這種以硬體為中心的特性：跨越六個迭代週期測試了 36,000 個條件，優化了無細胞蛋白質合成成本。

此外，每個 RAC 都包含一個傳輸軌道，使得它們可以像菊花鏈一樣連接在一起，以防你需要多個儀器來運行特定的實驗。

這就是第二個陣營。

第三個也是最後一個陣營認為，未來在於用更高程度的智慧來增強現有系統。這與轉譯陣營的不同之處在於，轉譯陣營主要關注問題的「輸入」端——在執行開始前將人類意圖轉換為機器人可讀的指令——而智慧陣營則關注執行「期間」發生的事情。

這是最新的一個群體，這裡有兩家公司感覺最相關：和。

是這裡最資深的參與者，成立於 2022 年，。他們的論點是，你已經有了機械臂，已經有了箱子，兩者在各自領域都做得很好。實際上，你最需要的是「智慧」。是的，也許轉譯層（如第一個陣營所建）很重要，但 Medra 的論點更全面。機載機器人智慧不僅會使轉譯更容易，還能實現錯誤恢復、適應新情況、與任意機器對接（甚至是那些原本設計為手動操作的機器）、自主優化流程、直接設計自己的實驗，並通常能「處理」使實驗室工作對典型、更脆弱的自動化具有如此強抵抗力的上千種微小變化。

是我們最後一家公司，本質上與 Medra 非常相似，但有一個我覺得非常可愛的特點：他們對智慧的使用不一定是為了讓機器人更強大，而是為了讓它們更具「容錯性」。2014 年，成立，試圖透過讓硬體變得便宜來實現自動化民主化，但便宜的硬體會帶來便宜硬體的問題——吸頭安裝不當、位置漂移、校準出錯。Zeon 的賭注是，足夠好的感知和智慧可以補償這些缺點。如果機器人能「看到」吸頭沒有安裝好並相應調整，你就不再需要吸頭每次都安裝完美。如果機器人能「檢測」到其定位偏差並實時修正，你就不再需要亞毫米公差的精密加工。在這種框架下，智慧不是讓機器人做得更多的一種方式，而是讓它們能使用更差機器的一種方式。而更差的機器意味著更便宜的機器，這意味著更多的實驗室負擔得起自動化，這意味著可以銷售更多的 Zeon 產品（無論是以軟體還是軟體+硬體的形式）。

好了，就是這樣。這就是三個陣營。

現在明顯的問題是：哪一個是正確的？

最細緻的看法是：全部都是。至少在某種程度上顯而易見的是，所有可能的未來最終都會對所有這些陣營有所需求，而蓬勃發展的公司將是那些能夠正確識別在哪個時間點、哪個客戶的束縛層在哪裡的公司。

但這裡有一個對每一方的更具主見的看法：

在我看來，轉譯層陣營與這個問題的關係最為誠實。他們沒有承諾讓機器人變得更聰明或賣給你更好的硬體，而是承諾讓現有的機器人更容易溝通，從而使自動化流程所需的活化能降得足夠低，即使是不常運行的實驗也能成為可行的自動化候選對象。如果我們接受流程構建問題實際上是增加自動化規模的真正根本瓶頸，我們也應該相信 Tetsuwan/Synthace/Briefly 這些公司擁有最好的解決方案。

你可以想像這裡一個相當簡單的失敗案例是前沿模型 LLM 變得無限強大，消除了對這些團隊正在構建的自定義套件的需求，吸收了原本屬於他們的市場需求。明確地說，我並不真正相信這會發生，原因與我認為和會存在很長時間一樣；這些工具很複雜，構建複雜工具需要專注，而前沿模型實驗室並不專注於這些特定的用例。重要的是，構成轉譯的許多問題最好透過確定性手段解決（工作台和板子佈局、選擇液體類別參數、移液策略、體積計算的數學）。Opus 8 或其他模型可能很棒，也是轉譯解決方案的重要組成部分，但它可能不應該被用作計算器。

硬體陣營很耐人尋味，因為，你知道，如果目標是「實現實驗室自動化民主化」，它實際上並沒有太大意義。 Automata 的 LINQ 工作台和 Ginkgo 的 RACs 是昂貴的——極其昂貴！——垂直整合系統。它們為那些已經跨越了自動化合理化量化門檻的組織提供了「更好」的自動化。但它們實際上並沒有降低那個門檻，也沒有增加先前系統無法做到的新功能。如果有的話，它們反而提高了門檻！你需要更高的吞吐量才能證明資本支出的合理性！那麼，他們是不是完全押錯了注？對於某種形式的純粹主義者來說，是的。

但考慮一下這些公司實際追逐的客戶群。 Automata 和 Ginkgo 都在向大型製藥公司和工業生物技術集團推銷他們的解決方案。換句話說，他們主要銷售的對象不是苦哈哈的學術實驗室，而是每週運行數千次實驗、已經配備自動化團隊、且在多年前就已經跨越了量化門檻的組織。他們的問題早已不再是「我們應該自動化嗎？」，而是進入了「我們如何與值得信賴的機構顧問合作，以擴展到更大的程度？」的領域。對這些人來說，LINQ 和 RACs 可能非常有意義！但有一個有趣的論點是，從長遠來看，這些公司最終可能會以一種迂迴的方式實現自動化的民主化。我們將在下一節中詳細討論這一點。

最後，智慧陣營。我們可以對彼此誠實：它具有某種光澤。相信「智慧就是你所需要的一切」是很吸引人的。事實上，今年早些時候訪問辦公室觀察他們的機器人飛舞，是我坐下來完成這篇文章所需的催化劑。因為一個機器人臂能從離心機中甩出東西，放入板中，打開蓋子，並將其轉移到另一個小瓶中，這難道不瘋狂嗎？也許一點也不瘋狂，也許這實際上完全在機器人技術輕鬆完成的範圍內，但這正是這篇文章想要發現的。但在與盡可能多的人交談後，我得出了一個比「智慧好」或「智慧尚早」更細緻的觀點。智慧論點實際上存在兩個版本。近期版本是關於感知和錯誤恢復：機器人看到吸頭沒裝好並調整，檢測到定位漂移並實時修正，識別出吸取失敗並在整個運行毀掉之前重試。這感覺非常接近實現！遠期版本則更宏大，你可以信任機器人處理過程中的每一步，你向機器人展示一段研究生執行流程的影片，它就能照做，甚至可能優化它，甚至可能設計自己的實驗——機載智慧賦予機器人完成任何事情所需的所有意識和靈巧性。

這個未來很可能會到來！這不是一個不合理的賭注。但是，從我的對話來看，它似乎還相當遙遠。是的，很容易看到產出的結果並得出事情接近解決的結論，但實驗室工作與大多數這些機器人基礎模型正在學習的東西相比是非常「分佈外（out-of-distribution）」的（而且它們學到的東西對於它們自己更簡單的摺衣服任務來說往往「仍然」不夠！）。我想小心不要誇大這一點，因為這種更強大的智慧可能會比任何人預想的都要快到來，所以也許這個觀點在一年內就會過時。

等等！等等！在你將上述三段內容視為對「公司」而非「哲學」的陳述之前，你應該回想一下我在本節第二段所說的話：這些公司（我為本文採訪了其中許多創辦人）中沒有一家教條到「完全」只信奉轉譯/硬體/智慧。他們在公司運作的顯性偏好中可能「傾向於」那個方向，但他們對每個陣營都持同情態度，而且幾乎所有人都有最終進入目前所佔據領域之外的沙盒的計劃。

說到這，這些公司到底是怎麼賺錢的？

殊途同歸：Transcriptic 模式

進化生物學中有一種現象叫做，指的是自然界不斷地意外發明出螃蟹。寄居蟹、帝王蟹、瓷蟹；其中許多在親緣關係上並不接近，但它們都獨立地演化出了相同的身體結構，因為顯然長得像螃蟹是一個如此不尋常的好主意，以至於進化忍不住一做再做。它就是停不下來。我向各位提議，實驗室機器人領域也發生著幾乎相同的現象，即每家新創公司，無論其論點為何，都會緩慢而不可阻擋地匯聚到同一種形式。

變成。

Transcriptic 由於 2012 年創立（是的，就是那個共同創立了，後來又創立了的 Max）。公司的論點很簡單：我們將建立一個塞滿箱子、機械臂和整合它們的軟體的設施，並邀請客戶透過網頁界面與它們互動，以結構化格式指定實驗，然後在設施的某個地方，實驗室將自主執行你的意志（同時由人類填補空缺）。換句話說，一個「雲端實驗室」。

好處是銷售話術基本上涵蓋了整個濕實驗室市場：不要建立自己的實驗室，只需租用我們實驗室裡的儀器！有了足夠好的自動化和使用該自動化的軟體，這的潛在市場規模（TAM）是合約研究組織（CRO）的超集。

明顯的缺點是，要把這件事做好真的、真的很難。Transcriptic 後來與自動顯微鏡新創公司「3Scan」合併，更名為「Strateos」，並於 2023 年倒閉。這告訴了我們這種模式的難度。話雖如此， (ECL) 是一家在 Transcriptic 之後兩年出現的新創公司，提供類似的產品，而且他們堅持了下來，在過去兩年中保持著約 170 名員工的穩定規模。然而，雖然他們表面上「是」一家雲端實驗室，但他們並不像 Transcriptic 那樣是理想化的雲端實驗室，即任何人都可以登錄並運行任何他們想要的實驗；ECL 的界面被一個聯繫頁面把關著。

儘管讓它運作在經驗上很困難，但走上 Transcriptic 的道路似乎是幾乎任何足夠好的實驗室自動化策略的邏輯結論。

為什麼？

在這裡，我將引用撰寫的一篇精彩文章「」，我強烈建議你全文閱讀。在這篇文章中，Keoni 討論了「許多」事情，但我發現最有趣的是他對批量實驗獲得的巨大經濟效率的評論：

在生物技術領域，機器人的利用率低得令人羞恥。去參觀一些生物實驗室——無論是學術、工業還是新創公司——你肯定會看到機器人就坐在那裡，無所事事，積滿灰塵……

將許多實驗聚集在一個中心化設施中的好處是，我們可以讓機器人保持忙碌。即使你只想運行 1 個流程，可能還有其他 95 個人也想運行那 1 個流程——在一起，你們可以優化填滿 1 個機器人的工作空間。中心化系統讓你可以在許多流程中做到這一點——否則，你需要在實驗室之間運送樣本，這太麻煩了。雖然最後一步，測試你的特定假設，可能仍需要定制化的關注和專用的機器人時間，但繁重的工作——菌株準備、驗證等——可以批量化和自動化。

還有一段我認為非常值得細品的文字（粗體為我所加）：

那麼，關鍵在於將這些機器人推向越來越接近生物學原始材料端的項目和流程，以便你可以在這些基礎上構建其他一切。例如，PCR 酶、聚合酶被廣泛使用，但如果你購買專利酶，價格會非常昂貴。另一方面，你可以非常便宜地為自己生產。如果你利用機器人來生產酶，你就可以在所有其他實驗中使用這種酶，從而降低這些實驗的成本。原因很簡單：沒有中間商，你的成本就接近化學 + 能源 + 勞動力成本。十億年的進化使得這相對於其他行業來說非常便宜。你只需要從底層開始向上移動。

這產生了一個非常整潔的邏輯鏈條！

如果你接受實驗室中心化（即雲端實驗室）意味著你可以最有效地使用實驗室機器人——這感覺是一個相當無可爭議的論點——這「也」意味著你越深入這一點，你就越能向上游進行垂直整合。如果你運行的實驗足夠多，以至於你的機器人不斷轟鳴，你就可以證明自己生產試劑的合理性。如果你自己生產試劑，你的單次實驗成本就會下降。如果你的單次實驗成本下降，你就可以提供更低的價格。如果你提供更低的價格，你就會吸引更多的需求。如果你吸引更多的需求，你的機器人就會保持更忙碌。如果你的機器人保持更忙碌，你就可以證明生產更多自身投入品的合理性。依此類推，無止境地循環，直到你吞噬整個市場，生物學的遊戲對每個人來說都變得異常便宜且容易。

作為一個例子，Synbio25 的文章，顯示了未優化和優化設置（指：內部生產酶 + 細胞並使用最大尺寸的測序流動槽）之間的質體生產成本差異。便宜了兩倍多！

我在這裡是不是太教條了？肯定還有其他可以運作的商業模式。

或許在未來十年是這樣！但在足夠長的時間跨度內，感覺最終一切都會變成雲端實驗室。除此之外似乎沒有什麼真正行得通，或者即使行得通，它們的潛力最終也是受限的，不是「風險投資可擴展」的，也就是說它們可能可行，但你最好不要拿錢來實現它。銷售軟體意味著你很容易被複製，作為 CRO 意味著你最終只提供雲端實驗室所能提供服務的一個子集，而自動化諮詢的潛力有限。桌面上最好的潛在替代方案是成為像 Thermo-Fisher 這樣的實體，向那些想把事情留在內部的人銷售箱子、機械臂和試劑。但現實中會有多少這樣的人呢？隨著雲端實驗室變得越來越值得信賴，同時生物技術業務（可能）變得，使得證明自身實驗室支出的合理性變得越來越困難，還能剩下多少堅持者？

但短期內情況的演變可能會有所不同。因為雖然 Transcriptic 今天不存在了，但 Emerald Cloud Labs 還在！然而，他們現在不一定是一個巨頭。截至今日，我們存在於一種煉獄般的過渡狀態，既沒有能力也沒有信任去完全依賴雲端實驗室。但它正在到來。你可以看到它出現在地平線上。所以有趣的問題是：誰最能從未來幾年的浪潮中受益？

在這裡，硬體陣營的賭注在回想起來變得更有說服力。是的，Automata 和 Ginkgo 正在向大型製藥公司銷售昂貴的硬體系統。但你可以看到至少 Ginkgo 嘗試透過來親自實踐實驗室中心化。目前，它在功能上是一個 CRO，提供一系列選項。但接下來會發生什麼？我「個人」不知道 RACs 對於高混合（指：高度異質的實驗室實驗）的設置有多容易，但我從人們那裡得到的普遍感覺是，它們確實更容易。如果這是真的，那麼 Ginkgo 的策略看起來就不再像是「我們向製藥公司銷售昂貴的硬體」，而更像是「我們正在建設最終將成為主導雲端實驗室的基礎設施，而我們同時讓製藥公司為研發買單」。如果你換個角度看，這實際上相當聰明。他們能成功嗎？我不知道！對於 Automata 也可以說類似的話；收集了十年關於自動化「實際」如何使用的信息的機構，可能非常有能力最終運營自己的雲端實驗室，因為他們已經——用別人的錢——精確地學到了工作流程在哪裡崩潰以及如何修復它們。

其他群體呢？智慧和轉譯層群體在這個過渡期能做什麼？

有很多可能性。最簡單的一個是被收購。如果終局是雲端實驗室，而雲端實驗室需要智慧和轉譯層才能運作，那麼這些新創公司最直接的路徑就是建立足夠有價值的東西，讓一家待命的雲端實驗室（如 Ginkgo 或 Automata 本身）決定購買而不是自己開發。同樣地，這些新創公司可以成為「每個」雲端實驗室都依賴的「鏟子和鎬」供應商。

但你也可以想像更具雄心的未來。記住：硬體是可以買到的。Ginkgo 的 RACs、Hamilton 的液體處理器——這些都不是專有到足以阻止一家資金充足的準雲端實驗室簡單購買甚至自己製造的程度。硬體是一種商品，或者至少正在變成一種商品。而「不是」商品的是運行它的智慧和使其易於使用的轉譯層。所以你可以講一個故事：硬體公司贏得了短期戰鬥——累積收入、籌集資金、建立系統——卻在長期戰爭中輸給了轉譯/智慧群體，後者購買現成的硬體，轉而以軟體進行差異化競爭。

當然，這裡的反面論點是，硬體公司可以簡單地利用他們的收入優勢自己開發軟體。

我們最終會看到結果。比我更聰明的人正在競技場中摸索，我非常好奇他們會走到哪裡。

這一節很長，但我們還有最後一個重要的問題要問：為什麼第一代雲端實驗室做得不太好？僅僅是技術問題嗎？他們只是太早了嗎？根據我採訪的自動化工程師，這不太可能；那時的機器與現在的機器並沒有「巨大」的差異。難道責任在於這些公司擁有的轉譯層嗎？看起來也不像；正如 Brian Naughton 在中所記錄的，使用 Transcriptic 的服務來創建蛋白質，看起來並沒那麼糟糕。

還能有什麼問題？

提供的一個觀點我覺得很有趣。問題不在於這些公司太早，而在於他們，正因為他們太通用，他們永遠無法讓任何單一的工作流程變得足夠無摩擦以產生影響。

在 Shelby 那篇貼文的評論中，：你必須從 New England Biolabs 購買自己的聚合酶，運送到他們的設施，支付試管轉換費用，然後「再」實施你想要運行的任何克隆和測序管道。當你協調完這一切時，你還不如自己動手。自動化就在那裡！機器人準備就緒！但因為 Transcriptic 一開始就嘗試「生物技術領域的 AWS」策略，他們把物流上的麻煩都甩給了用戶。Brian Naughton 在他的部落格文章中也提到，修復實驗問題很煩人：「遠程調試流程很困難且可能很昂貴——特別是區分是你的 bug 還是 Transcriptic 的 bug。」

取悅客戶很重要！將此與相比。他們（主要）只做一件事：質體 DNA 測序。你寄給他們一個管子，他們測序，你得到結果。就是這樣，你不需要協調，整個物流堆疊都是他們的問題。這導致他們完全統治了那個市場，並緩慢地擴展到 RNA-seq、宏基因組學和 AAV 測序。事實上，如果我們特別大膽地想像：有一種真實的可能性是，我們到目前為止討論的所有公司最終都沒有開啟未來的雲端實驗室，相反，這個獎項將授予 Plasmidsaurus 和其他類似 Plasmidsaurus 形式的 CRO，一次擴展一個垂直領域。

無論如何，這重新定義了之前關於哪個陣營會獲勝的問題。也許這不僅僅是關於轉譯層與硬體與智慧的對抗。而是關於誰能為一組高價值工作流程解決物流問題，然後利用那個灘頭陣地進行擴張。

結論

這個領域非常迷人，它的未來與許多有趣的焦慮交織在一起。中國正在吞噬我們的臨床前研發，實驗室機器人會有幫助嗎？前沿實驗室模型正在呈指數級變好，實驗室機器人會利用這種進步來執行自主科學嗎？這兩者以及更多主題都值得再花幾千字去探討。然而，這篇文章已經很長了，所以我把這些主題留給其他人去深入報導。

但最後還有一件事我想討論。那就是實驗室機器人、雲端實驗室以及與之相關的一切，實際上並不會從根本上改變藥物研發面臨的更廣泛問題。

你可能猜到這要往哪裡發展了。是時候讀一下 Jack Scannell 的論文了。

在 Jack 2022 年發表於《Nature Reviews》的文章「」中，他和他的合著者提出了一個簡單的論點：在藥物研發中最重要的不是你能測試多少候選藥物，而是你評估這些候選藥物的工具與人類實際情況的相關性如何。他們稱之為「預測有效性（predictive validity）」，並將其定義為你使用的任何決策工具（細胞分析、動物模型、直覺）的輸出與實際患者臨床效用之間的相關係數。主要的啟示是，他們證明了這種相關性 0.1 的絕對變化——例如從 0.5 提高到 0.6——對研發管道的正向預測價值的影響，比篩選十倍甚至一百倍以上的候選藥物還要大。

他們用一個有趣的歷史例子來說明這一點：在 1930 年代，Gerhard Domagk 在活體小鼠身上篩選了幾百種染料對抗鏈球菌，並發現了磺胺類抗生素。七十年後，葛蘭素史克（GSK）運行了 67 次高通量篩選活動，每次針對分離的細菌蛋白靶點測試多達 500,000 種化合物，結果發現值得進行臨床試驗的候選藥物精確為零。怎麼會這樣？當然是因為小鼠是比篩選更好的決策工具，因為它們捕捉到了實際起作用的體內生物學。

實驗室機器人通常的用例是什麼？它被定位為吞吐量倍增器。它讓你更快地運行更多實驗。而 Scannell 指出，沿著吞吐量軸移動——透過相同的分析方法運行 10 倍或 100 倍以上的實驗——與即使是分析質量的適度改進相比，其效果出奇地平庸。考慮到我們臨床試驗中藥物的失敗率（），這些分析方法在經驗上顯然不是特別好。

但明確地說，這不是一個反對自動化的觀點。這是對自動化應該用於什麼的重新定義。

感覺未來的實驗室機器人將帶給我們的價值，幾乎肯定不在於溫和地接管現有的工作流程並親自運行它們。而在於實現不同的實驗，更「好」的實驗，具有更高預測有效性的實驗，且其規模在沒有自動化的情況下是不可能實現的。這不需要對「自主科學」或類似的東西未來可能帶來的東西抱持任何懷疑！論點相當平凡。

在同一篇 Scannell 的論文中，他認為公司應該對其決策工具進行藥理學校準，也就是說，透過他們的分析方法運行一組已知藥物及其已知臨床結果，以衡量該分析方法是否真的能區分有效和無效。幾乎沒人這樣做，因為這既昂貴又乏味，而且既不產生論文也不產生專利。但如果單次實驗成本降得足夠低，如果不再需要昂貴的人手來執行，校準就變得具有經濟合理性，行業就可以從「假設」給定的分析方法具有預測性轉向「衡量」它是否具有預測性。同樣地，，情況可能是許多原本「正常」的分析方法產生的結果是毫無用處的，完全是因為它們是由個人研究人員手動執行的，技術略有不同，實驗室條件略有不同，且沒有驗證試劑所需的儀器。足夠好的雲端自動化可以使這些分析方法擺脫對個人雙手的依賴，並允許大規模可靠地執行更高標準的實驗。

換句話說：如果遵循趨勢線，如果單次實驗成本繼續下降，如果轉譯層不斷改進，如果雲端實驗室不斷中心化、垂直整合並進一步壓低價格，那麼在不久的將來，做那些每個人都知道「應該」做但目前無法證明其合理性的事情，就會變得合乎理性。僅憑這一點，儘管相對平淡，可能就足以改變藥物研發作為一門學科的實踐方式。

Heuristics for Lab Robotics and Its Future Trajectory

前言

實驗室機器人學的啟發式方法

有箱型機器人，也有機械臂機器人

大多數實驗室流程「可以」自動化，只是通常不值得自動化

你可以透過改進轉譯層、硬體層或智慧層來提升實驗室機器人技術

殊途同歸：Transcriptic 模式

結論