newsence
來源篩選

Thin Is In

stratechery

Thick clients were the dominant form of device throughout the PC and mobile era; in an AI world, however, thin clients make much more sense.

newsence

瘦客戶端時代回歸

stratechery
11 天前

AI 生成摘要

在個人電腦與行動裝置時代,厚客戶端是主要的裝置形式;然而在人工智慧的世界中,瘦客戶端反而更具合理性。

瘦客戶端正流行 – Stratechery by Ben Thompson

Image

Stratechery Plus

了解更多會員論壇

Image

Stratechery Plus

了解更多會員論壇

最新播客

Image

瘦客戶端正流行

收聽播客

收聽本文內容:

在計算機發展的早期,並沒有關於「胖客戶端」(thick clients)與「瘦客戶端」(thin clients)之爭:

Image

當電腦的大小如同一間房間時,根本沒有所謂的客戶端:你預約時間或提交作業,然後在輪到你時拿回結果。然而幾年後,以顯示器和鍵盤形式出現的瘦客戶端問世了:

Image

這張圖片中並沒有電腦;相反地,這是一個連接到大型主機(mainframe)的終端機。這就是為什麼它被稱為「瘦」客戶端:它只是一個介面,所有的運算都在其他地方(即另一個房間)進行。然而到了 1980 年代,「胖」客戶端以個人電腦(PC)的形式成為運算的主流。你所有的輸入/輸出(I/O)和運算都封裝在一起:你在連接到 PC 的鍵盤上打字,PC 則輸出到你面前的顯示器。

Image

十年後,昇陽電腦(Sun Microsystems)特別嘗試推廣「網路電腦」(network computer)的概念:

Image

這是一種實際上沒有本地作業系統的設備;你透過瀏覽器執行 Java 應用程式和 Java Applet,這些程式在運作時才從中央伺服器下載。昇陽的說法是網路電腦會更便宜且更容易管理,但 PC 降價的速度如此之快,以至於這種價值主張迅速消失,且 Windows 的統治地位使得它成為網路管理員唯一想處理的平台。胖客戶端贏了,而且贏得徹徹底底。

如果你想為瘦客戶端辯護,你可以辯稱行動裝置是一種混合體;畢竟,行動裝置的興起受益於並推動了雲端的興起:手機上幾乎每個應用程式都會連接到某處的伺服器。然而,行動裝置本質上仍是胖客戶端:它們本身就是功能強大的電腦,雖然連接到伺服器肯定大有裨益,但在不連網的情況下依然有用。關鍵在於,伺服器組件僅提供數據:實際的介面完全是本地的。

你也可以對 SaaS 應用程式提出同樣的論點:一方面,是的,它們在雲端運作且通常透過瀏覽器訪問;另一方面,現代瀏覽器基本上本身就是一個作業系統,而使 SaaS 應用程式成為可能的創新,在於互動式網頁應用程式可以被下載並在本地執行。誠然,這與昇陽的願景相去不遠(儘管最終使用的語言是 JavaScript 而非 Java),但你仍然需要大量的本地運算能力來讓這些應用程式運作。

AI 對決 UI

多年來,胖瘦客戶端之爭感覺就像是陳年往事;這顯示了胖客戶端的勝利是多麼具有決定性。然而,關於 AI 令人著迷的一點是,瘦客戶端的概念不僅回來了,而且還佔據了主導地位。

最明顯的例子就是大多數人與 AI 互動的介面:對話(chat)。除了文本框和提交按鈕之外,沒有其他重要的 UI;當你點擊該按鈕時,文本被發送到數據中心,所有的運算都在那裡進行,然後答案會傳回給你。答案的質量或整體的體驗很大程度上與你使用的設備無關:它可以是 PC 上的瀏覽器、高端智慧型手機上的 App,或者是你能找到的最便宜的 Android 設備。該設備可以是汽車、眼鏡,或僅僅是一個耳機。真正重要的本地運算不是處理能力,而是連通性。

這種互動範式實際上看起來非常像大型主機電腦的互動範式:在終端機輸入文本,發送到電腦,然後得到回覆。然而,與大型主機終端不同的是,用戶不需要知道一組確定的指令;你只需要用平實的語言說出你想要的,電腦就能理解。本地運算能力沒有壓力去驅動一個讓電腦更容易使用的用戶介面,因為更複雜的用戶介面反而會人為地限制 AI 的能力。

Nicolas Bustamante 在一篇關於 AI 世界中垂直軟體前景的 X 文章中解釋了為什麼這具有威脅性:

當介面是自然語言對話時,多年的肌肉記憶變得毫無價值。支撐每年每席位 2.5 萬美元定價的切換成本消失了。對於許多垂直軟體公司來說,介面就是價值的核心。底層數據是授權的、公開的或半商品化的。支撐溢價的是建立在這些數據之上的工作流。那樣的時代結束了。

Bustamante 的文章不僅僅關於對話介面,但我認為關於用戶介面的觀點非常深刻:與其說 AI 用戶介面有所不同,不如說對於許多使用場景而言,它們基本上不存在。

當你考慮 AI 的下一波大浪潮:代理(agents)時,這一點就更清晰了。代理的重點不是替你使用電腦,而是完成特定任務。從請求到結果之間的一切,至少在理論上,對用戶來說應該是隱形的。這是將瘦客戶端概念推向極致:你不僅不需要任何本地運算來從聊天機器人那裡獲得答案,你也不需要任何本地運算來完成實際工作。伺服器上的 AI 搞定一切。

當然,大多數運作良好的代理工作流都遵循一條理想路徑,但在處理更複雜的情況或邊緣案例時會遇到困難。不過,隨著模型變得更好,以及運行它們的芯片能力提升(特別是在內存方面),這種情況正在迅速改變。在推理方面,內存不僅對於保存模型權重很重要,對於保留當前任務的上下文(context)也至關重要。

到目前為止,最關鍵的內存主要是附著在 GPU 上的高頻寬內存(HBM),但未來的架構將把上下文卸載到快閃記憶體(flash storage)。同時,管理代理最適合使用 CPU,而 CPU 本身需要大量的 DRAM。簡而言之,我們擁有的運算量和運算能力仍然不夠好;然而,一旦跨過那個門檻,需求只會變得更加強勁。

這些因素的結合只會加劇瘦客戶端範式的統治地位:

是的,你可以在本地運行大型語言模型,但你在模型大小、上下文窗口大小和速度上都會受到限制。與此同時,擁有更優越上下文窗口和更快速度的卓越模型不需要你跑去電腦實驗室;只需從任何地方連接到網路即可。請注意,這一現實甚至適用於像 OpenClaw 這樣令人驚嘆的新本地工具:OpenClaw 是一個在本地運行的編排層,但實際的 AI 推理在預設情況下以及對大多數用戶而言,都是由雲端模型完成的。

換句話說,為了具備競爭力,本地推理需要結合更小但能力足夠的模型、上下文管理上的突破,以及至關重要的——大量且極其大量的內存。最後一點可能是最大的問題所在。

內存擠出效應

摘自彭博社:

包括伊隆·馬斯克(Elon Musk)和提姆·庫克(Tim Cook)在內,越來越多的科技產業領袖正警告一場全球性危機正在醞釀:內存芯片短缺正開始打擊利潤、擾亂企業計劃,並推高從筆記型電腦、智慧型手機到汽車和數據中心等所有產品的價格——而且這種緊縮只會變得更糟……

據知情人士透露,索尼集團(Sony Group Corp.)目前正考慮將其下一代 PlayStation 遊戲機的首發時間推遲到 2028 年甚至 2029 年。這將是對其精心策劃、旨在維持硬體世代間用戶參與度戰略的一次重大打擊。其主要競爭對手任天堂(Nintendo Co.)在 2025 年新款 Switch 2 遊戲機帶動存儲卡採購後也貢獻了過剩需求,據知情人士透露,該公司也在考慮於 2026 年提高該設備的價格。索尼和任天堂的代表未回應置評請求。

一位筆記型電腦製造商經理表示,三星電子最近已開始大約每季度審查一次其內存供應合約,而以往通常是每年審查一次。據中國媒體《界面新聞》報導,包括小米、Oppo 和深圳傳音控股在內的中國智慧型手機製造商正在削減 2026 年的出貨目標,其中 Oppo 的預測降幅高達 20%。這些公司未回應置評請求。

內存短缺已經醞釀了一段時間,而且可以說是消費者真正感受到 AI 影響的地方;我在一月份針對輝達(Nvidia)在 CES 上的主題演講寫道:

CES 代表「消費電子展」(Consumer Electronics Show),雖然輝達的遊戲 GPU 得到了一些更新,但它們並不在 [輝達執行長黃仁勳] 主題演講的內容中,演講重點放在了 Vera Rubin AI 系統和自動駕駛汽車上。換句話說,儘管地點在 CES,但實際上並沒有什麼是給消費者的,因為 AI 佔據了中心舞台。就輝達而言這沒問題:Vera Rubin 的發布和其新的 Alpamayo 自動駕駛系統都是大事。然而,這象徵著 AI 對廣泛技術領域產生的影響,而這種影響將以重大方式衝擊消費電子產品。具體來說,不僅科技領域所有的能源和投資都流向了 AI,供應鏈也是如此。

過去幾個月的一個大新聞是內存成本劇烈攀升,因為主要內存製造商將重心轉向了 AI 芯片專用的高頻寬內存。這意味著其他所有東西都會變得昂貴得多:內存是幾乎所有科技相關產品中最昂貴的組件之一,考慮到該行業的競爭和商品化性質,這些成本幾乎肯定會轉嫁給最終用戶。

這種 AI 擠出動態可以說始於超大規模雲端服務商(hyperscalers),他們將越來越多的預算從購買 CPU 轉向購買 GPU,但現在這種影響正擴及到從電網電力、渦輪機到組件的所有領域,而且這種影響只會增加,對最終用戶的影響也會越來越大。換句話說,輝達可能在消費電子展上沒談論消費電子產品,但他們對該行業的影響力卻是最大的。

這種擠出效應的負面影響顯而易見;例如,我同情任何試圖組裝自己 PC 的人,但很快他們的痛苦將成為每個人的痛苦,因為所有需要 RAM 的產品價格都不可避免地會上漲。

與此同時,我認為報導中的 PlayStation 延期很有啟發性:顯然 PS5 對索尼來說已經「夠好了」,足以讓他們等待更多內存產能上線,他們可能是對的!胖客戶端——PS5 這樣的遊戲機是其中的極致代表——在硬體改進方面早已達到邊際收益遞減的點。我認為你也可以對 PC 和手機提出同樣的論點:我們已經擁有的設備對於我們想做的幾乎任何任務來說都已經綽綽有餘了。

此外,胖客戶端能力的平台期(plateau)發生的同時,由於這些完全在雲端進行的新 AI 工作流,對任何本地能力的需求正在消失。是的,AI 導致內存稀缺並讓各種個人電腦(從 PC 到手機再到遊戲機)變得更貴,這很糟糕;但它也讓這些設備變得比以往任何時候都更不重要。

當然,胖客戶端可能會捲土重來,特別是因為本地推理是「免費的」(即用戶支付自己的電費)。然而,正如我上面提到的,出於性能原因,我對短期內的本地推理持懷疑態度,而且內存緊縮將使它在可預見的未來在經濟上不可行。而且,等到本地推理成為一個可行的替代方案時,這幾年下來的路徑依賴可能已經導致許多工作流轉移到了這種新範式。

需要明確的是,這將是一個過渡期:UI 不僅僅是關於如何使用電腦,正如 Benedict Evans 在最近的一次訪談中所指出的,它還嵌入了業務運作方式的關鍵面向。特別是開放式的文本提示(prompts),對於一個經過深思熟慮、既能提示正確操作又能確保正確結果發生的 UI 按鈕來說,是一個糟糕的替代品。這就是為什麼代理領域將是值得關注的焦點:哪些工作流將從 UI 轉向 AI,從而從胖客戶端架構轉向瘦客戶端架構?現有的工作流尚待觀察;未來的工作流似乎已成必然。

分享

相關內容

Stratechery Plus

更新

John Collison 在 Cheeky Pint 播客訪談 Ben Thompson

Spotify 財報、個人化網路、AI 與聚合

亞馬遜財報、資本支出擔憂、商品化 AI

Stratechery Plus

播客

Image Image Image

Stratechery Plus

訪談

John Collison 在 Cheeky Pint 播客訪談 Ben Thompson

訪談 Benedict Evans:關於 AI 與軟體

訪談 Kalshi 執行長 Tarek Mansour:關於預測市場

Sharp Text

文章

按年份排列 Stratechery 上最受歡迎且最重要的文章。

探索 Stratechery 上的所有免費文章。

探索 Stratechery 上的所有文章。

Stratechery Plus

更新

John Collison 在 Cheeky Pint 播客訪談 Ben Thompson

Spotify 財報、個人化網路、AI 與聚合

亞馬遜財報、資本支出擔憂、商品化 AI

Stratechery Plus

播客

Image Image Image

Stratechery Plus

訪談

John Collison 在 Cheeky Pint 播客訪談 Ben Thompson

訪談 Benedict Evans:關於 AI 與軟體

訪談 Kalshi 執行長 Tarek Mansour:關於預測市場

© Stratechery LLC 2026 | 服務條款 | 隱私政策

由 WordPress 設計。由 Pressable 託管。