帶外管理,焦點所在:應對 AI 時代數據中心的複雜性、空間與規模挑戰
2025 年 6 月 23 日
作者:
Mark Bieberich
組合行銷副總裁
隨著數據中心規模和複雜性的增長,克服帶外管理(Out-of-band management)中的挑戰至關重要。Mark Bieberich 解釋了 Ciena 的數據中心帶外管理(DCOM)解決方案如何透過突破性的網路設計,簡化營運、提高擴展性,並減少空間與功耗。
從高頻寬 AI 織網(Fabrics)和 800G 乙太網路,到開放網路和共封裝光學(Co-packaged optics),當前關於數據中心網路的討論主要由高速創新所主導。這些技術正在重塑大規模運作的可能性——推動人工智慧、雲端服務交付和邊緣運算領域的突破。
然而,儘管這些話題佔據了新聞頭條並吸引了投資者的興趣,但還有另一層基礎設施在悄無聲息地支撐著每個數據中心的韌性和可操作性:帶外(OOB)管理網路。
雖然很少成為焦點,但 OOB 網路對於日常營運、災難恢復、初始設備引導(Bootstrapping)、遠端故障排除以及安全的生命週期管理至關重要——尤其是在具有分散式基礎設施的超大規模(Hyperscale)、託管(Colocation)和企業環境中。隨著數據中心網路變得更加複雜且關鍵,穩健、可擴展的 OOB 管理之重要性也隨之增加。
在 NANOG 94 大會上,Meta 展示了一種創新方法,用以應對帶外管理網路日益增長的複雜性。該解決方案是與 Ciena 密切合作開發的,反映了雙方對於在大規模環境下簡化和現代化 OOB 基礎設施的共同願景。
讓我們深入了解一下。
隨著對 AI 和雲端服務的需求加速,數據中心網路正以空前的速度擴張。但在追求更快的織網和更高密度的運算的同時,常被忽視的 OOB 管理基礎設施正面臨日益嚴峻的挑戰——其中許多挑戰已變得難以忽視。這些挑戰包括:
營運複雜性
現代數據中心可能容納數千台需要 OOB 連接的設備——包括交換機、路由器和控制台伺服器(Console servers)。管理這種龐大的擴張引入了相當大的複雜性。工程師必須在一個平行的管理平面上進行配置、設定和監控,這對於控制和恢復至關重要,但往往缺乏與生產網路相同的工具和自動化成熟度。
機架空間限制
AI 工作負載的爆炸式增長推動了在每個機架中最大化 GPU 密度的競賽。這為 OOB 基礎設施留下的物理空間極小。控制台伺服器和匯聚交換機現在必須與高價值的運算資源爭奪每一個機架單位(RU),迫使營運商重新思考如何以及在哪裡部署 OOB 功能。
銅纜過載
OOB 網路歷來依賴大量的銅纜乙太網路基礎設施來匯聚機櫃級流量。在高密度環境中,龐大的銅纜數量成為一種負擔:體積大、難以管理,並帶來散熱和維護挑戰。對於快速擴展的營運商來說,銅纜的蔓延會減慢建設速度,並增加物理層故障的可能性。
電力與冷卻壓力
由於 AI 集群已使電力和散熱預算承受巨大壓力,支援性基礎設施消耗的每一瓦電力都至關重要。傳統的 OOB 硬體——通常採用通用處理器和舊式架構構建——在不直接支援產生收入的工作負載的情況下,增加了整體的功耗足跡。這種動態正推動營運商尋求更精簡、更高效且符合現代永續發展和性能目標的 OOB 解決方案。
應對現代帶外管理的挑戰,需要從根本上重新思考 OOB 網路的架構。在 Ciena,我們正是這樣做的。
我們的數據中心帶外管理(DCOM)解決方案是一種專門設計的方法,旨在簡化和現代化 OOB 基礎設施——將傳統的專用乙太網路匯聚模式,替換為基於被動光纖網路(PON)技術的更優雅、高效且具擴展性的替代方案。
Ciena 的 DCOM 解決方案旨在滿足最苛刻的數據中心網路需求,結合了:
所有的 ONU 配置、監控和診斷都透過 OMCI 協定處理,該協定嵌入在主機路由器上可插拔 OLT 的 PON 控制軟體中。這種控制的集中化透過將 OOB 管理功能整合到相對少數的路由平台上,進一步簡化了營運,減少了營運足跡並實現了流暢的大規模部署。
這種架構透過整合 OOB 網路織網,顯著減少了所需的網路元件數量,並消除了匯聚層中的傳統乙太網路交換,從而實現了突破性的營運簡便性。結果是:一個更精簡、更敏捷的管理網路,其構建、擴展和營運的難度與成本都大幅降低。
透過大幅減少活動網路元件的數量並消除對傳統乙太網路匯聚交換機的需求,Ciena 的 DCOM 解決方案降低了 OOB 網路的功耗和冷卻足跡。同時,用輕量化光纖取代大量的銅纜簡化了物理基礎設施,改善了機架內的氣流,並支援在高密度環境中進行更具擴展性、更整潔的建設。
Ciena 和 Meta 共同撰寫的白皮書中更詳細地探討了這些優勢,該白皮書概述了這種基於 PON 的架構如何在擴展性、營運簡便性和成本降低方面帶來變革性的收益。
雖然業界的大部分注意力理所當然地集中在興起的數據中心技術上——從 AI 織網到高速互連——但帶外管理的角色依然默默地發揮著關鍵作用。它是當意外發生時,能夠實現控制、恢復和遠端操作的基礎設施,並為複雜的分散式環境構建了關鍵的安全網。
隨著數據中心不斷擴展以支援更多運算、更高密度和更快的創新週期,擁有一個能與之並進的 OOB 網路比以往任何時候都更加重要。Ciena 的 DCOM 解決方案正是為這一時刻而生——提供了一種更簡單、更高效的帶外管理方法,符合現代基礎設施設計的現實需求。
透過降低複雜性、最小化物理開銷並提高營運效率,DCOM 有助於鞏固高性能數據中心的基礎——使營運商能夠專注於交付業務所需的創新。
欲了解 Ciena 的 DCOM 解決方案如何幫助領先的營運商現代化其 OOB 基礎設施,請閱讀此白皮書或聯繫我們的團隊。