Building secure, scalable agent sandbox infrastructure
Hacker News
We share our transition from isolating individual tools to isolating the entire agent loop using a control plane architecture and Unikraft micro-VMs to ensure security and scalability. This approach ensures agents have no secrets to leak and can be managed as stateless, disposable units across production and development environments.
關於安全性設計,社群出現了較為兩極的評價。有觀點直言文中提到的「強化措施」,例如刪除 Python 源碼僅保留字節碼,或是從環境變數中刪除敏感標記,本質上只是「隱晦式安全」(Security through obscurity),對於有經驗的攻擊者來說並不難繞過。這類評論認為,真正的安全應該建立在更底層的隔離機制,而非僅僅是清理執行環境的表面痕跡。
更深層的爭論則聚焦於沙盒是否真的能解決 AI 代理的安全核心問題。多位評論者指出,當前的工程師過度關注沙盒工具的建構,卻忽略了 LLM 本身極易受到提示注入(Prompt Injection)攻擊的本質。即便沙盒能防止代理直接入侵基礎設施,但只要代理具備讀取網頁或文件的權限,攻擊者就能透過惡意內容操控代理的行為。這種觀點認為,在 LLM 能夠區分「指令」與「數據」,或具備預測自身行為後果的能力之前,單純的沙盒隔離並無法解決代理在獲得授權後可能產生的破壞性行為。這種「監督疲勞」導致的人為審核失效,才是代理安全領域中最難攻克的挑戰。