Introducing Lockdown Mode and Elevated Risk Labels in ChatGPT
OpenAI
Introducing Lockdown Mode and Elevated Risk labels in ChatGPT to help organizations defend against prompt injection and AI-driven data exfiltration.
OpenAI
Introducing Lockdown Mode and Elevated Risk labels in ChatGPT to help organizations defend against prompt injection and AI-driven data exfiltration.
AI 生成摘要
OpenAI 在 ChatGPT 中推出鎖定模式與高風險標籤,旨在透過緩解提示注入攻擊和 AI 驅動的數據滲漏,來增強組織的安全性。
2026 年 2 月 13 日
隨著 AI 系統承擔更複雜的任務——尤其是那些涉及網路和連接應用程式的任務——安全風險也在變化。
其中一個新興風險變得尤為重要:提示注入。在這些攻擊中,第三方試圖誤導對話式 AI 系統,使其遵循惡意指令或洩露敏感資訊。
今天,我們推出了兩項新的保護措施,旨在幫助使用者和組織減輕提示注入攻擊,並提供更清晰的風險可見性和更強大的控制:
這些新增功能建立在我們現有的模型、產品和系統層面的保護措施之上。這包括沙箱、針對基於 URL 的資料外洩的保護、監控和強制執行,以及企業控制,例如基於角色的存取和稽核日誌。
鎖定模式是一種可選的高級安全設定,專為一小部分高度重視安全的使用者(例如知名組織的執行長或安全團隊)而設計,他們需要加強對抗高級威脅的保護。對於大多數使用者來說,這不是必需的。鎖定模式嚴格限制 ChatGPT 與外部系統的互動方式,以降低基於提示注入的資料外洩風險。
鎖定模式確定性地禁用 ChatGPT 中的某些工具和功能,攻擊者可能會試圖利用這些工具和功能,透過提示注入等攻擊,從使用者的對話或連接的應用程式中洩露敏感資料。
例如,鎖定模式下的網頁瀏覽僅限於快取內容,因此沒有即時網路請求離開 OpenAI 的受控網路。此限制旨在防止敏感資料透過瀏覽洩露給攻擊者。當我們無法提供強大的資料安全確定性保證時,某些功能將完全禁用。
鎖定模式是一種新的確定性設定,透過嚴格限制 ChatGPT 與某些外部系統的互動方式,有助於保護資料免於意外地與第三方共享。
ChatGPT 商業方案已經提供企業級的資料安全。鎖定模式建立在這些保護措施之上,適用於 ChatGPT Enterprise、ChatGPT Edu、ChatGPT for Healthcare 和 ChatGPT for Teachers。管理員可以在工作區設定中啟用它(在新視窗中開啟),方法是建立一個新角色(在新視窗中開啟)。啟用後,鎖定模式會在現有的管理員設定之上增加額外的限制。
在我們的說明中心(在新視窗中開啟)了解更多關於鎖定模式的資訊。
由於某些關鍵工作流程依賴應用程式,因此工作區管理員保留更精細的控制。他們可以選擇哪些應用程式——以及這些應用程式中的哪些特定操作——可以在鎖定模式下供使用者使用。此外,與鎖定模式分開,合規性 API 日誌平台(在新視窗中開啟)提供對應用程式使用情況、共享資料和連接來源的詳細可見性,幫助管理員保持監督。
我們計劃在未來幾個月內向消費者提供鎖定模式。
當 AI 產品連接到您的應用程式和網路時,它們會更有幫助,並且我們已投入大量資金來確保連接資料的安全。同時,某些與網路相關的功能引入了新的風險,這些風險尚未完全被業界的安全緩解措施解決。某些使用者可能願意承擔這些風險,並且我們認為使用者有能力決定是否以及如何使用它們非常重要,尤其是在處理他們的私人資料時。
我們的方法一直是為可能引入額外風險的功能提供產品內指導。為了使這一點更清晰和更一致,我們正在標準化我們標記一小部分現有功能的方式。這些功能現在將在 ChatGPT、ChatGPT Atlas 和 Codex 中使用一致的「高風險」標籤,以便使用者無論在哪裡遇到它們都能收到相同的指導。
例如,在我們的程式碼助手 Codex 中,開發人員可以授予 Codex 網路存取權,以便它可以執行網路上的操作,例如查找文檔。相關的設定螢幕包括「高風險」標籤,以及對更改內容、可能引入的風險以及何時適合該存取權的清晰解釋。
Codex 設定螢幕的螢幕截圖,使用者可以在其中配置 Codex 擁有的網路存取權。
我們將繼續投資加強我們的安全保障措施,特別是針對新穎、新興或不斷增長的風險。隨著我們加強這些功能的保障措施,一旦我們確定安全進展已充分減輕了這些風險以供一般使用,我們將刪除「高風險」標籤。我們還將繼續更新哪些功能帶有此標籤,以便隨著時間的推移,最好地向使用者傳達風險。
產品 2026 年 2 月 12 日
公司 2026 年 2 月 9 日
安全 2026 年 2 月 5 日