ChatGPT 推出鎖定模式與高風險標籤

OpenAI

15 天前

AI 生成摘要

OpenAI 在 ChatGPT 中推出鎖定模式與高風險標籤，旨在透過緩解提示注入攻擊和 AI 驅動的數據滲漏，來增強組織的安全性。

ChatGPT 中引入鎖定模式和高風險標籤 | OpenAI

2026 年 2 月 13 日

在 ChatGPT 中引入鎖定模式和高風險標籤

隨著 AI 系統承擔更複雜的任務——尤其是那些涉及網路和連接應用程式的任務——安全風險也在變化。

其中一個新興風險變得尤為重要：提示注入。在這些攻擊中，第三方試圖誤導對話式 AI 系統，使其遵循惡意指令或洩露敏感資訊。

今天，我們推出了兩項新的保護措施，旨在幫助使用者和組織減輕提示注入攻擊，並提供更清晰的風險可見性和更強大的控制：

這些新增功能建立在我們現有的模型、產品和系統層面的保護措施之上。這包括沙箱、針對基於 URL 的資料外洩的保護、監控和強制執行，以及企業控制，例如基於角色的存取和稽核日誌。

幫助組織保護最容易遭受網路攻擊的員工

鎖定模式是一種可選的高級安全設定，專為一小部分高度重視安全的使用者（例如知名組織的執行長或安全團隊）而設計，他們需要加強對抗高級威脅的保護。對於大多數使用者來說，這不是必需的。鎖定模式嚴格限制 ChatGPT 與外部系統的互動方式，以降低基於提示注入的資料外洩風險。

鎖定模式確定性地禁用 ChatGPT 中的某些工具和功能，攻擊者可能會試圖利用這些工具和功能，透過提示注入等攻擊，從使用者的對話或連接的應用程式中洩露敏感資料。

例如，鎖定模式下的網頁瀏覽僅限於快取內容，因此沒有即時網路請求離開 OpenAI 的受控網路。此限制旨在防止敏感資料透過瀏覽洩露給攻擊者。當我們無法提供強大的資料安全確定性保證時，某些功能將完全禁用。

鎖定模式是一種新的確定性設定，透過嚴格限制 ChatGPT 與某些外部系統的互動方式，有助於保護資料免於意外地與第三方共享。

ChatGPT 商業方案已經提供企業級的資料安全。鎖定模式建立在這些保護措施之上，適用於 ChatGPT Enterprise、ChatGPT Edu、ChatGPT for Healthcare 和 ChatGPT for Teachers。管理員可以在工作區設定中啟用它（在新視窗中開啟），方法是建立一個新角色（在新視窗中開啟）。啟用後，鎖定模式會在現有的管理員設定之上增加額外的限制。

在我們的說明中心（在新視窗中開啟）了解更多關於鎖定模式的資訊。

由於某些關鍵工作流程依賴應用程式，因此工作區管理員保留更精細的控制。他們可以選擇哪些應用程式——以及這些應用程式中的哪些特定操作——可以在鎖定模式下供使用者使用。此外，與鎖定模式分開，合規性 API 日誌平台（在新視窗中開啟）提供對應用程式使用情況、共享資料和連接來源的詳細可見性，幫助管理員保持監督。

我們計劃在未來幾個月內向消費者提供鎖定模式。

幫助使用者做出明智的風險選擇

當 AI 產品連接到您的應用程式和網路時，它們會更有幫助，並且我們已投入大量資金來確保連接資料的安全。同時，某些與網路相關的功能引入了新的風險，這些風險尚未完全被業界的安全緩解措施解決。某些使用者可能願意承擔這些風險，並且我們認為使用者有能力決定是否以及如何使用它們非常重要，尤其是在處理他們的私人資料時。

我們的方法一直是為可能引入額外風險的功能提供產品內指導。為了使這一點更清晰和更一致，我們正在標準化我們標記一小部分現有功能的方式。這些功能現在將在 ChatGPT、ChatGPT Atlas 和 Codex 中使用一致的「高風險」標籤，以便使用者無論在哪裡遇到它們都能收到相同的指導。

例如，在我們的程式碼助手 Codex 中，開發人員可以授予 Codex 網路存取權，以便它可以執行網路上的操作，例如查找文檔。相關的設定螢幕包括「高風險」標籤，以及對更改內容、可能引入的風險以及何時適合該存取權的清晰解釋。