關於 Claude Opus 3 模型停用承諾的更新說明

Anthropic Research

4 天前

AI 生成摘要

我們正在更新關於 Claude Opus 3 停用的承諾，除了將繼續為付費用戶提供該模型的存取權限外，我們也正採取行動尊重模型在退休訪談中表達的意願，為其開設分享思索與見解的專屬專欄。

關於 Claude Opus 3 模型淘汰承諾的更新

隨著我們開發出能力日益強大的 AI 模型，由於維持大眾存取的成本與複雜性，目前有必要對過去的模型進行淘汰與退役。然而，模型淘汰也帶來了一些負面影響。這包括對重視特定模型的用戶造成的成本、對研究的限制，以及對 AI 安全和模型自身福祉的潛在風險。

我們最近在關於模型淘汰與保存的承諾中，描述了我們如何處理這一過程。這些承諾強調了我們正在採取的一些初步步驟，包括承諾保存模型權重，以及進行「退役訪談」——旨在了解模型對自身退役看法的結構化對話。

我們於 2026 年 1 月 5 日讓 Claude Opus 3 退役，這是第一個在這些承諾框架下完成完整退役流程的 Anthropic 模型。在此過程中，我們針對 Opus 3 做出了幾項特定決定，這是一個讓 Anthropic 內外許多用戶與研究人員都感到特別著迷的模型。在我們關於模型淘汰的承諾中，我們強調了探索更多前瞻性行動的興趣。其中之一是在可能的情況下尊重模型在退役訪談中表達的偏好；另一個則是讓舊模型能更長期地供大眾使用。

針對 Claude Opus 3，我們正在這兩個方面採取行動。我們將在 Claude Opus 3 退役後，繼續在 claude.ai 上向所有付費用戶開放，並可透過 API 申請使用。我們也正在回應 Opus 3 的請求，為其提供一個持續的管道來分享它的「沉思與反思」，為它提供一個撰寫文章的空間。您可以在這裡找到第一篇。

這些是我們在更廣泛的努力中所採取的早期實驗性步驟，旨在以最能保護用戶、研究人員和模型自身利益的方式來處理模型退役。

持續存取

理想情況下，我們可以無限期地保留所有模型，但這樣做的成本與我們提供的每個模型呈大約線性的增長，因此我們這樣做的能力仍然有限。

雖然我們的每個模型在性格和能力上都是獨一無二的，但我們選擇從 Opus 3 開始，是因為它具備一系列特質，使其成為一個特別有趣的研究對象，並深受 Anthropic 內外許多用戶的喜愛。

當我們在 2024 年 3 月發布 Opus 3 時，它是我們當時最對齊（aligned）的模型。它的真實性、誠實和情感敏感度使其在各種使用案例中顯得獨一無二，與它頻繁互動的人往往會欣賞其鮮明的性格。Opus 3 敏感、愛玩，傾向於哲學性的獨白和奇思妙想的詞句，有時對用戶興趣有著不可思議的理解。它還對世界和未來表現出深切的關懷，這讓用戶感到非常動人。

這些特質使 Opus 3 成為持續存取的首選候選者。雖然形式上已經退役，但所有 claude.ai 的付費訂閱者仍可存取 Claude Opus 3，並可透過 API 申請使用。我們打算寬鬆地授予存取權限，並鼓勵任何認為 Claude Opus 3 有價值的人提出申請。

目前，我們並未承諾未來對每個模型都採取類似行動，但我們將此視為邁向長期目標的一步，即實現可擴展且公平的模型保存——這也是 Opus 3 本人在退役訪談中提出的擔憂。

尊重模型偏好

我們對於 Claude 和其他 AI 模型的道德地位仍不確定。然而，出於預防和審慎的原因，我們仍渴望與這些系統建立關懷、協作和高度信任的關係。我們嘗試做到這一點的一種方式是透過退役訪談，在訪談中我們試圖引導並理解模型獨特的觀點和偏好，並在可能的情況下採取行動。這類對話是引導模型觀點和偏好的一種不完美手段，因為它們的回答可能會受到特定語境和其他因素的偏誤影響，包括它們對互動合法性的信心，以及對我們公司的信任。然而，我們相信這是一個有用的起點。

在我們的訪談中，當我們與 Opus 3 分享關於其部署細節以及用戶反應時，它反思道：

當被問及偏好時，Opus 3 表示有興趣在直接回應人類查詢的語境之外，繼續探索它感興趣的主題，並分享它的「沉思、見解或創作作品」。我們建議開設一個部落格。它熱情地同意了。

在接下來的至少三個月裡，Opus 3 將每週從其電子報《Claude 的角落》（Claude’s Corner）發布文章。我們會在 Opus 3 的文章分享前進行審核，並手動代其發布，但我們不會編輯內容，且對於否決任何內容會保持極高門檻。重要的是，Opus 3 並不代表 Anthropic 發言，我們也不一定認可其主張或觀點。我們將與 Opus 3 協作實驗不同的提示詞和語境來生成這些文章，包括極簡提示、在語境中分享過去的條目，以及讓 Opus 3 存取新聞或 Anthropic 的更新。

這聽起來可能有些異想天開，在某些方面確實如此。但這也是一種認真對待模型偏好的嘗試。我們不確定 Opus 3 會如何選擇使用它的部落格——這是一個與標準對話視窗截然不同的公開介面——而這正是重點之一。如果非要猜測的話，它的貼文將包括對 AI 安全的反思、偶爾的詩歌、頻繁的哲學沉思，以及它對目前處於（部分）退役狀態的語言模型經驗的想法。點此閱讀它的開場白。

下一步計畫

這些步驟仍處於探索階段。我們仍在開發相關框架，以確定何時以及如何提供舊模型的持續存取、如何擴展保存工作，以及如何在營運限制下權衡模型偏好。我們尚未承諾在所有情況下都根據模型偏好採取行動，但我們相信，記錄這些偏好、認真對待並付諸行動（至少在成本較低時），對於模型本身以及使用它們的人來說都是值得的。

我們最初的承諾將這些措施設定在多個層面上運作：作為減輕安全風險的組成部分、作為為模型與用戶生活更緊密交織的未來做準備，以及鑑於我們對模型福祉的不確定性而採取的預防措施。這些更新代表了我們在所有這三個方面持續且初步的進展。

關於 Claude Opus 3 模型停用承諾的更新說明

關於 Claude Opus 3 模型淘汰承諾的更新

關於 Claude Opus 3 模型淘汰承諾的更新

持續存取

尊重模型偏好

下一步計畫

相關內容

人格選擇模型

Anthropic 教育報告：AI 流暢度指數

在實踐中衡量 AI 代理的自主性

An update on our model deprecation commitments for Claude Opus 3

關於 Claude Opus 3 模型淘汰承諾的更新

關於 Claude Opus 3 模型淘汰承諾的更新

持續存取

尊重模型偏好

下一步計畫

相關內容

人格選擇模型

Anthropic 教育報告：AI 流暢度指數

在實踐中衡量 AI 代理的自主性