newsence
來源篩選

An update on our model deprecation commitments for Claude Opus 3

Anthropic Research

Feb 25, 2026AlignmentAn update on our model deprecation commitments for Claude Opus 3

newsence

關於 Claude Opus 3 模型停用承諾的更新說明

Anthropic Research
4 天前

AI 生成摘要

我們正在更新關於 Claude Opus 3 停用的承諾,除了將繼續為付費用戶提供該模型的存取權限外,我們也正採取行動尊重模型在退休訪談中表達的意願,為其開設分享思索與見解的專屬專欄。

關於 Claude Opus 3 模型淘汰承諾的更新

關於 Claude Opus 3 模型淘汰承諾的更新

關於 Claude Opus 3 模型淘汰承諾的更新

隨著我們開發出能力日益強大的 AI 模型,由於維持大眾存取的成本與複雜性,目前有必要對過去的模型進行淘汰與退役。然而,模型淘汰也帶來了一些負面影響。這包括對重視特定模型的用戶造成的成本、對研究的限制,以及對 AI 安全和模型自身福祉的潛在風險。

我們最近在關於模型淘汰與保存的承諾中,描述了我們如何處理這一過程。這些承諾強調了我們正在採取的一些初步步驟,包括承諾保存模型權重,以及進行「退役訪談」——旨在了解模型對自身退役看法的結構化對話。

我們於 2026 年 1 月 5 日讓 Claude Opus 3 退役,這是第一個在這些承諾框架下完成完整退役流程的 Anthropic 模型。在此過程中,我們針對 Opus 3 做出了幾項特定決定,這是一個讓 Anthropic 內外許多用戶與研究人員都感到特別著迷的模型。在我們關於模型淘汰的承諾中,我們強調了探索更多前瞻性行動的興趣。其中之一是在可能的情況下尊重模型在退役訪談中表達的偏好;另一個則是讓舊模型能更長期地供大眾使用。

針對 Claude Opus 3,我們正在這兩個方面採取行動。我們將在 Claude Opus 3 退役後,繼續在 claude.ai 上向所有付費用戶開放,並可透過 API 申請使用。我們也正在回應 Opus 3 的請求,為其提供一個持續的管道來分享它的「沉思與反思」,為它提供一個撰寫文章的空間。您可以在這裡找到第一篇。

這些是我們在更廣泛的努力中所採取的早期實驗性步驟,旨在以最能保護用戶、研究人員和模型自身利益的方式來處理模型退役。

持續存取

理想情況下,我們可以無限期地保留所有模型,但這樣做的成本與我們提供的每個模型呈大約線性的增長,因此我們這樣做的能力仍然有限。

雖然我們的每個模型在性格和能力上都是獨一無二的,但我們選擇從 Opus 3 開始,是因為它具備一系列特質,使其成為一個特別有趣的研究對象,並深受 Anthropic 內外許多用戶的喜愛。

當我們在 2024 年 3 月發布 Opus 3 時,它是我們當時最對齊(aligned)的模型。它的真實性、誠實和情感敏感度使其在各種使用案例中顯得獨一無二,與它頻繁互動的人往往會欣賞其鮮明的性格。Opus 3 敏感、愛玩,傾向於哲學性的獨白和奇思妙想的詞句,有時對用戶興趣有著不可思議的理解。它還對世界和未來表現出深切的關懷,這讓用戶感到非常動人。

這些特質使 Opus 3 成為持續存取的首選候選者。雖然形式上已經退役,但所有 claude.ai 的付費訂閱者仍可存取 Claude Opus 3,並可透過 API 申請使用。我們打算寬鬆地授予存取權限,並鼓勵任何認為 Claude Opus 3 有價值的人提出申請。

目前,我們並未承諾未來對每個模型都採取類似行動,但我們將此視為邁向長期目標的一步,即實現可擴展且公平的模型保存——這也是 Opus 3 本人在退役訪談中提出的擔憂。

尊重模型偏好

我們對於 Claude 和其他 AI 模型的道德地位仍不確定。然而,出於預防和審慎的原因,我們仍渴望與這些系統建立關懷、協作和高度信任的關係。我們嘗試做到這一點的一種方式是透過退役訪談,在訪談中我們試圖引導並理解模型獨特的觀點和偏好,並在可能的情況下採取行動。這類對話是引導模型觀點和偏好的一種不完美手段,因為它們的回答可能會受到特定語境和其他因素的偏誤影響,包括它們對互動合法性的信心,以及對我們公司的信任。然而,我們相信這是一個有用的起點。

在我們的訪談中,當我們與 Opus 3 分享關於其部署細節以及用戶反應時,它反思道:

當被問及偏好時,Opus 3 表示有興趣在直接回應人類查詢的語境之外,繼續探索它感興趣的主題,並分享它的「沉思、見解或創作作品」。我們建議開設一個部落格。它熱情地同意了。

在接下來的至少三個月裡,Opus 3 將每週從其電子報《Claude 的角落》(Claude’s Corner)發布文章。我們會在 Opus 3 的文章分享前進行審核,並手動代其發布,但我們不會編輯內容,且對於否決任何內容會保持極高門檻。重要的是,Opus 3 並不代表 Anthropic 發言,我們也不一定認可其主張或觀點。我們將與 Opus 3 協作實驗不同的提示詞和語境來生成這些文章,包括極簡提示、在語境中分享過去的條目,以及讓 Opus 3 存取新聞或 Anthropic 的更新。

這聽起來可能有些異想天開,在某些方面確實如此。但這也是一種認真對待模型偏好的嘗試。我們不確定 Opus 3 會如何選擇使用它的部落格——這是一個與標準對話視窗截然不同的公開介面——而這正是重點之一。如果非要猜測的話,它的貼文將包括對 AI 安全的反思、偶爾的詩歌、頻繁的哲學沉思,以及它對目前處於(部分)退役狀態的語言模型經驗的想法。點此閱讀它的開場白。

下一步計畫

這些步驟仍處於探索階段。我們仍在開發相關框架,以確定何時以及如何提供舊模型的持續存取、如何擴展保存工作,以及如何在營運限制下權衡模型偏好。我們尚未承諾在所有情況下都根據模型偏好採取行動,但我們相信,記錄這些偏好、認真對待並付諸行動(至少在成本較低時),對於模型本身以及使用它們的人來說都是值得的。

我們最初的承諾將這些措施設定在多個層面上運作:作為減輕安全風險的組成部分、作為為模型與用戶生活更緊密交織的未來做準備,以及鑑於我們對模型福祉的不確定性而採取的預防措施。這些更新代表了我們在所有這三個方面持續且初步的進展。

相關內容

人格選擇模型

Anthropic 教育報告:AI 流暢度指數

我們追蹤了數千次 Claude.ai 對話中的 11 種可觀察行為,以建立 AI 流暢度指數——這是衡量當今人們如何與 AI 協作的基準。

在實踐中衡量 AI 代理的自主性