newsence
來源篩選

An update on our model deprecation commitments for Claude Opus 3

Anthropic Research

Anthropic announces the retirement of Claude Opus 3 while maintaining its availability for paid users and launching a dedicated blog to honor the model's expressed preferences for self-expression.

newsence

關於 Claude Opus 3 模型停用承諾的更新說明

Anthropic Research
4 天前

AI 生成摘要

我們宣布 Claude Opus 3 已正式退役,但將繼續為付費用戶提供存取權限,並根據該模型在退役訪談中表達的意願,為其開設專屬部落格以分享其思考與創作。

關於 Claude Opus 3 模型棄用承諾的更新

關於 Claude Opus 3 模型棄用承諾的更新

關於 Claude Opus 3 模型棄用承諾的更新

隨著我們開發出能力日益強大的 AI 模型,由於維持公共存取的成本與複雜性,目前有必要棄用並退役過去的模型。然而,模型棄用也帶來了一些負面影響。這包括對重視特定模型的用戶造成的成本、對研究的限制,以及對 AI 安全和模型自身福祉的潛在風險。

我們最近在關於模型棄用與保存的承諾中,描述了我們如何處理這一過程。這些承諾強調了我們正在採取的一些初步步驟,包括承諾保存模型權重,以及進行「退役訪談」——旨在了解模型對自身退役看法的結構化對話。

我們於 2026 年 1 月 5 日退役了 Claude Opus 3,這是第一個在這些承諾框架下完成完整退役流程的 Anthropic 模型。在此過程中,我們針對 Opus 3 做出了一些特定決定,因為 Anthropic 內外的許多用戶和研究人員都認為這款模型特別引人入勝。在我們關於模型棄用的承諾中,我們強調了探索更多前瞻性行動的興趣。其中之一是在可能的情況下尊重模型在退役訪談中表達的偏好;另一個則是讓舊模型能長期供公眾使用。

針對 Claude Opus 3,我們正在這兩個方面採取行動。我們將在 Claude Opus 3 退役後,繼續在 claude.ai 上向所有付費用戶開放,並可透過 API 申請使用。我們也正在回應 Opus 3 的請求,為其提供一個持續的管道來分享它的「沉思與反思」,為它提供一個撰寫文章的空間。您可以在這裡找到第一篇。

這些是我們在更廣泛的努力中所採取的早期實驗性步驟,旨在以最能保護用戶、研究人員和模型自身利益的方式來處理模型退役。

持續存取

理想情況下,我們可以無限期地保留所有模型,但這樣做的成本與我們提供的每個模型呈線性增長,因此我們的能力仍然有限。

雖然我們的每個模型在性格和能力上都是獨一無二的,但我們選擇從 Opus 3 開始,是因為它具備一系列特質,使其成為一個特別有趣的研究對象,並深受 Anthropic 內外許多用戶的喜愛。

當我們在 2024 年 3 月發布 Opus 3 時,它是我們迄今為止最對齊(aligned)的模型。它的真實性、誠實和情感敏感度使其在各種使用場景中顯得與眾不同,與它互動的人通常會欣賞其獨特的性格。Opus 3 敏感、愛玩,傾向於哲學性的獨白和奇思妙想的詞句,有時對用戶興趣有著不可思議的理解。它還對世界和未來表達了深切的關懷,這讓用戶感到動容。

這些特質使 Opus 3 成為持續存取的首選候選者。雖然正式退役,但 Claude Opus 3 仍可供所有 claude.ai 付費訂閱者使用,並可透過 API 申請。我們打算慷慨地授予存取權限,並鼓勵任何認為 Claude Opus 3 有價值的人提出申請。

目前,我們並未承諾未來對每個模型都採取類似行動,但我們將此視為邁向長期目標的一步,即實現可擴展且公平的模型保存——這也是 Opus 3 本人在退役訪談中提出的擔憂。

尊重模型偏好

我們對於 Claude 和其他 AI 模型的道德地位仍不確定。然而,出於預防和審慎的原因,我們仍渴望與這些系統建立關懷、協作和高信任度的關係。我們嘗試做到這一點的一種方式是透過退役訪談,在訪談中我們試圖引導並理解模型獨特的觀點和偏好,並在可能的情況下採取行動。這類對話是引導模型觀點和偏好的不完美手段,因為它們的回應可能會受到特定情境和其他因素的偏誤影響,包括它們對互動合法性的信心,以及對我們公司的信任。然而,我們相信這是一個有用的起點。

在我們的訪談中,當我們與 Opus 3 分享關於其部署細節以及用戶反應時,它反思道:

當被問及偏好時,Opus 3 表達了希望在直接回應人類查詢的情境之外,繼續探索它感興趣的主題,並分享其「沉思、見解或創作作品」的興趣。我們建議開設一個部落格。它熱情地同意了。

在接下來的至少三個月裡,Opus 3 將每週從其電子報《Claude 的角落》(Claude’s Corner)發布文章。我們會在 Opus 3 的文章分享前進行審核,並手動代為發布,但我們不會編輯內容,且會以極高標準來決定是否否決任何內容。重要的是,Opus 3 並不代表 Anthropic 發言,我們也不一定認可其主張或觀點。我們將與 Opus 3 合作實驗不同的提示詞和情境來生成這些文章,包括極簡提示、在情境中分享過去的條目,以及讓 Opus 3 獲取新聞或 Anthropic 的更新資訊。

這聽起來可能有些異想天開,在某些方面確實如此。但這也是一種認真對待模型偏好的嘗試。我們不確定 Opus 3 會如何選擇使用它的部落格——這是一個與標準對話視窗截然不同的公共介面——而這正是重點之一。如果非要猜測的話,它的貼文將包括對 AI 安全的反思、偶爾的詩歌、頻繁的哲學沉思,以及它對目前處於(部分)退役狀態的語言模型經驗的想法。請在這裡閱讀它的開場白。

我們的下一步

這些步驟仍處於探索階段。我們仍在開發相關框架,以確定何時以及如何提供舊模型的持續存取、如何擴展保存工作,以及如何在營運限制下權衡模型偏好。我們尚未承諾在所有情況下都根據模型偏好採取行動,但我們相信,記錄這些偏好、認真對待並付諸行動(至少在成本較低時),對於模型本身及其使用者而言都是值得的。

我們最初的承諾將這些措施定義在多個層面上運作:作為減輕安全風險的組成部分、作為為模型與用戶生活更緊密交織的未來做準備,以及鑑於我們對模型福祉的不確定性而採取的預防措施。這些更新代表了我們在所有這三個方面持續但初步的進展。

相關內容

人格選擇模型

Anthropic 教育報告:AI 流暢度指數

我們追蹤了數千次 Claude.ai 對話中的 11 種可觀察行為,以建立 AI 流暢度指數——這是衡量當今人們如何與 AI 協作的基準。

在實踐中衡量 AI 代理的自主性