Beyond Rate Limits: Scaling Access to Codex and Sora
OpenAI
How OpenAI built a real-time access system combining rate limits, usage tracking, and credits to power continuous access to Sora and Codex.
OpenAI
How OpenAI built a real-time access system combining rate limits, usage tracking, and credits to power continuous access to Sora and Codex.
AI 生成摘要
OpenAI 建置了一個結合速率限制、使用量追蹤和點數的即時存取系統,以支援Sora和Codex產品的持續存取,解決使用者遇到硬性停止的挫折感,並確保系統效能。
2026 年 2 月 13 日
作者:Jonah Cohen,技術人員
在過去的一年中,Sora 和 Codex 都得到了迅速採用,使用量迅速超出我們最初的預期。我們看到了一種一致的模式:用戶深入研究,發現真正的價值,然後遇到速率限制。
速率限制可以幫助平滑需求並確保公平訪問;但是,當用戶獲得價值時,遇到硬性停止可能會令人沮喪。我們想要一種讓用戶能夠繼續使用的方式,同時保護系統性能和用戶對我們方法的信任。
為了解決這個問題,我們構建了一個實時訪問引擎,用於計算使用量。該引擎的一個層面是購買積分的能力。當用戶超過其速率限制時,積分讓他們可以通過花費其積分餘額來繼續使用我們的產品。
在這之下是一個複雜的系統,它將限制、實時使用情況跟踪和積分餘額融合到一個單一的訪問模型中。本文涵蓋了為什麼擴展 Sora 和 Codex 需要重新思考訪問控制,一個可證明正確的實時系統如何將速率限制和每個請求的積分結合在一起,以及該基礎如何現在為這兩種產品解鎖額外的訪問權限。
從宏觀上看,傳統的訪問模型往往會迫使做出選擇:
對於 Sora 和 Codex 來說,這兩者本身都不夠。如果我們只是提高速率限制,我們將失去重要的需求平滑和公平控制,並且會耗盡為所有人提供服務的能力。如果我們完全依賴異步使用計費,我們將引入延遲、超額或對帳問題——這些正是用戶在最投入時會注意到的問題類型。
相反,我們需要的是一個結合了實時限制和按使用付費訪問的單一混合系統:
這個系統必須:
我們做出的一個關鍵概念轉變是將訪問建模為決策瀑布。我們不是問“這是否允許?”,而是問“允許多少,從哪裡允許?” 在計算使用量時,系統會經歷以下順序:
此模型反映了用戶實際體驗產品的方式。速率限制、免費層級、積分、促銷活動和企業權利都只是同一決策堆疊中的層。從用戶的角度來看,他們不會“切換系統”——他們只是繼續使用 Sora 或 Codex。這就是為什麼積分感覺隱形:它們只是瀑布中的另一個元素。
我們評估了第三方使用計費和計量平台來處理積分消耗。它們非常適合發票和報告,但不符合兩個關鍵要求:
當用戶達到限制並且有可用積分時,系統必須立即知道。盡力而為或延遲計數會顯示為意外阻止、不一致的餘額和不正確的收費。對於像 Sora 和 Codex 這樣的交互式產品,這些失敗會變得可見且令人沮喪。
我們還需要提供對每個結果的透明度:
此功能需要緊密集成到我們的決策瀑布中,而不是在單獨的使用計費平台中孤立地解決,該平台僅看到正在發生的事情的一部分。為了讓用戶訪問我們的產品而不損害信任,我們需要完全控制正確性、時間和可觀察性。這促使我們採用內部解決方案。
為了支持這一點,我們構建了一個分佈式使用和餘額系統,專門為同步訪問決策而設計。
從高層次來看,該系統:
每個請求都通過一個單一的評估路徑,該路徑會實時決定允許多少使用量,方法是同步消耗速率限制,如果需要,驗證是否有足夠的積分;然後它返回一個明確的結果,同時異步結算任何積分扣款。這確保了跨產品的一致行為,並消除了跨團隊的重複邏輯。
該系統的關鍵設計原則之一是我們必須能夠證明我們的計費是正確的。這反映了我們積分支持的根源,它起源於企業客戶。在上面的系統圖中,我們有三個獨立的數據集,它們都聯繫在一起:
這些數據集不是隨意的副產品;它們實際上驅動了系統,每個數據集都觸發下一個數據集。分離發生的事情、任何相關費用以及我們扣除的內容,使我們能夠獨立審計、重播和對帳每一層。這是一個有意的權衡,我們優先考慮可證明的正確性,代價是積分餘額更新略有延遲。我們如何完成這一點:
所有這些嚴謹性都支持一個目標:使訪問簡單且安全。當人們在創建或編碼時,他們不應該懷疑請求是否會通過、他們是否會被多收費或他們的餘額是否準確。通過使使用、計費和餘額可證明正確,我們為用戶提供了一個不會分散他們體驗的系統。這就是讓我們可以用連續訪問代替硬性停止的原因——這也是讓積分可以在實際工作中使用的原因,而不僅僅是在發票上。