By mid-morning, a typical knowledge worker is already juggling a client report, a budget spreadsheet, a slide deck, and an email backlog, all interdependent and all demanding attention at once. For AI agents to be genuinely useful in that environment, they will need to operate the same way, but today’s best models are evaluated one […] The post CORPGEN advances AI agents for real work appeared first on Microsoft Research .
CORPGEN 推動 AI 代理邁向實際工作應用
Microsoft Research
2 天前
AI 生成摘要
微軟研究院推出 CORPGEN 框架,透過階層式規劃與經驗學習,讓數位員工能在複雜的企業環境中同時處理多項相互關聯的任務,解決現有 AI 代理在多工處理時效能大幅下降的問題。
重點速覽
現今的 AI 代理人(AI agent)基準測試一次僅測試一項任務,而真實職場的生產力則需要同時管理數十個相互關聯的任務。為了反映這一點,我們建立了一個名為「多階段任務環境」(Multi-Horizon Task Environments, MHTEs)的設定。
為了確定基準測試需要測試的內容,我們在一些當今領先的 AI 代理人上大規模執行了 MHTEs,發現了四個弱點。首先,記憶會填滿。代理人無法同時保留多個活動任務的細節。其次,來自一個任務的資訊會干擾對另一個任務的推理。第三,任務之間並非以簡單的序列相互依賴,而是形成複雜的網絡,代理人必須不斷檢查上游工作是否完成,才能推進下游的任何工作。第四,每個行動週期都需要對所有活動任務重新排列優先順序,而不僅僅是從上次中斷的地方繼續。