WebMCP introduces a standard way for websites to expose structured tools to AI agents, enabling faster and more reliable interactions through new browser APIs. This initiative aims to make websites agent-ready by providing direct communication channels for complex tasks like booking flights or filing support tickets.
WebMCP 現已開放早期預覽
Hacker News
大約 6 小時前
AI 生成摘要
WebMCP 為網站提供了一種向 AI 代理開放結構化工具的標準方式,透過新的瀏覽器 API 實現更快速且可靠的互動。這項倡議旨在讓您的網站做好代理就緒的準備,為訂機票或提交支援工單等複雜任務提供直接的溝通管道。
Google 旗下的 Chrome for Developers 團隊近期發布了 WebMCP 的早期預覽計畫,旨在為「代理網頁」(Agentic Web)建立一套標準化的工具暴露機制。這項技術提議透過宣告式與指令式兩種 API,讓網站開發者能主動定義結構化的操作介面,使 AI 代理人能更精準、快速地在網頁上執行如訂票或填寫表單等複雜任務,而非僅依賴不穩定的 DOM 操作。
社群觀點
Hacker News 社群對於 WebMCP 的出現反應兩極,其中最核心的爭論點在於「網站動機」的矛盾。部分開發者質疑,多年來網站方一直透過 Cloudflare 或驗證碼(CAPTCHA)竭力阻擋自動化工具與爬蟲,現在卻要推行一套方便 AI 代理人操作的標準,邏輯上顯得格格不入。有觀點認為,這可能是 Google 為了鞏固自身生態系的策略,例如讓 Gemini 能順暢操作 Google Flights,但對於其他第三方 AI 代理人,網站方是否真有動力去維護一套額外的 API 介面仍是未知數。
許多資深開發者將 WebMCP 視為「語義網」(Semantic Web)的現代轉生。過去人們曾寄望透過 XML 或其他機器可讀格式讓網路資訊結構化,但最終因維護成本過高且缺乏誘因感而失敗。反對者指出,大多數網站連基本的無障礙輔助功能(Accessibility)都未必完善,要求開發者為每一頁維護專屬的 WebMCP 介面極其困難。更有批評指出,既然已經要暴露結構化工具,為何不直接提供標準的伺服器端 API,反而要透過瀏覽器作為中介,這不僅增加了開發負擔,也可能導致前端介面與後端邏輯出現同步落差。
然而,支持者則從「使用者代理」(User-Agent)的原始精神出發,認為 AI 工具終於有機會實現讓機器代為處理瑣碎網頁任務的願景。他們認為,比起讓 AI 盲目地在混亂的 HTML 源碼中摸索,WebMCP 提供了一種更具確定性的溝通管道。雖然目前展示的技術細節被批評過於空洞、缺乏實際程式碼範例,但支持者相信這類標準能賦予使用者更多主動權,打破網站方刻意設計的點擊陷阱或資訊圍欄,讓使用者能以自己偏好的方式獲取資料或完成交易。
此外,社群中也出現了關於「Slop」(垃圾內容)與 AI 飽和度的擔憂。部分開發者對 Chrome 開發工具頻繁推銷 AI 功能感到反感,認為 WebMCP 只是另一種追逐熱潮的產物,可能在一年內就會被遺忘。但也有樂觀的看法認為,即便 WebMCP 最終未能成為主流標準,它也像當年的 BetaMax 錄影帶一樣,推動了網頁機器可讀性的進步,迫使業界思考如何讓網頁在 AI 時代變得更加開放且易於協作。
延伸閱讀
WebMCP 官方文件草案:由 Google 提供的詳細技術說明文件,包含 API 設計細節。
WebMCP: A False Economy?:由開發者 Manveer Chaha 撰寫的評論文章,探討為何伺服器端 MCP 優於瀏覽器端的 WebMCP。