newsence
來源篩選

OpenClaw Users Are Allegedly Bypassing Anti-Bot Systems

Wired - AI

An open source project called Scrapling is gaining traction with AI agent users who want their bots to scrape sites without permission.

newsence

OpenClaw 用戶據傳正繞過反機器人系統

Wired - AI
3 天前

AI 生成摘要

一個名為 Scrapling 的開源項目正受到 AI 代理用戶的青睞,他們希望讓機器人在未經許可的情況下抓取網站,這導致了與 Cloudflare 等安全供應商之間的貓鼠遊戲。

據傳 OpenClaw 用戶正繞過反機器人系統

在舊金山,感覺 OpenClaw 無處不在。甚至可能出現在一些它原本不該出現的地方。根據社交媒體上的貼文,人們似乎正在利用這款爆紅的 AI 工具來抓取網站並獲取資訊,即便這些網站已採取了明確的反機器人措施。

據稱,他們實現這一目標的方法之一是透過一個名為 Scrapling 的開源工具,該工具旨在繞過像 Cloudflare Turnstile 這樣的反機器人系統。雖然以 Python 構建的 Scrapling 可與多種類型的 AI 代理(Agent)配合使用,但 OpenClaw 的用戶似乎對這款軟體情有獨鍾。週一,在 X 平台上開始流傳將 Scrapling 宣傳為 OpenClaw 用戶工具的熱門貼文。自發布以來,Scrapling 的下載量已超過 20 萬次。

「沒有機器人檢測。無需維護選擇器。沒有 Cloudflare 的噩夢,」本週一篇關於該開源工具的熱門貼文寫道。「OpenClaw 告訴 Scrapling 要提取什麼,Scrapling 負責隱身處理。」

Cloudflare 對此並不熱衷。由於該開源軟體的用戶不斷嘗試規避反爬蟲保護,該公司此前已經封鎖了舊版本的 Scrapling。本週,該公司正致力於針對 Scrapling 的最新版本開發補丁。「我們做出改變,然後他們也做出改變,」Cloudflare 首席技術官 Dane Knecht 表示。他指出,公司擁有的海量網站數據和追蹤趨勢的能力使其佔據了上風。

「我們已經收到信號,顯示他們繞過我們的能力正在提高,」Knecht 說。「安全運維工程師團隊已經在著手開發一套新的調解方案。」

大型語言模型是在互聯網語料庫上進行訓練的,而這個過程涉及大量的抓取。從某種意義上說,Scrapling 的用戶正追隨最初模型構建者的腳步,只是規模更加個人化。

在過去幾年中,網站所有者試圖設置額外的反機器人保護,要麼是為了封鎖像 Scrapling 這樣的軟體,要麼是想辦法從試圖訪問其網站的機器人身上獲利。相應地,Cloudflare 一直在加班加點,以持續封鎖那些試圖規避這些保護、且功能日益強大的機器人。

2024 年 7 月,Cloudflare 開始向客戶提供額外工具,除非機器人支付訪問費用,否則將封鎖 AI 爬蟲。在不到一年的時間裡,該公司聲稱已封鎖了 4,160 億次未經請求的抓取嘗試。

「我不知道自己捲入了什麼」

隨著 Scrapling 在近日獲得關注,加密貨幣愛好者藉機推出了一款名為 $Scrapling 的迷因幣。自稱是 Scrapling 唯一開發者的 Karim Shoair 在 X 上發布了關於該迷因幣的貼文(這些貼文隨後已被刪除)。在價格飆升約五個小時後,隨著用戶拋售持股,$Scrapling 迅速崩盤。「一群該死的騙子,」託管該代幣的 Pump.Fun 網站上的一條評論寫道。

「當人們製造那種代幣且我為其背書時,我並不知道自己捲入了什麼,」Shoair 在給《連線》(WIRED)雜誌的私訊中表示。「但一旦我知道了,我就不想與之有任何關聯,我之前提取的資金將捐給慈善機構,我不會以任何方式從中獲利。或者乾脆就讓它在那裡作廢。」

在此事件的餘波中,在 X 上擁有超過 30 萬粉絲的非官方 GitHub Projects Community 帳號刪除了本週推廣 Scrapling 開源軟體的貼文,並似乎有意與該項目保持距離。它在週一深夜的一篇貼文中表示:「我們不支持、不推廣也不參與加密資產、代幣發行、交易活動或基於加密貨幣的籌款。」

撇開加密貨幣的嘗試不談,大多數軟體領袖仍將代理和自主 AI 工具視為網絡的未來。即便是工作內容包括封鎖非自願抓取機器人的 Cloudflare 的 Knecht,也希望構建一個人類和代理都能從在線數據中受益、且網站所有者的意願得到尊重的世界。「我看到了一條通往對代理和人類都友好的互聯網之路,」他說。

這是 Will Knight 的 AI Lab 通訊版本。在此閱讀之前的通訊。