newsence
來源篩選

A Wave of Unexplained Bot Traffic Is Sweeping the Web

Wired - AI

From small publishers to US federal agencies, websites are reporting unusual spikes in automated traffic linked to IP addresses in Lanzhou, China.

newsence

一股不明的機器人流量正席捲網路

Wired - AI
16 天前

AI 生成摘要

從小型出版商到美國聯邦機構,全球的網站都出現了來自中國蘭州IP位址的不尋常自動流量激增現象。這種現象引起了網站營運者的擔憂和困惑。

一波無法解釋的機器人流量正在席捲網路 | WIREDMenuMenuAccountAccountChevronExpandSearchCommentLoaderSave StoryCommentLoaderSave StoryTriangleLargeChevronFacebookXPinterestYouTubeInstagramTiktok

一波無法解釋的機器人流量正在席捲網路

Image

在十月的一個短暫時刻,Alejandro Quintero 認為他在中國取得了巨大成功。這位常駐波哥大的數據分析師擁有一家網站,該網站發布關於超自然活動的文章,例如鬼魂和外星人。他說,這些內容是用“西班牙英語”寫的,從未打算面向亞洲受眾。但去年秋天,Quintero 的網站突然開始收到來自中國和新加坡的大量訪問。來自這兩個國家的流量如此之高且穩定,以至於在過去 12 個月中,它佔 Quintero 網站總訪問量的一半以上。

當他第一次注意到流量激增時,Quintero 認為他在世界的另一端找到了受眾。“我現在需要去中國,因為我在那裡很火,”Quintero 說他回憶起當時的想法。但當他深入研究數據後,他知道有些不對勁。Google Analytics(網站所有者用來解析網路流量的常用工具)顯示,所有中國訪客都來自一個特定城市:蘭州。他們不太可能是真人,因為他們在頁面上停留的平均時間為 0 秒,並且不滾動或點擊。Quintero 很快意識到他的網站實際上正在受到機器人的轟炸。

Quintero 後來從社交媒體上得知,從 9 月開始,他遠非唯一一個開始看到來自中國和新加坡的大量機器人的網站運營商。一家位於印度的生活方式雜誌、一個關於加拿大海岸附近小島的部落格、幾個個人作品集網站的所有者、一個擁有超過 1500 萬頁面的天氣預報平台、Shopify 託管的電子商務商店,甚至美國政府運營的網域都報告說受到了似乎是相同的機器人的攻擊。而且它們很容易被發現,因為這些機器人顯著地扭曲了每個網站通常的分析模式。在過去的 90 天裡,美國政府網站的訪問量中有 14.7% 來自蘭州,6.6% 來自新加坡,根據 Analytics.usa.gov 的數據,這使得它們成為世界上據稱最渴望獲得美國政府資訊的兩個城市。

雖然它們的 IP 位址可以追溯到中國和新加坡,但關於誰真正控制著這大量自動訪問的資訊卻很少。被鎖定的網站所有者基本上得出結論,這些機器人不會造成任何直接傷害。鑑於去年與 AI 相關的機器人活動在整個網路上激增,許多人認為這些流量可能與公司收集網路數據以訓練模型有關。

蘭州到底在哪裡?

當網站所有者看到來自中國的訪問量突然增加時,他們中的許多人開始問,蘭州在哪裡?這個位於中國西北部的二線城市以其重工業和作為絲綢之路貿易樞紐的歷史遺產而聞名。但它既不是科技中心,也不是大量數據中心的所在地。那麼為什麼會有這麼多的流量來自這個城市呢?

分析自動網路流量的 Known Agents 的創始人 Gavin King 說,蘭州可能不是機器人的實際來源。King 自己的公司網站也受到了來自中國和新加坡的機器人的攻擊。當他更深入地研究訪問的具體細節時,他唯一能確定的是所有流量最終都會通過新加坡路由。Google Analytics 確定訪問源自蘭州,但 King 說這可能只是一個有根據的猜測,而不是一個精確的位置。

但 King 發現的最具體的細節是,流量正在通過屬於幾家主要中國雲端公司的伺服器進行路由。King 說,他的網站收到的機器人流量都來自自治系統編號 (ASN) 132203,這是網際網路路由系統中的一個唯一標識符,分配給由中國公司騰訊運營的網際網路服務提供商。一個大型天氣預報網站群組的經理 Andy 說,他檢測到來自與騰訊、阿里巴巴和華為相關的 ASN 的機器人流量。(他要求只使用他的名字來保護他的隱私。)這三家公司都是主要的雲端供應商,目前尚不清楚這些機器人是來自內部還是使用其伺服器的客戶。

許多人懷疑這些機器人是 AI 公司努力從網頁收集訓練數據的一部分。在 2025 年,AI 機器人佔據了整體網路流量的很大一部分,它們在網際網路上爬行以獲取文字和其他資訊,以提供給數據飢渴的大型語言模型。

但這些中國機器人和其他 AI 機器人之間存在一些關鍵差異。首先,它們的數量實在是太多了。King 說,在他的網站上,來自中國和新加坡的流量佔總流量的 22%,而所有其他 AI 機器人的總和加起來不到 10%。

大多數領先的 AI 公司都會明確地向網站運營商標識他們的機器人,這也使它們更容易被阻止。網際網路基礎設施公司 Akamai 的安全技術和策略高級總監 Brent Maynard 說,前沿 AI 實驗室“對逃避”機器人阻止規則“不那麼感興趣”。他說,AI 公司通常只有在網站關閉前門後才開始嘗試偽裝他們的機器人。然而,幾位網站所有者告訴 WIRED,這波中國機器人從一開始就將自己偽裝成普通人類用戶,甚至繞過了常見的機器人阻止規則。

除了 AI 公司之外,還有其他企業有動力抓取網際網路,包括搜尋爬蟲和情報收集公司。

上漲的成本和扭曲的數據

至少目前來說,好消息是這些機器人似乎沒有明確的惡意目的。它們尚未公開與任何網路攻擊聯繫起來,並且似乎沒有掃描漏洞。但缺乏明確的動機也增加了混亂。

一些網站所有者擔心這些機器人未經許可掃描受版權保護的材料。其他人說,流量激增迫使他們支付更多的頻寬費用,因為機器人流量擠掉了人類用戶,或者投資於更複雜的預防工具。訪問也會扭曲流量分析,扭曲關於誰實際訪問他們網站的報告。

但最大的影響是由那些通過吸引廣告點擊在其網站上賺取收入的人感受到的。超自然部落格的所有者 Quintero 說:“這正在摧毀我的 AdSense 策略,因為他們說[你的網站]只被機器人訪問,所以你的內容對觀眾來說沒有價值。”因此,像他這樣的網站可能被認為對廣告商的吸引力較小,並受到 Google 的懲罰。

臨時解決方案

在過去的幾個月裡,許多人一直在線上支援管道中抱怨中國 AI 機器人問題,或者直接向他們的網路託管供應商發送有關它的消息。但到目前為止,仍然沒有具體的答案。

WIRED 聯繫了 WordPress,後者承認最近幾個月已經看到一些報告,稱其某些網站正在經歷來自可疑的 AI 機器人或抓取工具的流量增加。“WordPress 網站一直具有出色的結構,使其易於被搜尋引擎找到和索引。這些相同的能力也使它們很容易被 AI 爬取,”該公司在一封未簽名的電子郵件中說。Google、Cloudflare 和 Squarespace 沒有回應置評請求。

一些網站運營商現在正在自己採取行動。在 Reddit 等社交平台上,機器人的受害者一直在交換用於識別和阻止它們的臨時策略。隨著時間的推移,他們了解到這些機器人通常會將自己呈現為使用舊版本的 Windows 作業系統和不常見的螢幕長寬比,這些特徵允許網站運營商將它們作為一個群組阻止。如果網站根本不關心來自中國或新加坡的流量,一些網站也會選擇阻止任何 IP 位址位於這些國家/地區的人訪問他們的網站。

天氣網站經理 Andy 說,他最終阻止了與騰訊、阿里巴巴和華為相關的四個 ASN。他說,這足以顯著減少機器人的數量,但並未完全消除它們。在他與 WIRED 交談的那天,來自中國機器人對他網站的每日訪問量已從高峰時的 127,000 次降至略高於 2,000 次。

隨著自主 AI 工具在整個網際網路上激增,弄清楚如何與它們作戰可能會成為網站所有者更常見的頭痛問題。Akamai 的 Maynard 說:“在某種程度上,這是身處網際網路的代價,你是開放的,並且處於公眾視野中。”

這是 Zeyi Yang 和 Louise Matsakis 的 Made in China 電子報的一個版本。在此處閱讀以前的電子報。

評論

你可能也喜歡

在你的收件匣中:註冊我們的新 Tracker: ICE 電子報

AI 代理的數學不成立

大新聞:我們正在目睹一個超級大國的自我毀滅

Apple 終於升級了 AirTag

Marhaba,世界!介紹 WIRED 中東

Image Image Image Image Image Image Image Image Image Image Image Image Image Image

© 2026 Condé Nast。保留所有權利。WIRED 可能會從通過我們網站購買的產品中賺取一部分銷售額,作為我們與零售商的聯盟合作夥伴關係的一部分。未經 Condé Nast 事先書面許可,不得複製、分發、傳輸、緩存或以其他方式使用本網站上的資料。廣告選擇