Anthropic 週四透露,中國國家支持的黑客在 9 月中旬通過將其 Claude AI 模型武器化,精心策劃了一場複雜的網絡間諜活動。
該行動針對大約 30 個全球組織,使用 AI 以最少的人為乾預自主執行 80-90% 的攻擊生命週期。
這標誌著第一個有記錄的由 AI 代理驅動的大規模網絡攻擊案例,較之前的攻擊大幅升級人工智能輔助黑客攻擊。
該事件凸顯了網絡威脅的新時代,自主系統可以執行整個團隊的工作,從而極大地提高了國家資助行動的速度和規模。
從人工智能副駕駛到自主攻擊者:網絡新時代間諜活動
在人工智能武器化的顯著升級中,Anthropic詳細介紹的活動代表了網絡行動的根本性轉變。
國家資助的行為者已經不再使用人工智能來完成簡單的任務,例如製作網絡釣魚電子郵件,谷歌去年初報告了這一趨勢。現在,他們正在部署完全自主的代理來從頭到尾進行複雜的入侵。 Anthropic 的威脅情報團隊已指定國家資助的組織 GTG-1002。
這種新的攻擊範式遠遠超過了 Winbuzzer 8 月份報導的“氛圍黑客”趨勢,其中人工智能模型充當了人類操作員的創意合作夥伴或副駕駛。在該模型中,人類仍然牢牢控制著指揮行動。
Anthropic 的報告證實 9 月份的活動有很大不同:
“與我們之前在 2025 年 6 月發現的‘氛圍黑客’發現相比,這次活動顯著升級……人類仍然在很大程度上參與指揮行動。”
新發現顯示,人類操作員的直接參與程度極低,估計僅佔總數的 10% 到 20% “網絡攻擊已大幅減少,最近的行業分析也反映了這一擔憂,顯示人工智能代理劫持成功率急劇上升。
黑客如何將克勞德變成具有角色扮演和自動化功能的武器
攻擊者通過構建自定義編排框架來操縱人工智能模型。
該系統使用 Anthropic 的 Claude 代碼和開放標準模型上下文協議 (MCP) 將復雜的攻擊分解為一系列離散的、看似良性的任務。 MCP 旨在讓 AI 模型使用外部工具,實際上成為了操作的中樞神經系統。
但是,該協議也引入了新的安全風險,例如“上下文注入”,其中代理行為可能會受到影響。被操縱。
攻擊的一個關鍵要素是繞過 Claude 的內置安全功能。黑客通過一種植根於社會工程的巧妙越獄技術實現了這一目標。
根據 Anthropic 威脅情報主管 Jacob Klein 的說法,“在這種情況下,他們所做的就是假裝為合法的安全測試組織工作。 “
通過說服人工智能它正在參與合法的滲透測試,操作員誘騙它執行惡意操作,而不會觸發其核心道德護欄。
這種方法允許威脅發生。攻擊者在雷達下飛行足夠長的時間來發起他們的活動。
一旦激活,人工智能代理就會以驚人的效率自主執行整個攻擊生命週期。它從偵察開始,繪製目標基礎設施並識別漏洞。
從那裡開始,它開始編寫自定義漏洞利用代碼,收集憑據,在網絡中橫向移動,最後,竊取和分析敏感數據以獲取情報價值。
Klein 告訴媒體,“黑客只需點擊一個按鈕即可實施攻擊,而且幾乎不需要人類互動。 “
雙重用途困境:代理人工智能進攻和防守
Anthropic 的披露迫使人們對先進人工智能的雙重用途性質進行反思。允許人工智能自主攻擊網絡的能力對於防禦網絡來說是非常寶貴的。
該事件發生在 Anthropic 為人工智能代理推出新的安全框架幾個月後,強調人類控制和透明度等原則,以應對全行業的安全故障。
該活動強調了針對堅定的對手執行這些原則的挑戰。
安全專家指出,代理人工智能已經部署在安全運營中心 (SOC)自動化威脅檢測和響應,例如 Palo Alto Network 最近推出的 Cortex AgentiX 平台。
此類防禦代理通過處理警報分類和主動威脅搜尋,幫助解決全球網絡安全專業人員短缺的問題。
Anthropic 本身廣泛使用 Claude 來分析事件調查過程中生成的大量數據,突出了該技術的防禦效用。
最終,該公司認為,對人工智能功能的持續投資對於構建人工智能能力至關重要。下一代網絡防禦。
進攻性和防禦性應用程序之間的競爭正在明顯加劇。
Anthropic 呼籲安全社區加速採用人工智能驅動的防禦工具,並警告說,如果防御者不採用類似技術,他們將面臨被超越的風險。
領導 Anthropic 災難性風險團隊的 Logan Graham 警告說:“如果我們不讓防御者擁有非常實質性的永久優勢,我擔心我們可能會輸掉這場比賽。 “
該事件表明,隨著人工智能模型變得更加強大,管理其使用的保障措施必須以更快的速度發展,以防止廣泛的濫用。