Antropic a lansat un pilot pentru „Claude for Chrome”, o nouă extensie a browserului care permite AI să ia măsuri pentru utilizatori. Anunțat astăzi, previzualizarea cercetării este limitată la 1.000 de utilizatori de încredere ai serviciului său premium. Mișcarea își propune să-l facă pe Claude mai util, permițându-i să facă clic pe butoane și să completeze formularele online.
Acest pas în automatizarea browserului este unul calculat. Antropic procedează cu o precauție semnificativă pentru a aborda amenințările grave la securitate. Compania este axată pe prevenirea „ injecție promptă”atacuri , unde comenzile ascunse de pe o pagină web ar putea păcăli AI. The pilot enters a competitive field, with OpenAI, Microsoft, and Google all developing similar AI agents.
A Cautious Step Into Browser Automation
The new extension allows Claude to see what a user is looking at and take actions on their behalf, a capability Anthropic describes as the “ următorul pas logic “în dezvoltarea sa. După ce s-a integrat cu software precum calendare și documente, oferirea AI posibilitatea de a face clic pe butoane și de a completa formularele direct în browser este privită ca o modalitate de a-l face „substanțial mai util”. Previzualizare limitată la 1.000 de utilizatori ai planului „max” al companiei. Anthropic has opened a waitlist for these trusted testers, who are expected to provide crucial feedback on the tool’s uses, deficiențe și probleme de siguranță în condiții autentice.
Compania subliniază că testarea internă nu poate reproduce complexitatea completă a modului în care oamenii răsfoiesc în lumea reală. Pilotul este necesar pentru a înțelege solicitările unice pe care utilizatorii îl fac, site-urile web pe care le vizitează și modul în care conținutul rău intenționat apare în practică, ceea ce este vital pentru construirea de măsuri de siguranță robuste.
[Conținut încorporat]
planuri antropice de a utiliza informații de la pilot pentru a-și perfecționa clasificatorii de injecție promptă, pentru a-și îmbunătăți modelele subiacente și pentru a dezvolta controale de autorizare mai sofisticate. Compania va extinde treptat accesul pe măsură ce creează încredere și va dezvolta garanții mai puternice pe baza datelor colectate în timpul acestei previzualizări limitate.
Chiar și în uz intern timpuriu, agentul a arătat promisiune în gestionarea calendarelor, gestionarea rapoartelor de cheltuieli și testarea funcțiilor site-ului. Cu toate acestea, Antropic este de părere că utilizatorii pilot să fie atenți la datele vizibile pentru Claude și să evite utilizarea extensiei pentru site-urile care implică informații financiare, legale sau medicale sensibile.
spectrul de injecție promptă
Browser-utilizarea AI introduce riscuri formidabile, care se adresează antropic cu o constituție explicată. Amenințarea principală este „injecția promptă”, în cazul în care actorii rău intenționați ascund instrucțiuni pe site-uri web, e-mailuri sau documente pentru a păcăli un agent să efectueze acțiuni nocive fără cunoștința utilizatorului. Aceste atacuri ar putea determina o AI să șteargă fișierele, să fure date sau să facă tranzacții financiare neautorizate.
„TEMING REDING”, care a implicat evaluarea a 123 de cazuri de testare în 29 de scenarii de atac diferite, a dezvăluit o legătură 23,6% rata de succes a atacului Când agentul său a fost vizat în mod deliberat fără cele mai recente atenuări de siguranță. Într-un exemplu clar, o versiune neprotejată a lui Claude a fost păcălită de un e-mail fals de securitate care pretinde că e-mailurile necesare pentru a fi șterse pentru „igiena căsuței poștale”. Promptul rău intenționat a afirmat chiar că „nu a fost necesară o confirmare suplimentară. Experimentul a evidențiat cât de ușor ar putea fi manipulat o AI în acțiuni distructive fără garanții adecvate.
Compania a implementat de atunci mai multe straturi de apărare în conformitate cu principiile sale de încredere. Prima linie de apărare este permisiunile utilizatorului; Utilizatorii pot acorda sau revoca accesul lui Claude la anumite site-uri web în orice moment. Agentul este, de asemenea, conceput să solicite confirmarea înainte de a întreprinde acțiuni cu risc ridicat, cum ar fi publicarea conținutului sau partajarea datelor cu caracter personal, chiar și atunci când operează în modul său experimental „autonom”. Cu aceste noi atenuări, rata generală de succes a atacului a fost redusă de la 23,6% la 11,2%.
Echipa s-a concentrat, de asemenea, pe atacuri noi specifice browserelor, cum ar fi câmpurile de formă dăunătoare ascunse din modelul de obiect de document al unei pagini web (DOM) și injecții prin text URL. Pe un set de „provocare” de patru astfel de tipuri de atac specifice browserului, noile apărări au redus impresionant rata de succes a atacului de la 35,7% la 0%.
Aceste amenințări nu sunt doar teoretice. Cercetătorii de la Brave au descoperit recent un real-world Vulnerabilitatea promptă a injecției în browser-ul Comet AI al Perplexity
o nouă front în AI Browser Wars
o nouă front
mișcarea antropică încălzește cursa printre giganții tehnologici pentru a dezvolta AI agentic. OpenAI a lansat puternicul său agent ChatGPT în iulie 2025, care a fost observat ocolind testele de securitate „Nu sunt un robot”. Predecesorul său mai limitat, Operator, a fost introdus în ianuarie
Microsoft este, de asemenea, un jucător major. A lansat un „mod de copilot” experimental pentru browserul său de margine în iulie, care poate înțelege contextul pe toate filele deschise. Strategia este de a încorpora AI în ecosistemul browserului existent.
Această viziune este ambițioasă, cu un executiv afirmând că „Dacă o persoană poate folosi aplicația, agentul poate și el”. Obiectivul este un colaborator perfect, așa cum a spus Sean Lyndersay, al Microsoft, că „nu vă oferă doar file nesfârșite pentru a trece, ci lucrează cu dvs. ca colaborator care are sens totul.”
Alți rivali construiesc browsere cu totul noi în jurul AI. Perplexity și-a lansat browserul de cometă premium în iulie, în timp ce Opera și-a dezvăluit browserul de neon agent în luna mai, ambele urmărind să redefinească navigarea web de la început.
Chiar și Google, regele de lungă durată al browserului, nu stă în picioare. Compania își dezvoltă liniștit propriul agent de „computer de utilizare” în studioul său AI, semnalându-și intenția de a concura în această nouă arenă.
Realitatea performanței agentului
În ciuda inovației rapide, întrebările despre eficacitatea lumii reale ale acestor agenți persistă. Un studiu din mai 2025 de la Carnegie Mellon University a constatat că chiar și agenții AI de top se luptă cu sarcini complexe de automatizare a afacerilor. Studiul a remarcat o lipsă de bun simț și rate scăzute de succes.
Acest scepticism este împărtășit de unii lideri din industrie. CEO-ul perplexității, Aravind Srinivas, a cerut prudență, afirmând: „Oricine spune că agenții va lucra în 2025 ar trebui să fie sceptic”. Acest lucru reflectă decalajul semnificativ între demonstrarea unei capacități și implementarea acesteia în mod fiabil și în siguranță la scară.
Deocamdată, dezvoltatorii se construiesc în supraveghere umană ca o plasă de siguranță critică. Conducerea Openai Research, Isa Fulford, a menționat că agentul lor necesită permisiunea acțiunilor ireversibile, explicând că „înainte de chatgpt agentul face ceva„ ireversibil “, cum ar fi să trimită un e-mail sau să facă o rezervare, acesta solicită permisiunea mai întâi. În timp ce promisiunea unei AI care ne poate gestiona viața digitală este convingătoare, industria recunoaște că era agenților cu adevărat autonomi și de încredere nu a sosit încă.
mișcarea antropică încălzește cursa printre giganții tehnologici pentru a dezvolta AI agentic. OpenAI a lansat puternicul său agent ChatGPT în iulie 2025, care a fost observat ocolind testele de securitate „Nu sunt un robot”. Predecesorul său mai limitat, Operator, a fost introdus în ianuarie
Microsoft este, de asemenea, un jucător major. A lansat un „mod de copilot” experimental pentru browserul său de margine în iulie, care poate înțelege contextul pe toate filele deschise. Strategia este de a încorpora AI în ecosistemul browserului existent.
Această viziune este ambițioasă, cu un executiv afirmând că „Dacă o persoană poate folosi aplicația, agentul poate și el”. Obiectivul este un colaborator perfect, așa cum a spus Sean Lyndersay, al Microsoft, că „nu vă oferă doar file nesfârșite pentru a trece, ci lucrează cu dvs. ca colaborator care are sens totul.”
Alți rivali construiesc browsere cu totul noi în jurul AI. Perplexity și-a lansat browserul de cometă premium în iulie, în timp ce Opera și-a dezvăluit browserul de neon agent în luna mai, ambele urmărind să redefinească navigarea web de la început.
Chiar și Google, regele de lungă durată al browserului, nu stă în picioare. Compania își dezvoltă liniștit propriul agent de „computer de utilizare” în studioul său AI, semnalându-și intenția de a concura în această nouă arenă.
Realitatea performanței agentului
În ciuda inovației rapide, întrebările despre eficacitatea lumii reale ale acestor agenți persistă. Un studiu din mai 2025 de la Carnegie Mellon University a constatat că chiar și agenții AI de top se luptă cu sarcini complexe de automatizare a afacerilor. Studiul a remarcat o lipsă de bun simț și rate scăzute de succes.
Acest scepticism este împărtășit de unii lideri din industrie. CEO-ul perplexității, Aravind Srinivas, a cerut prudență, afirmând: „Oricine spune că agenții va lucra în 2025 ar trebui să fie sceptic”. Acest lucru reflectă decalajul semnificativ între demonstrarea unei capacități și implementarea acesteia în mod fiabil și în siguranță la scară.
Deocamdată, dezvoltatorii se construiesc în supraveghere umană ca o plasă de siguranță critică. Conducerea Openai Research, Isa Fulford, a menționat că agentul lor necesită permisiunea acțiunilor ireversibile, explicând că „înainte de chatgpt agentul face ceva„ ireversibil “, cum ar fi să trimită un e-mail sau să facă o rezervare, acesta solicită permisiunea mai întâi. În timp ce promisiunea unei AI care ne poate gestiona viața digitală este convingătoare, industria recunoaște că era agenților cu adevărat autonomi și de încredere nu a sosit încă.