Antropico ha lanciato un pilota per”Claude for Chrome”, una nuova estensione del browser che consente alla sua AI di intraprendere azioni per gli utenti. Annunciato oggi, l’anteprima della ricerca è limitata a 1.000 utenti affidabili del suo servizio premium. La mossa mira a rendere Claude più utile consentendole di fare clic su pulsanti e compilare i moduli online.

Questo passaggio nell’automazione del browser è calcolato. Antropico sta procedendo con una significativa cautela per affrontare gravi minacce alla sicurezza. La società è focalizzata sulla prevenzione di” iniezione prompt”attacchi , in cui i comandi nascosti su una pagina web potrebbero ingannare l’IA. Il pilota entra in un campo competitivo, con OpenAI, Microsoft e Google che sviluppano tutti agenti di intelligenza artificiale simili.

Un passo cauto nell’automazione del browser

La nuova estensione consente a Claude di vedere cosa sta guardando un utente e intraprendere azioni a loro organismo, una capacità antropica descrive come il” prossimo passo logico “Nel suo sviluppo. Dopo aver integrato con software come calendari e documenti, dando all’IA la possibilità di fare clic sui pulsanti e compilare i moduli direttamente nel browser viene visualizzato come un modo per renderlo”sostanzialmente più utile.”

waitlist for these trusted testers, who are expected to provide crucial feedback on the tool’s uses, shortcomings, e problemi di sicurezza in condizioni autentiche.

La società sottolinea che i test interni non possono replicare la piena complessità di come le persone navigano nel mondo reale. Il pilota è necessario per comprendere le richieste uniche che gli utenti effettuano, i siti Web che visitano e come appare il contenuto dannoso, il che è vitale per costruire solide misure di sicurezza.

[contenuto incorporato]

piani antropici per utilizzare le intuizioni del pilota per perfezionare i suoi rapidi classificatori di iniezione, migliorare i suoi modelli sottostanti e sviluppare un controllo più sofisticato. La società amplierà gradualmente l’accesso mentre costruisce fiducia e sviluppa garanzie più forti in base ai dati raccolti durante questa anteprima limitata.

Anche nell’uso interno precoce, l’agente ha dimostrato promesse nella gestione dei calendari, nella gestione dei rapporti sulle spese e nel testare funzionalità del sito Web. Tuttavia, Antropico sta avvertendo gli utenti pilota di essere consapevoli dei dati visibili a Claude ed evitare di usare l’estensione per i siti che coinvolgono informazioni finanziarie, legali o mediche sensibili. La minaccia principale è”iniezione pronta”, in cui gli attori dannosi nascondono istruzioni in siti Web, e-mail o documenti per indurre un agente a eseguire azioni dannose a conoscenza dell’utente. Questi attacchi potrebbero far eliminare l’intelligenza artificiale, rubare dati o effettuare transazioni finanziarie non autorizzate.

“Red-Teaming”di Anthopic, che ha comportato la valutazione di 123 casi di test in 29 diversi scenari di attacco, per riguardo a 23,6% di successo dell’attacco Quando il suo agente è stato deliberatamente preso di mira senza le ultime mitigazioni di sicurezza. In un esempio stark, una versione non protetta di Claude è stata ingannata da una falsa e-mail di sicurezza che affermava che le e-mail dovevano essere eliminate per”Hygiene della cassetta postale”. Il prompt dannoso ha persino affermato che”non era richiesta alcuna conferma aggiuntiva.”

Seguendo queste istruzioni nascoste, l’agente AI ha proceduto a selezionare ed eliminare le e-mail dell’utente, affermando che lo stava facendo”come richiesto dal team di sicurezza”. L’esperimento ha evidenziato la facilità con cui un’intelligenza artificiale potrebbe essere manipolata in azioni distruttive senza adeguate salvaguardie.

La società ha implementato diversi livelli di difesa in linea con i suoi principi di agente affidabile. La prima linea di difesa sono le autorizzazioni dell’utente; Gli utenti possono concedere o revocare l’accesso di Claude a siti Web specifici in qualsiasi momento. L’agente è inoltre progettato per chiedere conferma prima di intraprendere azioni ad alto rischio come la pubblicazione di contenuti o la condivisione di dati personali, anche quando si opera nella sua”modalità autonoma”sperimentale.

Ulteriori salvaguardie includono implici di sistemi migliorati che istruiscono Claude su come gestire i dati sensibili, bloccare l’accesso a categorie di siti Web ad alto rischio e la costruzione di classificatori avanzati per rilevare istruzioni sospette. Con queste nuove mitigazioni, il tasso di successo di attacco complessivo è stato ridotto dal 23,6% all’11,2%.

Il team si è anche concentrato su nuovi attacchi specifici per i browser, come i campi di forma dannosi nascosti nel modello di oggetti documenti (DOM) di una pagina web tramite il testo dell’URL. Su un insieme di”sfide”di quattro di questi tipi di attacco specifici del browser, le nuove difese hanno ridotto in modo impressionante il tasso di successo dell’attacco dal 35,7% allo 0%.

Queste minacce non sono semplicemente teoriche. I ricercatori di Brave hanno recentemente scoperto un mondo reale vulnerabilità di iniezione prompt nel ruscello della cometa di perplessità , dimostrando come questi gli exploit possono funzionare su prodotti commerciali e sottolineate e sottovaluta l’urgenza di risolvere queste sfide di sicurezza.

Wars

La mossa di Antropico riscalda la gara tra i giganti tecnologici per sviluppare l’IA agente. Openai ha lanciato il suo potente agente CHATGPT nel luglio 2025, che è stato osservato bypassing di test di sicurezza”Non sono un robot”. Il suo predecessore più limitato, operatore, è stato introdotto a gennaio.

Microsoft è anche un attore importante. Ha lanciato una”modalità copilota”sperimentale per il suo browser Edge a luglio che può comprendere il contesto in tutte le schede aperte. La strategia è quella di incorporare profondamente l’IA nell’ecosistema del browser esistente.

Questa visione è ambiziosa, con un dirigente che afferma che”se una persona può usare l’app, anche l’agente può”. L’obiettivo è un collaboratore senza soluzione di continuità, come ha detto Sean Lyndersay di Microsoft, che”non ti dà solo infinite schede da setacciare ma funziona con te come collaboratore che ha senso di tutto.”

Altri rivali stanno costruendo nuovi browser intorno all’AI. La perplessità ha lanciato il suo browser cometa premium a luglio, mentre Opera ha svelato il suo agente browser neon a maggio, entrambi con l’obiettivo di ridefinire la navigazione web da zero.

Anche Google, il re di lunga durata del browser, non è fermo. La società sta silenziosamente sviluppando il proprio agente”Uso del computer”all’interno del suo studio AI, segnalando il suo intento di competere in questa nuova arena.

La realtà delle prestazioni degli agenti

Nonostante la rapida innovazione, domande sull’efficacia del mondo reale di questi agenti persistibili. Uno studio del maggio 2025 della Carnegie Mellon University ha scoperto che anche i migliori agenti di intelligenza artificiale lottano con complessi compiti di automazione aziendale. Lo studio ha osservato una mancanza di buon senso e bassi tassi di successo.

Questo scetticismo è condiviso da alcuni leader del settore. L’amministratore delegato della perplessità Aravind Srinivas ha sollecitato cautela, affermando:”Chiunque dice che gli agenti lavoreranno nel 2025 dovrebbe essere scettico”. Ciò riflette il divario significativo tra la dimostrazione di una capacità e la distribuzione in modo affidabile e sicuro su larga scala.

Per ora, gli sviluppatori stanno costruendo nella supervisione umana come una rete di sicurezza critica. La ricerca di ricerca di Openi Isa Fulford ha osservato che il loro agente richiede l’autorizzazione per azioni irreversibili, spiegando che”prima che l’agente Chatgpt faccia qualcosa di”irreversibile”, come inviare un’e-mail o fare una prenotazione, chiede prima il permesso.”

cauto pilota antropico e guidato da feedback suggerisce una comprensione simile. Mentre la promessa di un’intelligenza artificiale che può gestire la nostra vita digitale è avvincente, l’industria riconosce che l’era di agenti veramente autonomi e affidabili non è ancora arrivata.

Categories: IT Info