In un passo significativo verso un’intelligenza artificiale più autonoma, Microsoft ha presentato oggi un importante aggiornamento per il suo agente Researcher all’interno di Microsoft 365 Copilot.

L’azienda ha aggiunto una funzionalità”Utilizzo del computer”che trasforma l’agente da uno strumento che si limita a trovare e sintetizzare informazioni in uno che può esegui attivamente attività per conto di un utente.

Questa funzionalità consente all’intelligenza artificiale di navigare in siti Web complessi, interagire con contenuti autenticati e automatizzare flussi di lavoro in più fasi, segnando un’evoluzione significativa nell’approccio di Microsoft strategia di intelligenza artificiale aziendale.

Disponibile oggi ai clienti con licenza nel Programma Frontier, la funzionalità mira ad affrontare attività di ricerca che vanno oltre le semplici ricerche sul Web, come l’accesso a report di settore basati su abbonamento o la raccolta di dati da siti interattivi.

Dal ragionamento all’azione: come funziona l’uso del computer

Alla base di questa nuova funzionalità c’è un’architettura sofisticata che fornisce all’agente ricercatore un accesso controllato a un computer sicuro e virtualizzato.

Quando un utente attiva”Computer”Use,”Copilot fornisce una macchina virtuale temporanea in modalità sandbox in esecuzione su Windows 365. L’ambiente basato su cloud è dotato di un browser Web completo e di un terminale a riga di comando, consentendo all’agente di operare in modo molto simile a un assistente umano.

All’interno di questo ambiente sandbox, l’agente può sfruttare un browser visivo per navigare nelle interfacce Web, un browser di testo per un’estrazione dei dati più rapida e il terminale per scenari più avanzati e basati su codice.

La funzionalità ora estende notevolmente le competenze dell’agente oltre il suo ambito iniziale, che è diventato generalmente disponibile a giugno. Ora può fare clic sui pulsanti, digitare moduli e navigare tra contenuti riservati che richiedono credenziali.

Ad esempio, un utente potrebbe chiedere a Researcher di prepararsi per un incontro con un cliente accedendo a un sito di social media per trovare notizie recenti. Microsoft suggerisce che il principio guida sia:”Se una persona può utilizzare l’app, anche l’agente può farlo”.

Per garantire la trasparenza e la fiducia degli utenti, il sistema fornisce una”catena di pensiero visiva”. Questa interfaccia mostra gli screenshot dell’utente e gli output del terminale delle azioni dell’agente in tempo reale, consentendo un monitoraggio costante e preservando il controllo dell’utente sull’intero flusso di lavoro.

Sicurezza di livello aziendale in un ambiente sandbox

Per i clienti aziendali, la sicurezza rimane una preoccupazione fondamentale e Microsoft ha integrato diversi livelli di protezione. In esecuzione in una sandbox temporanea, il processo è completamente isolato dalla rete dal dispositivo dell’utente e dalla rete interna dell’azienda.

Nessuna credenziale utente viene mai trasferita o archiviata in questo ambiente. Quando è necessario effettuare l’accesso, Researcher richiede all’utente di assumere il controllo diretto della sessione tramite una connessione sicura di condivisione dello schermo per inserire le proprie credenziali.

Inoltre, tutto il traffico di rete in uscita dalla sandbox viene instradato attraverso un proxy che utilizza classificatori di sicurezza. Questi classificatori confermano che l’accesso web dell’agente è sicuro e pertinente alla richiesta originale dell’utente, contribuendo a proteggere da potenziali attacchi di jailbreak o cross-site scripting. Questa automazione intelligente è progettata per la resilienza.

[contenuto incorporato]

Secondo Microsoft,”Si adatta in tempo reale utilizzando il ragionamento integrato per risolvere i problemi da solo, in modo che il lavoro continui senza interruzioni.”

Per mitigare il rischio di esfiltrazione di dati, l’accesso ai dati aziendali interni di un utente, come file, chat ed e-mail, è disabilitato per impostazione predefinita ogni volta che viene attivato l’utilizzo del computer. Gli utenti possono, tuttavia, scegliere di concedere l’accesso a origini dati specifiche necessarie per la loro attività tramite un nuovo menu delle origini.

Gli amministratori hanno anche un controllo granulare, con la possibilità di abilitare la funzionalità per gruppi di sicurezza specifici e creare elenchi di autorizzazione o negazione personalizzati per i siti Web.

Ricerca più intelligente, guadagni misurabili e disponibilità

Microsoft ha sostenuto il lancio con dati provenienti dai principali benchmark di intelligenza artificiale che misurano ragionamenti complessi e attività di navigazione. Nel benchmark SfogliaComp, Researcher with Computer Use ha ottenuto risultati migliori del 44% rispetto al suo predecessore. Ha inoltre ottenuto un miglioramento del 6% rispetto al benchmark GAIA, che mette alla prova la capacità di un’intelligenza artificiale di trovare e ragionare su set di dati del mondo reale. In un impegnativo compito GAIA, l’agente ha individuato con successo un set di dati rilevante della Banca Mondiale, lo ha scaricato direttamente tramite il suo terminale e ha utilizzato Python per estrarre e filtrare i dati per produrre una risposta verificata.

Questo lancio è una parte fondamentale della più ampia spinta di Microsoft verso quella che chiama”IA agentica”, una tendenza che mira a creare assistenti in grado di eseguire attività complesse in più fasi in modo autonomo. Segue la recente introduzione di altri agenti specializzati per il “vibe working” in Excel e Word, che mirano anche ad automatizzare la creazione di documenti sofisticati da semplici istruzioni. La strategia evidenzia inoltre la crescente dipendenza di Microsoft da un approccio multi-modello, in cui sfrutta l’intelligenza artificiale di partner come Anthropic insieme al suo partner principale, OpenAI, per selezionare lo strumento migliore per un lavoro specifico.

Questa mossa strategica si allinea anche con una funzionalità di”uso del computer”dal nome simile presentata in anteprima per la piattaforma low-code di Microsoft Copilot Studio ad aprile. La coerenza tra denominazione e funzionalità suggerisce una visione unificata per la creazione di agenti IA in grado di operare nel panorama digitale, dalla ricerca aziendale alle applicazioni aziendali personalizzate. Costruendo queste potenti funzionalità, Microsoft mira a consolidare la propria posizione come fornitore indispensabile di infrastrutture IA, andando oltre le semplici interfacce di chat per fornire un’automazione tangibile.

Categories: IT Info