Con questo lancio, OpenAI entra nel crescente mercato della sicurezza IA, dove competerà con CodeMender di Google e altre piattaforme. Agendo come un ricercatore di sicurezza umano, il suo nuovo strumento Aardvark trova, testa e aiuta a correggere i difetti nel codice software.
OpenAI ha annunciato giovedì l’agente basato su GPT-5, rendendolo disponibile in una beta privata. Il suo debutto accende la corsa all’automazione della difesa informatica e offre ai difensori un vantaggio critico contro le crescenti minacce.
Un approccio umano alla ricerca dei difetti
Basato sull’attesissimo modello GPT-5 dell’azienda, Aardvark è progettato per funzionare come un”agente di sicurezza”ricercatore.” Analizza continuamente i repository del codice sorgente per identificare le vulnerabilità, valutarne la sfruttabilità e proporre patch mirate da sottoporre agli sviluppatori per la revisione.
Rappresenta una svolta nell’applicazione dell’intelligenza artificiale a un dominio che è stato a lungo un lavoro manuale e dispendioso in termini di tempo.
A differenza degli strumenti di sicurezza tradizionali che basandosi su tecniche di forza bruta come il fuzzing o la semplice analisi della composizione del software, Aardvark utilizza il ragionamento basato su LLM per comprendere il comportamento e l’intento del codice.
Il vicepresidente di OpenAI, Matt Knight, ha spiegato l’approccio, affermando:”In un certo senso, cerca i bug nello stesso modo in cui potrebbe farlo un ricercatore di sicurezza umano.”
Ciò comporta la lettura e l’analisi del codice, la scrittura e l’esecuzione di test e l’utilizzo di altri strumenti per sondare i punti deboli, permettendogli di scoprire complessi, vulnerabilità in più fasi che spesso gli scanner automatici non rilevano.
Operando su una sofisticata pipeline in più fasi, l’agente inizia analizzando un intero repository per creare un modello di minaccia completo, comprendendo gli obiettivi di sicurezza e l’architettura specifici del progetto. Da lì, esegue la scansione del nuovo codice in tempo reale rispetto a questo modello per individuare potenziali problemi non appena vengono introdotti.
Quando viene rilevata una vulnerabilità, Aardvark tenta di attivarla in un ambiente sandbox isolato per confermare che si tratta di una minaccia reale e sfruttabile, riducendo efficacemente i falsi positivi.
Infine, si integra con OpenAI Codex, l’agente di codifica AI di OpenAI, per generare una patch suggerita, che è allegata alla scoperta con annotazioni dettagliate per revisione umana e implementazione con un clic.
Il suo obiettivo è fornire informazioni chiare e utilizzabili senza rallentare i cicli di sviluppo.”I nostri sviluppatori hanno trovato un valore reale nel modo in cui spiegava chiaramente i problemi e li guidava verso le soluzioni”, ha detto Knight a ZDNet.”Quel segnale ci diceva che eravamo sulla strada verso qualcosa di significativo.”
La nuova corsa agli armamenti nella difesa informatica basata sull’intelligenza artificiale
Entrando in un mercato già surriscaldato con i recenti annunci dei concorrenti, Aardvark di OpenAI è l’ultimo concorrente in una nuova corsa agli armamenti per automatizzare la sicurezza informatica.
Il lancio di OpenAI segue la presentazione da parte di Google di CodeMender all’inizio di ottobre, un agente autonomo progettato per patchare vulnerabilità utilizzando i suoi modelli Gemini.
Lo stesso strumento di Google è un’evoluzione della sua precedente intelligenza artificiale”Big Sleep”, che ha fatto notizia a luglio per aver neutralizzato in modo proattivo una minaccia critica in SQLite prima che potesse essere sfruttata, dimostrando il concetto di difesa basata sull’intelligenza artificiale.
Estendendosi oltre i giganti della tecnologia, questa tendenza include aziende affermate di sicurezza informatica. Proprio questa settimana, Palo Alto Networks ha lanciato Cortex AgentiX, una piattaforma per la creazione e la gestione di una forza lavoro di agenti di sicurezza IA progettata per automatizzare le indagini e la risposta.
Il suo CEO, Nikesh Arora, ha evidenziato il problema principale che questi strumenti mirano a risolvere, sottolineando che”l’intero atto di indagine [e] riparazione è fondamentalmente estremamente manuale nel settore.”
In tutto il settore, il consenso è chiaro: le operazioni di sicurezza manuali non possono più tenere il passo con la velocità e la portata di quelle automatizzate. attacchi. Queste piattaforme agenti rappresentano un passaggio fondamentale dalla difesa reattiva a quella proattiva, con l’obiettivo di colmare il divario temporale critico tra la scoperta delle vulnerabilità e la loro correzione.
Beta privata e impegno verso l’open source
Aardvark è ora disponibile per partner selezionati attraverso una beta privata solo su invito. Le organizzazioni interessate a partecipare devono utilizzare GitHub Cloud per i propri repository, impegnarsi a fornire feedback regolari per perfezionare le capacità dell’agente e accettare i termini di servizio di OpenAI.
OpenAI mira a convalidare le prestazioni e la precisione dell’agente in una varietà di ambienti del mondo reale prima di prendere in considerazione un rilascio più ampio.
Al di là delle sue ambizioni commerciali, OpenAI sta posizionando Aardvark come uno strumento per rafforzare l’intero ecosistema digitale, affrontando un problema di vasta portata. Con oltre 40.000 CVE segnalati solo nel 2024, le vulnerabilità del software rappresentano un rischio sistemico.
L’agente è già stato utilizzato per proteggere progetti open source, dove ha scoperto e contribuito a divulgare in modo responsabile numerose vulnerabilità.
Secondo OpenAI, i suoi sforzi hanno già portato a dieci risultati che hanno ricevuto identificatori CVE (Common Vulnerabilities and Exposures) ufficiali, un contributo significativo al pubblico sicurezza.
A governare questo lavoro è la politica di divulgazione coordinata in uscita aggiornata dell’azienda, che enfatizza un approccio collaborativo e favorevole agli sviluppatori rispetto alle rigide tempistiche di divulgazione che possono mettere sotto pressione i team con risorse insufficienti.
In linea con questo impegno, OpenAI prevede inoltre di offrire scansione pro-bono per selezionare repository open source non commerciali, che contribuiscono alla sicurezza della catena di fornitura del software che è alla base di gran parte della moderna Internet.
Segnando una pietra miliare significativa, questa nuova generazione di strumenti di sicurezza basati sull’intelligenza artificiale è pronta a rimodellare il settore. Come ha osservato Matt Knight,”Si tratta di un’area e di una capacità che fino a poco tempo fa era fuori portata. Ma nuove innovazioni l’hanno sbloccata.”
Per gli sviluppatori e i professionisti della sicurezza, l’arrivo di partner autonomi come Aardvark potrebbe finalmente cambiare l’equilibrio nella lunga battaglia contro le minacce informatiche.