Klick Labs, la divisione di ricerca di Klick Health con sede a Toronto, ha introdotto un nuovo metodo per distinguere tra clip audio umane e generate dall’intelligenza artificiale. Questo sviluppo avviene nel contesto di un’ondata di contenuti deepfake, che includono video, audio e immagini prodotti dall’intelligenza artificiale che imitano individui reali.

La proliferazione dei deepfake è stata accelerata dall’avvento di chatbot avanzati con intelligenza artificiale, ad alta generatori e replicatori vocali di qualità come quelli offerti da Elevenlabs e Truecaller. Personaggi di alto profilo come Taylor Swift, il presidente Joe Biden e il Papa sono stati tutti presi di mira da questi sofisticati falsificazioni. Europol prevede che entro il 2026, fino al 90% dei contenuti online potrebbe essere generato sinteticamente , un sentimento ripreso da Canadian Security Intelligence Service, che ha etichettato la situazione come una minaccia significativa.

Recenti truffe sulla clonazione vocale hanno ha sottolineato l’urgenza di sviluppare metodi affidabili di rilevamento dei deepfake. In risposta, Meta ha introdotto etichette obbligatorie per i contenuti generati dall’intelligenza artificiale e la Federal Communications Commission ha stabilito che le voci deepfake nelle chiamate robotizzate sono illegali. Gli esperti di politica pubblica e di intelligenza artificiale sono particolarmente preoccupati per il potenziale aumento dell’utilizzo dei deepfake in vista delle elezioni presidenziali americane.

Ispirazione tecnologica e metodologia

Yan Fossat, Vicepresidente senior della ricerca e sviluppo sulla salute digitale presso Klick Labs , ha tratto ispirazione dalla fantascienza per affrontare questo tema. Facendo riferimento a film come”Terminator”e”Blade Runner”, Fossat e il suo team hanno immaginato uno strumento simile alla macchina Voight-Kampff, che misura le risposte fisiologiche per determinarne l’autenticità. I risultati di questo approccio sono stati pubblicati nella rivista ad accesso aperto JMIR Biomedical Engineering descrivendo in dettaglio i risultati di Klick Labs.

Nel loro laboratorio di Toronto, Fossat e il suo team hanno iniziato a sperimentare l’analisi vocale. Hanno raccolto campioni audio di 49 persone con accenti e background diversi e hanno generato clip sintetiche utilizzando un generatore di deepfake. Queste clip sono state poi esaminate alla ricerca di biomarcatori vocali, caratteristiche distintive delle voci che rivelano informazioni sulla salute o sulla fisiologia di chi parla.

Klick Labs ha identificato 12.000 biomarcatori vocali, ma il loro attuale metodo di rilevamento si basa su cinque marcatori specifici: discorso lunghezza, variazione, micropause, macropause e proporzione del tempo trascorso a parlare rispetto a quello trascorso in pausa. Le micropause sono pause brevi inferiori a mezzo secondo, mentre le macropause sono più lunghe. Queste pause si verificano naturalmente nel linguaggio umano mentre le persone respirano o cercano parole.

Sfide e prospettive future

Nonostante sia stato raggiunto un tasso di successo dell’80% nell’identificazione dei deepfake , Fossat riconosce la sfida di tenere il passo con la tecnologia dell’intelligenza artificiale in rapida evoluzione. Ad esempio, i recenti progressi di OpenAI nella generazione di deepfake vocali che simulano i microrespiri hanno reso il rilevamento più complesso. Tuttavia, Fossat rimane ottimista e sottolinea che migliaia di altri biomarcatori, come la frequenza cardiaca, potrebbero essere sfruttati per futuri metodi di rilevamento.

La ricerca di Klick Labs va oltre il rilevamento dei deepfake. Stanno conducendo altri 16 studi su biomarcatori e malattie vocali, incluso uno studio pubblicato in Mayo Clinic Proceedings: Digital Health, che ha dimostrato un modello di intelligenza artificiale in grado di rilevare il diabete di tipo 2 con elevata precisione utilizzando solo 10 secondi di dati vocali. Questa ricerca continuerà in collaborazione con l’Humber River Hospital di Toronto, portando potenzialmente a strumenti diagnostici basati sul telefono.

Categories: IT Info