Klick Labs, divizioni kërkimor i Klick Health me bazë në Toronto, ka prezantuar një metodë të re për të dalluar mes klipeve audio të krijuara nga njeriu dhe AI. Ky zhvillim vjen në kohën e një rritjeje të përmbajtjes së”deepfake”, e cila përfshin video, audio dhe imazhe të prodhuara nga AI që imitojnë individë të vërtetë.

Përhapja e”deepfakeve”është përshpejtuar nga ardhja e chatbot-eve të avancuara të AI, me nivel të lartë të lartë. gjeneratorë dhe replikatorë cilësorë të zërit si ata të ofruar nga Elevenlabs dhe Truecaller. Figura të profilit të lartë si Taylor Swift, Presidenti Joe Biden dhe Papa kanë qenë të gjithë në shënjestër të këtyre falsifikimeve të sofistikuara. Europoli ka parashikuar që deri në 20926% të gjenerohet në internet, mund të gjenerohet deri në 2092% përmbajtje. , një mendim i bërë jehonë nga Shërbimi i Inteligjencës Kanadeze të Sigurisë, i cili e ka etiketuar situatën një kërcënim të rëndësishëm.

Mashtrimet e fundit të klonimit të zërit kanë shkaktuar mashtrime të fundit të klonimit të zërit. nënvizoi urgjencën e zhvillimit të metodave të besueshme të zbulimit të falsifikimit të thellë. Si përgjigje, Meta ka prezantuar etiketat e detyrueshme për përmbajtjet e krijuara nga AI dhe Komisioni Federal i Komunikimeve ka vendosur që zërat e rrejshëm në thirrjet robotike janë të paligjshme. Ekspertët e politikave publike dhe të inteligjencës artificiale janë veçanërisht të shqetësuar për rritjen e mundshme të përdorimit të falsifikimit të thellë në prag të zgjedhjeve presidenciale në SHBA.

Frymëzimi dhe Metodologjia Teknologjike

Yan Fossat, Zëvendës President i Lartë i Kërkimit dhe Zhvillimit të Shëndetit Dixhital në Klick Labs , mori frymëzim nga fantashkencë për të trajtuar këtë çështje. Duke iu referuar filmave si”Terminator”dhe”Blade Runner”, Fossat dhe ekipi i tij parashikuan një mjet të ngjashëm me makinën Voight-Kampff, i cili mat përgjigjet fiziologjike për të përcaktuar vërtetësinë. Rezultatet e kësaj qasjeje janë botuar në revistën me akses të hapur JMIR Biomedical Engineering duke detajuar gjetjet e Klick Labs. p>

Në laboratorin e tyre në Toronto, Fossat dhe ekipi i tij filluan të eksperimentojnë me analizën e zërit. Ata mblodhën mostra audio nga 49 individë me thekse dhe prejardhje të ndryshme dhe krijuan klipe sintetike duke përdorur një gjenerator të rrejshëm. Këto klipe më pas u shqyrtuan për biomarkerët vokalë—tiparet dalluese në zërat që zbulojnë informacione rreth shëndetit ose fiziologjisë së folësit.

Klick Labs ka identifikuar 12,000 bioshënues vokale, por metoda e tyre aktuale e zbulimit mbështetet në pesë shënues specifikë: të folurit. gjatësia, variacioni, mikropauzat, makropauzat dhe proporcioni i kohës së kaluar për të folur kundrejt ndalimit. Mikropauzat janë pauza të shkurtra nën gjysmë sekonde, ndërsa makropauzat janë më të gjata. Këto pauza ndodhin natyrshëm në të folurit njerëzor ndërsa njerëzit marrin frymë ose kërkojnë fjalë.

Sfidat dhe perspektivat e së ardhmes

Pavarësisht arritjes së një norme suksesi prej 80% në identifikimin e falsifikimeve të thella. , Fossat pranon sfidën e mbajtjes së ritmit me teknologjinë AI që po zhvillohet me shpejtësi. Për shembull, përparimet e fundit të OpenAI në gjenerimin e falsifikimeve të thella vokale që simulojnë mikro-frymëmarrjet e kanë bërë zbulimin më kompleks. Megjithatë, Fossat mbetet optimist, duke vënë në dukje se mijëra biomarkues të tjerë, si rrahjet e zemrës, mund të përdoren për metodat e zbulimit në të ardhmen.

Kërkimi i Klick Labs shtrihet përtej zbulimit të falsifikimit të thellë. Ata po kryejnë 16 studime të tjera mbi biomarkerët dhe sëmundjet vokale, duke përfshirë një studim të botuar në Mayo Clinic Proceedings: Digital Health, i cili demonstroi një model AI të aftë për të zbuluar diabetin e tipit 2 me saktësi të lartë duke përdorur vetëm 10 sekonda të dhëna zanore. Ky hulumtim do të vazhdojë në bashkëpunim me Humber River Hospital në Toronto, duke çuar potencialisht në mjete diagnostikuese të bazuara në telefon.

Categories: IT Info