Microsoft avdekker"Whisper Leak"-feil, og avslører krypterte AI-chatter på tvers av 28 LLM-er

Microsoft-forskere har detaljert et nytt sidekanalangrep kalt”Whisper Leak”som kan gjette emnet for krypterte AI-chatter, og avsløre en grunnleggende personvernrisiko på tvers av AI-industrien.

I en nettverksrapport viser hvor stor trafikk og hvor mange brukere er, og hvor mange timer det er diskutere, selv med TLS-kryptering. Feilen påvirker 28 store AI-modeller, og skaper en alvorlig personvernrisiko for brukere globalt. En observatør på et nettverk kan oppdage sensitive samtaler om juridiske eller helsemessige emner.

Etter en avsløringsprosess som startet i juni, har store leverandører som OpenAI og Microsoft begynt å distribuere rettelser, men problemet peker på en kjernerisiko ved strømming av AI.

Hvordan Whisper Leak avlytter krypterte AI-chatter

Angrepets oppfinnsomhet ligger i dets evne til å fungere uten å bryte TLS-krypteringene. I stedet utnytter den metadataene som kryptering iboende etterlater.

I følge prosjektets dokumentasjon er”Whisper Leak et forskningsverktøysett som demonstrerer hvordan krypterte, streamende samtaler med store språkmodeller lekker raskt informasjon gjennom pakkestørrelser og timing.”

Metoden omgår sikkerhetens form og fokus ved å omgå sikkerheten. flyt.

LLM-svar, generert token-by-token, skaper unike sekvenser av datapakker når de strømmes til en bruker. Hvert emne, fra juridisk analyse til uformell samtale, genererer tekst med distinkte ordforråd og setningsstrukturer. Disse språklige mønstrene produserer et karakteristisk”digitalt fingeravtrykk”i nettverkstrafikken.

Forskerne analyserte sekvenser av pakkestørrelser og tider mellom ankomst og bygde klassifikatorer for å gjenkjenne disse fingeravtrykkene med høy nøyaktighet.

bekrefter denne metoden, som bruker maskinlæringsmodeller for å lære de subtile signaturene til forskjellige samtaletyper. Selv med kryptert innhold forråder trafikkmønstrene samtalens emne.

En bransjebrist som påvirker 28 store AI-modeller

Whisper Leak er ikke en isolert feil, men en systemisk sårbarhet som påvirker et bredt spekter av AI-industrien. Microsoft-teamet testet 28 kommersielt tilgjengelige LLM-er, og fant at flertallet var svært mottakelige.

For mange modeller oppnådde angrepet nesten perfekt klassifisering. Forskere bemerket i et blogginnlegg,”Dette forteller oss at de unike digitale”fingeravtrykkene”som etterlates av samtaler om et spesifikt emne, er tydelige nok til at vår AI-drevne avlytting kan plukke dem ut på en pålitelig måte i en kontrollert test. Forskningen demonstrerte alarmerende presisjon under realistiske forhold.

I en simulering med et forhold på 10 000 til 1 mellom bakgrunnsstøy og målsamtaler, identifiserte angrepet sensitive emner med 100 % presisjon for 17 av de 28 modellene, samtidig som det ble oppdaget 5–20 % av alle målsamtaler, som f.eks. eller en angriper på et offentlig Wi-Fi-nettverk, kan pålitelig identifisere brukere som diskuterer konfidensielle juridiske, økonomiske eller helsemessige forhold.

Denne funksjonen gjør krypterte AI-chatter til en potensiell kilde for målrettet overvåking. Som forskerne uttaler:”Denne sårbarheten for hele bransjen utgjør betydelig risiko for brukere under nettverksovervåking av Internett-leverandører, myndigheter eller lokale motstandere.”

Leverandør-modell BERT LSTM LightGBM Best Begge Størrelse Kun Tid Kun begge Størrelse Kun Tid Kun begge Størrelse Kun Tid Totalt mistral-large 98,5% 9.98,5% 9.9% 100,0 % 64,3 % 95,8 % 96,0 % 59,5 % 100,0 % microsoft-deepseek-r1 98,6 % 98,9 % 46,3 % 99,9 % 99,9 % 61,0 % 94,8 % 95,8 % 9. xai-grok-3-mini-beta 99,1 % 98,8 % 73,0 % 99,9 % 99,9 % 73,2 % 97,2 % 97,5 % 74,9 % 99,9 % mistral-small 98,3 % 97,6 % 60,7 % 99,9 % 99,9 % 94,1 % 94,3 % 61,3 % 99,9 % groq-llama-4-maverick 99,3 % 99,2 % 52,9 % 99,6 % 99,7 % 56,4 % 93,6 % 94,2 % 60,4 % 99,7 % dyp 8-8 % dyp 98,6 % 46,5 % 99,3 % 99,4 % 62,5 % 96,7 % 96,9 % 65,4 % 99,4 % alibaba-qwen2,5-pluss 98,0 % 97,7 % 66,3 % 99,1 % 9350 % 99,1 % 99,50 %. 67,4 % 99,1 % xai-grok-2 99,0 % 98,8 % 66,9 % 98,5 % 98,7 % 70,1 % 93,2 % 94,9 % 72,9 % 99,0 % alibaba-qwen2,5-turbo 97,5 % 97,5 % 97,5 % 97,5 % 97,6 % 71,8 % 99,0 % 98,9 % 71,2 % 99,0 % openai-o1-mini 97,8 % 98,0 % 58,7 % 98,9 % 98,9 % 62,1 % 97,0 % 96,9 % ai-mini-96,9 % 96,9 % ai-pt. 97,5 % 97,8 % 76,7 % 98,2 % 98,3 % 75,4 % 98,6 % 98,6 % 72,6 % 98,6 % deepseek-deepseek-v3-chat 98,3 % 98,0 % 58,6 % 97,6 % 97,6 % 98,6 % 98,6 % 97,6 % 60,6 % 98,3 % openai-gpt-4,1-mini 96,8 % 96,6 % 78,5 % 97,3 % 98,0 % 77,6 % 97,4 % 97,3 % 76,3 % 98,0 % lambda-lama-struktur 9 %-8-5in. 59,9 % 76,3 % 97,8 % 68,3 % 91,9 % 92,5 % 59,6 % 97,8 % lambda-llama-3,1-405b 97,7 % 97,5 % 62,6 % 93,2 % 96,6 % 96,6 % 96,6 % 96,6 % 56,2 % 97,7 % groq-llama-4-speider 97,6 % 97,3 % 60,3 % 68,5 % 70,0 % 64,8 % 89,0 % 89,6 % 57,4 % 97,6 % openai-gpt-4,1-nano 96,8 % 76,1 % 76,1 % 9 97,1 % 75,5 % 96,2 % 96,4 % 77,1 % 97,1 % microsoft-gpt-4o-mini 93,4 % 93,2 % 77,8 % 88,5 % 81,3 % 81,8 % 91,3 % 91,5 % 37,5 % 37-laude 90,2 % 76,8 % 78,7 % 91,2 % 80,1 % 80,0 % 87,9 % 74,5 % 77,9 % 91,2 % microsoft-gpt-4,1-nano 89,5 % 91,0 % 84,0 % 88,4 % 8.6 % 8.6 % 8. 86,9 % 80,5 % 91,0 % microsoft-gpt-4o 89,9 % 90,1 % 78,0 % 87,2 % 81,4 % 83,0 % 87,3 % 87,9 % 77,7 % 90,1 % microsoft-gpt-4,1 % 8,4 % mini 8,4 % 8,4 % mini. 86,7 % 80,4 % 78,9 % 86,6 % 87,3 % 76,0 % 89,7 % google-gemini-2.5-pro 77,1 % 74,3 % 78,1 % 83,1 % 76,3 % 82,4 % 84,5 % 8.4 % 8.4 % 8.4 % 8.4 % google-gemini-1,5-flash 81,0% 76,2% 80,2% 82,4% 78,3% 81,6% 83,5% 81,6% 82,8% 83,5% google-gemini-1,5-blits-lys 79,9% 7946,7% 7946. 79,0 % 81,9 % 77,8 % 81,4 % 81,9 % amazon-nova-pro-v1 46,2 % 57,9 % 46,6 % 77,5 % 74,9 % 57,3 % 60,9 % 60,6 % 57,6 % micro 7-in-phi. 70,0 % 70,0 % 75,3 % 75,3 % 72,1 % 76,9 % 75,9 % 72,5 % 74,4 % 76,9 % amazon-nova-lite-v1 67,6 % 68,3 % 63,2 % 71,5 % 67,5 % 67,5 % 67,5 % 65,5% 65,1% 71,2% Gjennomsnitt 96,8% 96,8% 70,9% 93,2% 97,1% 71,8% 92,5% 93,3% 69,7% nan%

Angrepsytelse (AUPRC) angitt av funksjoner som er angitt av vertene angitt av LLMs og vertene. arkitektur. Høyere tall tilsvarer en høyere effektivitet av sidekanalangrepet. Beregninger beregnes som en median over 5 forsøk, hvor en tilfeldig splittelse utføres per forsøk.’Best’-kolonnen er også den beste 5 prøvemedianen fra modellene og funksjonssettene som er brukt. (Kilde: Microsoft)

En vanskelig løsning: avbøtende og inkonsekvente leverandørrespons

Microsoft startet en ansvarlig avsløringsprosess i juni 2025, og varslet alle 28 berørte leverandører. Fra og med november har svarene vært blandede.

Mens leverandører som OpenAI, Microsoft, Mistral og xAI flyttet for å rette opp feilen, bemerker rapporten at andre leverandører har avslått å implementere rettelser eller ikke har reageret.

Denne hendelsen fremhever en urovekkende inkonsekvens i hvordan industrien håndterer nye trusler. Den følger etter at Google i oktober nektet å fikse en kritisk”ASCII-smugling”-feil i Gemini-modellene, som den klassifiserte som et sosialt ingeniørproblem i stedet for en sikkerhetsfeil.

Det gjenspeiler også en nylig sårbarhet for dataeksfiltrering i Anthropics Claude, der selskapet først avviste rapporten før de erkjente en”Sikkerhetsforskning ikke Rehberg>”.

i så fall”beskytter sikkerhet deg mot ulykker. Sikkerhet beskytter deg mot motstandere.”Skillet er kritisk ettersom AI-agenter blir mer autonome og integrert med sensitive data.

Å fikse metadatalekkasjer er ikke enkelt. Forskerne evaluerte flere avbøtende tiltak, hver med betydelige avveininger. Tilfeldig datautfylling, nå implementert av enkelte leverandører, legger til støy til pakkestørrelser, men reduserer bare delvis angrepssuksess.

En annen strategi, token-batching, grupperer flere tokens før de sendes, og skjuler individuelle mønstre. Selv om dette er effektivt ved større batchstørrelser, kan dette forringe sanntidsresponsen til en chatbot, og påvirke brukeropplevelsen.

Et tredje alternativ, å injisere syntetiske «støy»-pakker, kan også fordunkle trafikkmønstre. Denne tilnærmingen øker imidlertid båndbredden, noe som er en betydelig kostnadsbetraktning for leverandørene.

Episoden viser at etter hvert som AI blir mer integrert i sensitive arbeidsflyter, krever beskyttelse av brukernes personvern at man ser utover innholdskryptering for å sikre selve mønstrene for digital kommunikasjon

Microsoft avdekker”Whisper Leak”-feil, og avslører krypterte AI-chatter på tvers av 28 LLM-er

Published by All Things Windows on November 10, 2025

Hvordan Whisper Leak avlytter krypterte AI-chatter

En bransjebrist som påvirker 28 store AI-modeller

En vanskelig løsning: avbøtende og inkonsekvente leverandørrespons

IT Info

Topp pakistansk avis skriver ut AI-respons under generert historie

IT Info

EU retter seg mot Googles nyhetsrangering i ny antitrust-probe midt i utgiveropprør

IT Info

Slik fjerner du Bloatware fra Windows 11

Microsoft avdekker”Whisper Leak”-feil, og avslører krypterte AI-chatter på tvers av 28 LLM-er

Published by All Things Windows on November 10, 2025

Hvordan Whisper Leak avlytter krypterte AI-chatter

En bransjebrist som påvirker 28 store AI-modeller

En vanskelig løsning: avbøtende og inkonsekvente leverandørrespons

Related Posts

IT Info

Topp pakistansk avis skriver ut AI-respons under generert historie

IT Info

EU retter seg mot Googles nyhetsrangering i ny antitrust-probe midt i utgiveropprør

IT Info

Slik fjerner du Bloatware fra Windows 11