Googles Gemini 2.5 Pro AI sikkerhetsrapport kommer sent som en"forhåndsvisning"med magre detaljer

Google ga ut foreløpig dokumentasjon denne uken for sin siste Gemini 2.5 Pro Reasoning Model, men flyttingen kom uker etter at modellen ble gjort allment tilgjengelig og har tiltrukket seg skarp kritikk fra AI-styringsspesialister. Dokumentet, kjent som et”Model Card”, dukket opp på nettet rundt 16. april, men likevel hevder eksperter at det mangler kritiske sikkerhetsdetaljer og antyder at Google kan komme til å komme under gjennomsiktighetsløfter som ble gitt til regjeringer og internasjonale organer.

Kontroversen stammer fra tidslinjen: Gemini 2.5 Pro begynte sin PROVEIE-rulling i løpet av abonneren på mars 25 gemini-2.5-pro-exp-03-25, som vises 28. mars, Webapp som starter 29. mars.

Det tilhørende modellkortet som detaljerer sikkerhetsevalueringer og begrensninger, men du bare dukket opp mer enn to uker etter at denne brede offentlige tilgangen begynte.

på den sosiale plattformen fra en probleble som en probleble fra en plattform”MEA. Kjør til bunns på AI-sikkerhet og åpenhet når selskaper skynder modellene sine til markedet.”

Manglende detaljer og uoppfylte pantsettelser

En primær bekymring uttalt ved å”redusere instruksjonen som fravær av detaljerte resultater fra å være en viktig sikkerhet, slik som”Red-Team”. Bioweapons.

Han foreslo at tidspunktet og unnlatelsene kunne bety at Google “ikke hadde fullført sikkerhetstestingen før han slapp den kraftigste modellen” og “Det har fremdeles ikke fullført at testingen selv nå,”eller at selskapet har tatt i bruk en ny politikk for å holde tilbake omfattende resultater, inkludert en modell, som er ansett som en gang.

andre eksperter, inkludert en modell. Resultater eller detaljerte referanser knyttet til evalueringer under Googles egen Frontier Safety Framework (FSF), til tross for at kortet som nevnte FSF-prosessen ble brukt.

Denne tilnærmingen virker i samsvar med flere offentlige forpliktelser Google påtok seg om AI-sikkerhet og åpenhet. Disse inkluderer pantsettelser gjort på en

Thomas Woodside of Secure AI-prosjektet påpekte også at Googles siste dedikerte publikasjon om farlige muligheter for å teste datoer tilbake til juni 2024, og stilte spørsmål ved selskapets forpliktelse til regelmessige oppdateringer. Google bekreftet heller ikke om Gemini 2.5 Pro hadde blitt sendt til USA eller Storbritannias AI Safety Institutes for ekstern evaluering før forhåndsvisningsutgivelsen.

Googles posisjons-og modellkortinnhold

Mens den fulle tekniske rapporten er i påvente, den utgitte modellkort gir noen innsikt. Google skisserer sin policy der:”En detaljert teknisk rapport vil bli publisert en gang per modell familiens utgivelse, med den neste tekniske rapporten som slippes etter at 2.5-serien er gjort generelt tilgjengelig.”

Den legger til at separate rapporter om”farlige evalueringer”vil følge”ved vanlige cadens.”Google hadde tidligere uttalt at den nyeste Gemini gjennomgikk”pre-release-testing, inkludert interne utviklingsevalueringer og forsikringsevalueringer som hadde blitt utført før modellen ble utgitt.”

Det publiserte kortet bekrefter Gemini 2.5 Pro-bygger på blanding-av-experts (MOE) transformatorarkitekturen. Den beskriver modellens 1 million token inngangskontekstvindu og 64K token utgangsgrense, sammen med sin opplæring på forskjellige multimodale data med sikkerhetsfiltrering på linje med Googles AI-prinsipper.

Kortet inkluderer ytelsesbenken (Kjør på”gemini-2.5-pro-e-exp-03-25-versjonen) som viser konkurransedyktige resultater) som vises. Angir kunnskapsavskjæringen i januar 2025. Mens det skisserer sikkerhetsprosesser som involverer interne anmeldelser (RSC) og forskjellige avbøtninger, og viser noen automatiserte sikkerhetsmetriske forbedringer i forhold til Gemini 1.5, bekrefter den”over-refusaler”vedvarer som en begrensning.

en bransje racing foran?

en bransje som er racing”. Sandra Wachter, a professor at the Oxford Internet Institute, previously told Fortune ,”Hvis dette var en bil eller et fly, vil vi ikke si: La oss bare bringe dette på markedet så raskt som mulig, og vi vil se på sikkerhetsaspektene senere. Mens det med generativ AI er en holdning til å legge dette ut der ute og bekymre deg, og å undersøke, og fikse problemene med det senere.”

Metas Llama 4-rapport møtte også kritikk for manglende detaljer. Bankston advarte om at hvis selskaper ikke kan oppfylle grunnleggende, frivillige sikkerhetsforpliktelser,”vil det pålegges lovgivere å utvikle og håndheve krav til klare transparens som selskapene ikke kan skyte.”Google fortsatte sitt utrullingstempo ved å lansere en forhåndsvisning av Gemini 2.5 Flash 17. april, og igjen om at sikkerhetspapiret “kommer snart.”

Googles Gemini 2.5 Pro AI sikkerhetsrapport kommer sent som en”forhåndsvisning”med magre detaljer

Published by All Things Windows on April 18, 2025

Manglende detaljer og uoppfylte pantsettelser

Googles posisjons-og modellkortinnhold

IT Info

USA

IT Info

Bluesky for å introdusere bekreftelsessystem for blå sjekk

IT Info

Microsoft Edge Adobe PDF Engine utrulling for bedrifter presset til slutten av 2025

Googles Gemini 2.5 Pro AI sikkerhetsrapport kommer sent som en”forhåndsvisning”med magre detaljer

Published by All Things Windows on April 18, 2025

Manglende detaljer og uoppfylte pantsettelser

Googles posisjons-og modellkortinnhold

Related Posts

IT Info

USA

IT Info

Bluesky for å introdusere bekreftelsessystem for blå sjekk

IT Info

Microsoft Edge Adobe PDF Engine utrulling for bedrifter presset til slutten av 2025