Google ga ut foreløpig dokumentasjon denne uken for sin siste Gemini 2.5 Pro Reasoning Model, men flyttingen kom uker etter at modellen ble gjort allment tilgjengelig og har tiltrukket seg skarp kritikk fra AI-styringsspesialister. Dokumentet, kjent som et”Model Card”, dukket opp på nettet rundt 16. april, men likevel hevder eksperter at det mangler kritiske sikkerhetsdetaljer og antyder at Google kan komme til å komme under gjennomsiktighetsløfter som ble gitt til regjeringer og internasjonale organer.
Kontroversen stammer fra tidslinjen: Gemini 2.5 Pro begynte sin PROVEIE-rulling i løpet av abonneren på mars 25 gemini-2.5-pro-exp-03-25, som vises 28. mars, Webapp som starter 29. mars.
Det tilhørende modellkortet som detaljerer sikkerhetsevalueringer og begrensninger, men du bare dukket opp mer enn to uker etter at denne brede offentlige tilgangen begynte.
Manglende detaljer og uoppfylte pantsettelser
En primær bekymring uttalt ved å”redusere instruksjonen som fravær av detaljerte resultater fra å være en viktig sikkerhet, slik som”Red-Team”. Bioweapons.
Han foreslo at tidspunktet og unnlatelsene kunne bety at Google “ikke hadde fullført sikkerhetstestingen før han slapp den kraftigste modellen” og “Det har fremdeles ikke fullført at testingen selv nå,”eller at selskapet har tatt i bruk en ny politikk for å holde tilbake omfattende resultater, inkludert en modell, som er ansett som en gang.
andre eksperter, inkludert en modell. Resultater eller detaljerte referanser knyttet til evalueringer under Googles egen Frontier Safety Framework (FSF), til tross for at kortet som nevnte FSF-prosessen ble brukt.
Denne tilnærmingen virker i samsvar med flere offentlige forpliktelser Google påtok seg om AI-sikkerhet og åpenhet. Disse inkluderer pantsettelser gjort på en
Thomas Woodside of Secure AI-prosjektet påpekte også at Googles siste dedikerte publikasjon om farlige muligheter for å teste datoer tilbake til juni 2024, og stilte spørsmål ved selskapets forpliktelse til regelmessige oppdateringer. Google bekreftet heller ikke om Gemini 2.5 Pro hadde blitt sendt til USA eller Storbritannias AI Safety Institutes for ekstern evaluering før forhåndsvisningsutgivelsen. Mens den fulle tekniske rapporten er i påvente, den utgitte modellkort gir noen innsikt. Google skisserer sin policy der:”En detaljert teknisk rapport vil bli publisert en gang per modell familiens utgivelse, med den neste tekniske rapporten som slippes etter at 2.5-serien er gjort generelt tilgjengelig.” Den legger til at separate rapporter om”farlige evalueringer”vil følge”ved vanlige cadens.”Google hadde tidligere uttalt at den nyeste Gemini gjennomgikk”pre-release-testing, inkludert interne utviklingsevalueringer og forsikringsevalueringer som hadde blitt utført før modellen ble utgitt.” Det publiserte kortet bekrefter Gemini 2.5 Pro-bygger på blanding-av-experts (MOE) transformatorarkitekturen. Den beskriver modellens 1 million token inngangskontekstvindu og 64K token utgangsgrense, sammen med sin opplæring på forskjellige multimodale data med sikkerhetsfiltrering på linje med Googles AI-prinsipper. Kortet inkluderer ytelsesbenken (Kjør på”gemini-2.5-pro-e-exp-03-25-versjonen) som viser konkurransedyktige resultater) som vises. Angir kunnskapsavskjæringen i januar 2025. Mens det skisserer sikkerhetsprosesser som involverer interne anmeldelser (RSC) og forskjellige avbøtninger, og viser noen automatiserte sikkerhetsmetriske forbedringer i forhold til Gemini 1.5, bekrefter den”over-refusaler”vedvarer som en begrensning. Googles posisjons-og modellkortinnhold
en bransje racing foran?