OpenAI: s senaste AI-modeller, officiellt släppt som O3 och O4-Mini den 16 april visar en slående förmåga att identifiera de verkliga platserna som visas i fotografier och flyttar utöver enkla bildigenkänningar till komplex geografiska avdrag. This capability, quickly noted by users testing the new models, has triggered widespread online discussion, primarily centered on the potential privacy risks now associated with sharing seemingly innocuous outdoor photos.
New o3 and o4-Mini Models Credited with Enhanced Visual Reasoning
The timing strongly suggests these geolocation abilities stem directly from the o3 and o4-mini släpp. OpenAI: s tillkännagivande framhöll att dessa modeller har markant förbättrad visuell uppfattning, vilket gör det möjligt för dem att “Anledning djupt om visuella ingångar” och utför exceptionellt bra på tasks involverar bild. Deras tankeprocess-zoomning, beskärning och roterande-för att extrahera finare detaljer, en metod som är troligen nyckel till att identifiera geografiska ledtrådar.
>>
Detta framsteg följer Openais konsekventa utveckling av multimodala funktioner inom chatgpt. En tidigare uppdatering av GPT-4O i januari 2025 fokuserade på att förbättra dess bildanalys och STEM-resonemang. Vid den tiden indikerade OpenAI att modellen blev bättre på att tolka rumsliga relationer i bilder. Senare, i mars, integrerades bildgenerering och interaktiva redigeringsverktyg i plattformen, ytterligare cementering av Chatgpts roll som ett verktyg som kan hantera både text-och visuella data.
Användarprov visar löfte och problem
online-forum, särskilt ett vida cirkulerade Hacker News Thread Sparkat av A , snabbt fylld med användarexperiment som testar de nya modellerna. Det ursprungliga Fediverse-inlägget av”Piegames”hävdade djärvt,”Geoguesser är nu ett löst problem.”Resultat som delas av samhället målar emellertid en mer komplex bild.
Vissa användare uppnådde häpnadsväckande noggrannhet. En demonstrerade chatgpt identifiering av en Street View Scene i Cairns, Australien , inom 200 meter, med AI-tillägget. Tidigare online. Ändå avslöjade många tester betydande fel: modeller som förvirrar kontinenter, felidentifierande stora landmärken, placerade foton tusentals kilometer av eller säkert uppfann felaktiga detaljer. Tillförlitligheten verkar inkonsekvent och faller under det”lösta problemet”-kravet, särskilt jämfört med skickliga mänskliga spelare som Geoguessr Champion Rainbolt eller till och med andra AI-verktyg i specifika scenarier.
när jag körde mina egna tester kunde O3 identifiera platser exakt i de flesta fall. Där det misslyckades bad den om några minimala detaljer och hittade sedan rätt plats vid den andra svängen. Even the following picture of a random rock formation it identified correctly after hinting to the autonomous region in Spain where it is located, naming the exact road location on a rural road.
Echoing GeoGuessr Strategy Amid Heightened Safety Concerns
The AI’s apparent method—analyzing visual cues like architecture, signage, vegetation, and possibly Korsreferenser med landmärken via webbsökning-spetsstekniker som används av mänskliga spelare i det populära Geoguessr Game .
Detta spel utmanar spelare till fastställda platser globalt bara den visuella informationen som tillhandahålls av Google gata. Medan AI-tackling är inte nytt-Stanford’s duva modell Enligt uppgift bäst regnbolt 2023 innan dess skapare höll på det på grund av säkerhetsmorror och ramverk som geollm utforskade konceptet 2024-integrering av detta i en allmänt tillgänglig plattform som chatgpt ändrar ekvationen.
kärnan, uttryckt av användare och tecknade i hela diskussioner, är den skift i den ekvation. Det som tidigare krävde dedikerad ansträngning eller expertis kan nu kunna uppnås av nästan vem som helst.
“PsA: När du postar någon utomhusfoton, uppdatera din Hote Model från någon av”någon av”Stalker kan göra detta för 20 €/mo'”, en användare var. Denna oro är inte helt ny; Förespråkare för integritet har tidigare väckt larm om AI: s potential för geolokalisering från bilder.
Som svar på dessa nya problem betonade OpenAI funktionens positiva tillämpningar och befintliga skyddsåtgärder. As reported by Mashable, an OpenAI spokesperson stated: “OpenAI o3 and o4-mini bring visual reasoning to ChatGPT, making it more helpful in areas like accessibility, research, or identifying locations in emergency response. We’ve worked to train our Modeller för att vägra förfrågningar om privat eller känslig information, tillagda skyddsåtgärder som är avsedda att förbjuda modellen att identifiera privatpersoner i bilder och aktivt övervaka och vidta åtgärder mot missbruk av vår användningspolicy för integritet.”
Trots dessa åtgärder, den snabba uppkomsten av sådana kraftfulla, tillgängliga AI-kapaciteter säkerställer dialogen runt balansering av balanser med BALANCE-teknik med personlig säkerhet.