cele mai recente modele AI ale lui Openai, lansate oficial ca O3 și O4-MINI pe 16 aprilie demonstrează o capacitate izbitoare de a identifica locațiile din lumea reală descrise în fotografii, trecând dincolo de o simplă recunoaștere a imaginii în deducerea geografică complexă. Această capacitate, remarcată rapid de utilizatorii care testează noile modele, a declanșat o discuție online pe scară largă, centrată în principal pe potențialele riscuri de confidențialitate asociate acum cu împărtășirea unor modele aparent inofensive în aer liber.
noi modele O3 și O4-MINI creditate cu raționamente vizuale îmbunătățite
Timing-ul sugerează puternic aceste raționamente vizuale
Timing-ul sugerează puternic aceste raționamente vizuale
Timing-ul sugerează puternic aceste Abilități Geolation Abilități Geolocation, în mod direct, din O3 și O4-MIN, care sugerează puternic aceste Abilități Geolation Abilități Geolocation, direct din O3 și O4-MIN, care sugerează puternic aceste absențe geolocationare. eliberare. Anunțul lui OpenAI a subliniat faptul că aceste modele posedă o percepție vizuală îmbunătățită semnificativ, permițându-le să „Motiv profund despre intrările vizuale” și îndeplinesc în mod excepțional activitatea de activități care implică modelele de imagine. Proces-zoom, recoltare și rotire-Pentru a extrage detalii mai fine, o metodă probabil pentru identificarea indiciilor geografice.
Acest avans urmărește dezvoltarea constantă a lui OpenAI a caracteristicilor multimodale în cadrul ChatGPT. O actualizare prealabilă la GPT-4O în ianuarie 2025 s-a concentrat pe îmbunătățirea analizei imaginilor sale și a raționamentului STEM. În acel moment, Openai a indicat că modelul devine mai bun la interpretarea relațiilor spațiale în imagini. Mai târziu, în martie, instrumentele de generare a imaginilor și de editare interactivă au fost integrate în platformă, cimentând în continuare rolul lui Chatgpt ca instrument capabil să gestioneze atât datele text, cât și datele vizuale.
Testele de utilizator arată promisiune și probleme
Forumuri online, în special o circulație pe scară largă
Unii utilizatori au obținut o precizie uimitoare. Un chatgpt demonstrat identificând un Scena vizualizării străzii din Cairns, Australia , în termen de 200 de metri, cu AI-ul adăugând comentarii specifice neliniștite, „am văzut că casa exactă înainte de a fi înconjurat de la Google Street View atunci când a fost explicarea Cairs din cartierele Cairns. Anterior online. Cu toate acestea, numeroase teste au relevat erori semnificative: modele confuze continente, identificarea greșită a reperelor majore, plasarea de fotografii mii de kilometri în afara sau inventarea încrezătoare a detalii incorecte. Fiabilitatea pare inconsistentă, scăzând din cauza revendicării „Problema rezolvată”, mai ales în comparație cu jucătorii umani calificați, cum ar fi campionul Geoguessr Rainbolt sau chiar alte instrumente AI în scenarii specifice.
atunci când rulează propriile mele teste, O3 a fost capabil să identifice locațiile cu exactitate în majoritatea cazurilor. Acolo unde a eșuat, a cerut câteva detalii minime și apoi a găsit locul corect la a doua tură. Even the following picture of a random rock formation it identified correctly after hinting to the autonomous region in Spain where it is located, naming the exact road location on a rural road.
Echoing GeoGuessr Strategy Amid Heightened Safety Concerns
The AI’s apparent method—analyzing visual cues like architecture, signage, vegetation, and possibly cross-referencing Repere prin căutare web-tehnici de mirrors utilizate de jucătorii umani în popularul joc geoguessr .
Acest joc îi provoacă pe jucători să identifice locațiile la nivel global folosind doar informațiile vizuale oferite de Google Street View. În timp ce AI-ul care se confruntă cu acest lucru nu este nou-Stanford’s Model de porumbei Se presupunea că a fost cea mai bună rafină în 2023, înainte ca creatorii săi să-l rețină din cauza grijilor de siguranță și a cadrelor ca geollm a explorat conceptul în 2024-integrarea acestui lucru într-o platformă larg accesibilă, cum ar fi Chatgpt schimbă ecuația. Ceea ce a cerut anterior efort sau expertiză dedicată ar putea fi acum realizabilă de aproape oricine.
“PSA: atunci când înregistrați orice fotografie în aer liber, actualizați acest lucru de la”Stalker poate face acest lucru pentru 20 €/mo'”, un utilizator. Această preocupare nu este în totalitate inedită; Avocații de confidențialitate au ridicat anterior alarme cu privire la potențialul AI pentru geolocalizare din imagini.
Răspunzând la aceste noi preocupări, OpenAI a subliniat aplicațiile pozitive ale funcției și garanțiile existente. AS raportat de Mashable , un purtător de cuvânt al Openai a declarat: „Openai O3 și O4-Mini aduc raționamente vizuale la chatgpt, făcându-l mai mult în domeniu în domeniul accesului, cercetării sau identificării locurilor de caz Modelele noastre pentru a refuza solicitările de informații private sau sensibile, adăugate garanții destinate să interzică modelului să identifice persoanele private în imagini și să monitorizeze activ și să ia măsuri împotriva abuzului asupra politicilor noastre de utilizare cu privire la confidențialitate.”
În ciuda acestor măsuri, apariția rapidă a unor astfel de capacități AI accesibile asigură dialogul în jurul echilibrării progreselor tehnologice, cu o capacitate de securitate personală, care se ocupă.