Los últimos modelos de IA de Openai, lanzados oficialmente como O3 y O4-Mini el 16 de abril están demostrando una capacidad sorprendente para identificar las ubicaciones del mundo real representadas en las fotografías, yendo más allá del simple reconocimiento de imágenes en una deducción geográfica compleja. Esta capacidad, señalada rápidamente por los usuarios que prueban los nuevos modelos, ha desencadenado una discusión en línea generalizada, principalmente centrada en los riesgos de privacidad potenciales ahora asociados con compartir fotos al aire libre aparentemente inocuas.
nuevos modelos O3 y O4-Mini acreditados con el razonamiento visual mejorado
las libras de la geolications, los strongs sugieren estas colocaciones de la o3 de las o3 y las o3 de la transmisión. El anuncio de OpenAI destacó que estos modelos poseen una percepción visual notablemente mejorada, lo que les permite “Razón profundamente sobre las entradas visuales” y realiza un bien excepcionalmente bien en las tareas que involucran análisis de imágenes.
-Zooming, recorte y rotación-Para extraer detalles más finos, un método probable para identificar pistas geográficas.
>
Este avance sigue el desarrollo constante de OpenAI de características multimodales dentro de ChatGPT. Una actualización previa de GPT-4O en enero de 2025 se centró en mejorar su análisis de imágenes y razonamiento STEM. En ese momento, OpenAi indicó que el modelo estaba mejorando para interpretar las relaciones espaciales en las imágenes. Más tarde, en marzo, la generación de imágenes y las herramientas de edición interactiva se integraron en la plataforma, cementando aún más el papel de ChatGPT como una herramienta capaz de manejar los datos de texto y visual.
Las pruebas de usuarios muestran promesas y problemas
Foros en línea, particular href=”https://news.ycombinator.com/item?id=43723408″Target=”_ Blank”> Hacker News Thread Burned por un , rápidamente lleno de experimentos de usuario que prueba los nuevos modelos. La publicación original de Fediverse de”PieGames”afirmó audazmente:”El geoguesser ahora es un problema resuelto”. Los resultados compartidos por la comunidad, sin embargo, pintan una imagen más compleja.
Algunos usuarios lograron una precisión sorprendente. Un chatgpt demostrado identificando a escena de visión de calle en Cairns, Australia , dentro de 200 metros, con el ai agregando el comentario inquietamente específico,”He visto esa casa personal antes en Google Street View cuando exploran los vecinos de las Cairns. anteriormente en línea. Sin embargo, numerosas pruebas revelaron errores significativos: modelos confusos de continentes, identificando erróneamente los principales puntos de referencia, colocando fotos miles de kilómetros o inventando con confianza detalles incorrectos. La confiabilidad parece inconsistente, al no estar en el reclamo de”problema resuelto”, especialmente en comparación con los jugadores humanos calificados como el campeón de geoguessr Rainbolt o incluso otras herramientas de IA en escenarios específicos.
Al ejecutar mis propias pruebas, O3 era capaz de identificar ubicaciones con precisión en la mayoría de los casos. Donde falló, solicitó algunos detalles mínimos y luego encontró el lugar correcto en el segundo turno. Incluso la siguiente imagen de una formación rocosa aleatoria que se identificó correctamente después de insinuar la región autónoma en España donde se encuentra, nombrando la ubicación exacta de la carretera en un camino rural.
haciéndose eco de la estrategia de geoguessr en medio de preocupaciones de seguridad de seguridad
Los puntos de referencia de referencias cruzadas a través de la búsqueda web: técnicas de Mirrors utilizadas por los actores humanos en el popular Juego de Geoguessr .
Los jugadores de este juego desafían las ubicaciones para fijar las ubicaciones globalmente globalmente usando solo la información visual proporcionada por Google Street View. Mientras que AI aborda esto no es nuevo: Stanford’s modelo de paloma Según los informes, superó el arcoirlbolt en 2023 antes de que sus creadores lo retengan debido a las preocupaciones de seguridad y los marcos como geollm Exploró el concepto en 2024: integrando esto en una plataforma ampliamente accesible como la plataforma de chatgpt cambia la ecuación.
La preocupación principal de la preocupación, los usuarios y el eco de las discusiones, es el cambio en el cambio de la amenaza de la ecuación”. Lo que antes se requería un esfuerzo o experiencia dedicado anteriormente puede ser lograble por casi cualquier persona.
“PSA: cuando publique cualquiera de las fotos de cualquiera, actualice su amena Stalker puede hacer esto por 20 €/mes'”, un controlado por el usuario. Esta preocupación no es del todo novedosa; Los defensores de la privacidad han prestado alarmas sobre el potencial de AI para la geolocalización a partir de imágenes.
respondiendo a estas nuevas preocupaciones, OpenAi enfatizó las aplicaciones positivas de la función y las salvaguardas existentes. AS Informado por Mashable , un portavoz de OpenAI declaró:”OpenAi O3 y O4-Mini traen razonamiento visual para el chatgpt, lo que hace que sea más útil en áreas como accesibilidad como accesibilidad, investigaciones o localizaciones en las ubicaciones de los modelos de emergencias. Para rechazar las solicitudes de información privada o confidencial, las salvaguardas adicionales destinadas a prohibir el modelo de identificar particulares en las imágenes y monitorear activamente y tomar medidas contra el abuso de nuestras políticas de uso en la privacidad”.