Τα τελευταία μοντέλα AI της OpenAI, που κυκλοφόρησαν επίσημα ως O3 και O4-Mini στις 16 Απριλίου, επιδεικνύουν μια εντυπωσιακή ικανότητα να προσδιοριστούν οι θέσεις του πραγματικού κόσμου που απεικονίζονται στις φωτογραφίες, προχωρώντας πέρα από την απλή αναγνώριση εικόνων σε πολύπλοκη γεωγραφική έκπτωση. Αυτή η δυνατότητα, που σημειώθηκε γρήγορα από τους χρήστες που δοκιμάζουν τα νέα μοντέλα, έχει προκαλέσει ευρεία συζήτηση σε απευθείας σύνδεση, επικεντρώθηκε κυρίως στους πιθανούς κινδύνους απορρήτου που συνδέονται τώρα με την κοινή χρήση των φαινομενικά αβλαβών υπαίθριων φωτογραφιών. Η ανακοίνωση του OpenAi υπογράμμισε ότι αυτά τα μοντέλα έχουν σημαντικά βελτιωμένη οπτική αντίληψη, επιτρέποντάς τους να -ζουμ, καλλιέργεια και περιστροφή-για να εξαγάγετε λεπτότερες λεπτομέρειες, ένα πιθανό κλειδί για τον προσδιορισμό των γεωγραφικών ενδείξεων. src=”Δεδομένα: εικόνα/svg+xml; nitro-empty-id=mtcwnzoxmjcx-1; base64, phn2zyb2awv3qm94psiwidagmta4mca2md Qiihdpzhropsixmdgwiibozwlnahq9ijywncigeg1sbnmm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>>
Αυτή η πρόοδος ακολουθεί τη συνεπή ανάπτυξη των πολυτροπικών χαρακτηριστικών του OpenAI στο ChatGPT. Μια προηγούμενη ενημέρωση στο GPT-4O τον Ιανουάριο του 2025 επικεντρώθηκε στην ενίσχυση της ανάλυσης εικόνας και της συλλογιστικής STEM. Εκείνη την εποχή, ο OpenAI ανέφερε ότι το μοντέλο έγινε όλο και καλύτερο στην ερμηνεία των χωρικών σχέσεων στις εικόνες. Αργότερα, τον Μάρτιο, η δημιουργία εικόνων και τα διαδραστικά εργαλεία επεξεργασίας ενσωματώθηκαν στην πλατφόρμα, ενισχύοντας περαιτέρω το ρόλο του ChatGPT ως εργαλείο ικανό να χειριστεί τόσο τα κείμενα όσο και τα οπτικά δεδομένα. href=”https://news.ycombinator.com/item?id=43723408″target=”_ blank”> hacker news thread που προκάλεσε ένα , γεμάτη γρήγορα με πειράματα χρήστη που δοκιμάζουν τα νέα μοντέλα. Η αρχική δημοσίευση του Fediverse από το”Piegames”ισχυρίστηκε με τόλμη,”το GeoGuesser είναι τώρα ένα επιλυμένο πρόβλημα”. Τα αποτελέσματα που μοιράζονται η κοινότητα, ωστόσο, ζωγραφίζουν μια πιο περίπλοκη εικόνα.
Ορισμένοι χρήστες πέτυχαν εντυπωσιακή ακρίβεια. Ένας έδειξε ότι το chatgpt προσδιορίζει μια σκηνή προβολής στο Cairns, που δεν έχει αναφερθεί στο Google, με το AI. προηγουμένως στο διαδίκτυο. Ωστόσο, πολλές δοκιμές αποκάλυψαν σημαντικά σφάλματα: τα μοντέλα που προκαλούν σύγχυση ηπείρων, την εσφαλμένη ταυτοποίηση μεγάλων ορόσημων, την τοποθέτηση φωτογραφιών χιλιάδων χιλιομέτρων ή την επινοώντας εσφαλμένες λεπτομέρειες. Η αξιοπιστία φαίνεται ασυνεπής, υπολείποντας τον ισχυρισμό”επίλυσης προβλημάτων”, ειδικά σε σύγκριση με τους εξειδικευμένους ανθρώπους, όπως ο πρωταθλητής GeoGuessr Rainbolt ή ακόμα και άλλα εργαλεία AI σε συγκεκριμένα σενάρια. Όπου απέτυχε, ζήτησε κάποιες ελάχιστες λεπτομέρειες και στη συνέχεια βρήκε το σωστό σημείο στη δεύτερη στροφή. Ακόμη και η ακόλουθη εικόνα ενός τυχαίου σχηματισμού βράχου που προσδιόρισε σωστά αφού υπονοούσε την αυτόνομη περιοχή στην Ισπανία όπου βρίσκεται, ονομάζοντας την ακριβή θέση του δρόμου σε έναν αγροτικό δρόμο. Τα ορόσημα cross-referencing μέσω τεχνικών αναζήτησης ιστού-mirrors που χρησιμοποιούνται από τους ανθρώπους με τους δημοφιλείς geoguessr παιχνίδι
Ενώ το AI αντιμετωπίζει αυτό δεν είναι καινούργιο-το Stanford’s μοντέλο περιστεριών href=”https://arxiv.org/abs/2408.09474″target=”_ blank”> geollm διερευνά την έννοια του 2024-η ενσωμάτωση αυτού σε μια ευρέως προσβάσιμη πλατφόρμα όπως το chatgpt αλλάζει την εξίσωση. Αυτό που απαιτούσε προηγουμένως αφιερωμένη προσπάθεια ή εμπειρογνωμοσύνη θα μπορούσε τώρα να επιτευχθεί από σχεδόν κανέναν. Ο Stalker μπορεί να το κάνει αυτό για 20 €/mo'”, ένα χρήστη. Αυτή η ανησυχία δεν είναι εντελώς νέα. Οι υποστηρικτές της ιδιωτικής ζωής έθεσαν προηγουμένως συναγερμούς σχετικά με τις δυνατότητες της AI για γεωγραφική θέση από εικόνες. Ως που αναφέρθηκαν από την chatgpt που θα το κάνει πιο χρήσιμο σε περιοχές, Για να αρνηθούν τα αιτήματα για ιδιωτικές ή ευαίσθητες πληροφορίες, οι πρόσθετες διασφαλίσεις που προορίζονται να απαγορεύσουν στο μοντέλο να εντοπίσουν ιδιώτες σε εικόνες και να παρακολουθούν ενεργά και να αναλάβουν δράση κατά της κατάχρησης των πολιτικών χρήσης μας για την ιδιωτική ζωή.”