Các mô hình AI mới nhất của Openai, chính thức được phát hành dưới dạng O3 và O4-Mini vào ngày 16 tháng 4 đang thể hiện khả năng nổi bật để xác định các vị trí trong thế giới thực được mô tả trong các bức ảnh, vượt ra ngoài nhận dạng hình ảnh đơn giản thành khấu trừ địa lý phức tạp. Khả năng này, nhanh chóng được người dùng kiểm tra các mô hình mới, đã kích hoạt thảo luận trực tuyến rộng rãi, chủ yếu tập trung vào các rủi ro quyền riêng tư tiềm ẩn hiện nay liên quan đến việc chia sẻ các bức ảnh ngoài trời dường như vô hại. giải phóng. Thông báo của Openai đã nhấn mạnh rằng các mô hình này sở hữu nhận thức thị giác được cải thiện rõ rệt, cho phép chúng
Sự tiến bộ này theo sau sự phát triển nhất quán của Openai, các tính năng đa phương thức trong Chatgpt. Một bản cập nhật trước cho GPT-4O vào tháng 1 năm 2025 tập trung vào việc tăng cường phân tích hình ảnh và lý luận STEM. Vào thời điểm đó, Openai chỉ ra mô hình đã trở nên tốt hơn trong việc diễn giải các mối quan hệ không gian trong hình ảnh. Sau đó, vào tháng 3, các công cụ chỉnh sửa tương tác và tạo hình ảnh đã được tích hợp vào nền tảng, tiếp tục xi măng Vai trò của Chats href=”https://news.ycombinator.com/item?id=43723408″Target=”_ Blank”> Hacker News thread Đăng , nhanh chóng chứa đầy các thử nghiệm người dùng thử nghiệm các mô hình mới. Bài đăng ban đầu của Fediverse bởi Piegames”Tuyên bố mạnh dạn, Geoguesser hiện là một vấn đề được giải quyết.”Tuy nhiên, kết quả được chia sẻ bởi cộng đồng, vẽ một bức tranh phức tạp hơn.
Một số người dùng đã đạt được độ chính xác đáng kinh ngạc. Một chatgpt đã chứng minh xác định một Cảnh xem đường phố ở Cairns, Australia , trong vòng 200 mét. Hình ảnh không trực tuyến trước đây. Tuy nhiên, nhiều bài kiểm tra đã tiết lộ các lỗi đáng kể: các mô hình gây nhầm lẫn cho các lục địa, xác định sai các địa danh lớn, đặt ảnh giảm hàng ngàn km hoặc tự tin phát minh ra các chi tiết không chính xác. Độ tin cậy dường như không nhất quán, không có vấn đề gì về vấn đề đã giải quyết”, đặc biệt là khi so sánh với những người chơi có kỹ năng như nhà vô địch geoguessr Rainbolt hoặc thậm chí các công cụ AI khác trong các kịch bản cụ thể. Khi nó thất bại, nó đã yêu cầu một số chi tiết tối thiểu và sau đó tìm thấy đúng vị trí vào lượt thứ hai. Ngay cả hình ảnh sau đây về một đội đá ngẫu nhiên, nó đã xác định chính xác sau khi gợi ý đến khu vực tự trị ở Tây Ban Nha nơi nó được đặt, đặt tên chính xác vị trí đường trên một con đường nông thôn. Các địa danh tham khảo chéo thông qua các kỹ thuật của Mirrors tìm kiếm trên web được sử dụng bởi những người chơi của con người trong geoguessr trò chơi .
Mô hình Pigeon href=”https://arxiv.org/abs/2408.09474″Target=”_ Blank”> gollm Khám phá khái niệm vào năm 2024-tích hợp điều này thành một nền tảng có thể truy cập rộng rãi như Những gì trước đây cần phải có nỗ lực hoặc chuyên môn chuyên dụng trước đây có thể đạt được bởi hầu hết mọi người. Stalker có thể làm điều này với giá 20 €/tháng'”, một người dùng. Mối quan tâm này là hoàn toàn mới lạ; Những người ủng hộ quyền riêng tư trước đây đã đưa ra báo động về tiềm năng định vị địa lý của AI từ hình ảnh. Được báo cáo bởi Mashable Để từ chối các yêu cầu về thông tin riêng tư hoặc nhạy cảm, các biện pháp bảo vệ có ý định cấm mô hình xác định các cá nhân trong hình ảnh và chủ động theo dõi và hành động chống lại các chính sách sử dụng của chúng tôi đối với quyền riêng tư.”