Η Microsoft ξεκίνησε επίσημα το Copilot Vision για τα Windows, ξεδιπλώνοντας τον βοηθό που μοιράζεται οθόνης δωρεάν σε όλους τους χρήστες στις Ηνωμένες Πολιτείες και στα Windows 10 και στο Windows 11. Οι χρήστες, με την εταιρεία να δηλώνει στο

Η σημασία για τους χρήστες έγκειται σε αυτό το νέο στρώμα διαδραστικής βοήθειας. Η λειτουργία περιλαμβάνει”Highlights”στην οθόνη που μπορεί να κατευθύνει οπτικά έναν χρήστη σχετικά με το πού να κάνει κλικ για να ολοκληρώσει μια εργασία, παρέχοντας αποτελεσματικά οδηγίες βήμα προς βήμα στο λογισμικό. Αυτή η μετατόπιση από το παθητικό AI σε έναν ενεργό συνεργάτη διασταυρούμενης εφαρμογής σηματοδοτεί ένα σημαντικό βήμα στη στρατηγική της Microsoft για την ενσωμάτωση της τεχνητής νοημοσύνης στον πυρήνα του λειτουργικού συστήματος των Windows.

Από την πληρωμένη προεπισκόπηση σε δωρεάν για όλους

Η δημόσια εκτόξευση του οράματος Copilot είναι το αποκορύφωμα μιας προσεκτικά διαχειριζόμενης εξέλιξης από ένα εξειδικευμένο πείραμα σε μια ευρεία ανάπτυξη. Το ταξίδι ξεκίνησε στα τέλη του 2024 με αρχικές δοκιμές που περιορίζονταν στο πρόγραμμα περιήγησης Edge και απαιτούσαν από τους χρήστες να έχουν μια συνδρομή Paid Copilot Pro. Αυτή η πρώιμη έκδοση, που περιγράφεται σε προηγούμενη έκθεση, ήταν μια ματιά στο δυναμικό, αλλά παρέμεινε περιορισμένη στο πρόγραμμα περιήγησης.

Τον Απρίλιο το χαρακτηριστικό άρχισε να κυκλοφορεί στα Windows Insiders, σπάζοντας από το πρόγραμμα περιήγησης για να συνεργαστεί με οποιαδήποτε εφαρμογή στην οθόνη ενός χρήστη. Αυτή η προεπισκόπηση, που αποκάλυψε για πρώτη φορά σε μια ανακοίνωση στο blog Insider Windows, ήταν μια σαφής ένδειξη της πρόθεσης της Microsoft να ενσωματώσει το AI πιο βαθιά στο ίδιο το λειτουργικό σύστημα. Η πλήρης δημόσια απελευθέρωση ολοκληρώνει αυτή τη μετάβαση, καθιστώντας την προηγμένη λειτουργικότητα διασταυρούμενης εφαρμογής που διατίθεται σε όλους στις ΗΠΑ και στερεοποιεί την κατάστασή του ως βασικό χαρακτηριστικό των Windows. Από εκεί, οι χρήστες μπορούν να επιλέξουν να μοιραστούν ταυτόχρονα την άποψή τους για μία ή ακόμα και δύο εφαρμογές, επιτρέποντας στο AI να κερδίσει το πλαίσιο και να συνδέσει πληροφορίες μεταξύ τους. Το Copilot Vision έχει πρακτική χρησιμότητα, καθώς το AI μπορεί να καθοδηγήσει έναν χρήστη για να καταργήσει τις αντανακλάσεις φωτογραφιών στο λογισμικό επεξεργασίας εικόνων και να καθοδηγήσει τον χρήστη μέσω της διεπαφής των δημοφιλών εφαρμογών λογισμικού. Αυτή η λειτουργικότητα αποτελεί μέρος μιας ανανεωμένης διασύνδεσης copilot που αποβιβάζεται στο πλάι της οθόνης. Παράλληλα με την όραση, η Microsoft έχει επίσης δοκιμάσει μια δυνατότητα”αναζήτησης αρχείων”, η οποία εξουσιοδοτεί τον Copilot να εντοπίσει και να απαντήσει σε ερωτήσεις σχετικά με τις πληροφορίες που περιέχονται σε τοπικά αρχεία όπως το PDFS, το Spreadsheets και τα έγγραφα με το Copilot Vision’s Vision, χρονομετρημένο για την αντιμετώπιση πιθανών ανησυχιών μετά τη διαμάχη που περιβάλλει τη δυνατότητα ανάκλησης των παραθύρων. Ο χρήστης πρέπει να επιλέξει ενεργά να μοιραστεί ένα συγκεκριμένο παράθυρο με τον βοηθό για να δει ή να αναλύσει τι υπάρχει στην οθόνη σας. Αυτό το μοντέλο opt-in βρίσκεται σε έντονη αντίθεση με την πιο παθητική, πάντα κατά τη λήψη δεδομένων άλλων συστημάτων AI.

Αυτή η προσέγγιση που βασίζεται στην προστασία της ιδιωτικής ζωής αποτελεί βασικό μέρος της στρατηγικής της Microsoft σε μια όλο και πιο γεμάτη αγορά AI. Η εταιρεία τόνισε ότι όλα τα αναλυμένα περιεχόμενα είναι εφήμερο, με εκπρόσωπο που επιβεβαιώνει ότι κανένα από τα περιεχόμενα που ασχολείται με τον βοηθό δεν αποθηκεύεται ή χρησιμοποιείται για εκπαίδευση και ότι διαγράφεται μόνιμα μόλις τελειώσει η συνεδρία. 

Αυτό τοποθετεί την εκτόξευση ως απάντηση της Microsoft σε αντιπάλους, τοποθετώντας τον σε άμεσο ανταγωνισμό με συστήματα όπως το Google Gemini Live. Το Copilot Vision εξακολουθεί να βελτιώνεται μέσα στο πρόγραμμα

Μοντέλα Vision Language που αναπτύσσει η Microsoft εδώ και χρόνια. Το θεμέλιο για τέτοια εργαλεία προεπισκόπησε με την ανακοίνωση του μοντέλου της Φλωρεντίας-2 τον Ιούνιο του 2024. Αυτή η τεχνολογία αντιπροσωπεύει ένα σημαντικό άλμα στην αποδοτικότητα, η ενοποιημένη, η αρχιτεκτονική που βασίζεται σε άμεση προτροπή επιτρέπει σε ένα ενιαίο, ελαφρύ μοντέλο να χειρίζεται διαφορετικά καθήκοντα όπως η ανίχνευση και η ανίχνευση αντικειμένων που προηγουμένως απαιτούσαν πολλαπλά εξειδικευμένα συστήματα. Το ευρύτερο πεδίο της όρασης AI εξακολουθεί να αντιμετωπίζει σημαντικά εμπόδια, με μια πρόσφατη μελέτη από τον Οκτώβριο του 2024 εκθέτοντας σοβαρές ατέλειες σε κορυφαία μοντέλα, τα οποία αγωνίστηκαν με οπτικά παζλ που απαιτούσαν βασική αναγνώριση και συλλογιστική. Αυτό το πλαίσιο υπογραμμίζει ότι ενώ το όραμα Copilot αντιπροσωπεύει ένα σημαντικό βήμα προς τα εμπρός στην πρακτική βοήθεια AI, η υποκείμενη τεχνολογία βρίσκεται ακόμα σε μια πορεία ενεργού ανάπτυξης και βελτίωσης. Πρόκειται για μια στρατηγική επανατοποθέτηση του AI ως βασική χρησιμότητα του λειτουργικού συστήματος των Windows. Κάνοντας έναν ισχυρό, βοηθό διασταυρούμενης εφαρμογής ευρέως και ελεύθερα διαθέσιμο, η Microsoft στοιχηματίζει στο όραμά της για το μέλλον της προσωπικής πληροφορικής. Η επιτυχία του θα εξαρτηθεί πιθανότατα από το αν οι χρήστες αγκαλιάζουν αυτό το νέο πρότυπο ενός”καθημερινού συντρόφου”AI και εμπιστεύονται τον πρώτο σχεδιασμό της ιδιωτικής ζωής του, opt-in πάνω από τα πιο ολοκληρωμένα αλλά λιγότερο διαφανή μοντέλα των ανταγωνιστών του.