A Microsoft a Windows 11-et „AI PC-vé” alakítja a ma bejelentett jelentős Copilot-frissítéssel, amelynek célja, hogy a számítógépekkel való interakciót természetesebbé és intelligensebbé tegye.
Az új „Hey, Copilot” ébresztőszó lehetővé teszi a felhasználók számára, hogy hangutasításokat adhassanak, míg a már világszerte elérhető Copilot Vision segítségével az AI láthatja és megértheti a képernyőn megjelenő tartalmat, és ezzel együtt kísérleti segítséget is nyújt.
Microsoft isp>. Másodpilóta műveletek, amelyek feljogosítják az asszisztenst, hogy közvetlenül a számítógépen hajtson végre feladatokat a felhasználó számára. Ezek a most megjelenő frissítések a Microsoft azon elképzelését tükrözik, hogy egy proaktív AI-partnert mélyen beágyazzon operációs rendszerének magjába.
A vállalat fogyasztói marketing igazgatója Yusuf Mehdi világosan megfogalmazta az ambíciót, és kijelentette: „Az elképzelésünk a következő: írjuk át az egész operációs rendszert az AI köré, és építsük fel lényegében azt, amiből valóban mesterséges intelligencia PC lesz.”
A felújítás azt a stratégiai fogadást jelzi, hogy a személyi számítástechnika jövője nem csak a feldolgozási teljesítményről szól, hanem az intelligens, társalgási interakcióról. A cél az, hogy minden Windows 11-es eszköz platform legyen ennek az új paradigmának a számára, amely másodpilóta csatlakozókat is tartalmaz olyan szolgáltatásokhoz, mint a Gmail.
„Hé, másodpilóta”: a hang alapvető PC-bemenetté válik
A Microsoft megújult és ambiciózus erőfeszítéseket tesz annak érdekében, hogy a hangot a számítógépes interakció elsődleges módszerévé tegye. Ennek az erőfeszítésnek a központi eleme az új „Hey, Copilot” ébresztőszó, amely már általánosan elérhető, amely eltávolítja az ikonra kattintással járó beszélgetést. Ez a funkció központi szerepet játszik a vállalat azon stratégiájában, hogy az erőteljes mesterségesintelligencia szélesebb közönség számára elérhetőbbé váljon.
A vállalatnak nem ez az első kísérlete a hangintegrációra. A kritikusok gyorsan rámutatnak a Cortana egy évtizeddel ezelőtti látványos kudarcára a Windows 10 rendszeren. A Microsoft azonban arra fogad, hogy a modern mesterséges intelligencia kifinomultsága végre meggyőzi a felhasználókat arról, hogy a számítógépükkel való beszélgetés nem furcsa, és valódi változást idéz elő a viselkedésben, ahol a korábbi erőfeszítések nem tudtak.
A vállalat magabiztosságát olyan belső adatok támasztják alá, amelyek arra utalnak, hogy amikor az emberek hangot használnak, kétszer annyit vesznek igénybe a másodpilótával, mint amikor a Microsoft már meglévő viselkedése során perceket, például szöveget használ.
értekezletek és a kisegítő lehetőségek használata annak bizonyítékaként, hogy a felhasználók már kényelmesen beszélnek az eszközeiken.
Az élményt úgy tervezték, hogy zökkenőmentes legyen. Miután engedélyezte a feliratkozási funkciót a beállításokban, a „Hé, másodpilóta” kimondásával egy mikrofon ikon és egy csengőhang jelenik meg, amely megerősíti, hogy az asszisztens figyel. A felhasználók a „Viszlát” kimondásával vagy egyszerűen leállíthatják a beszélgetést. Ez az egyszerű használat az, amiről a Microsoft úgy gondolja, hogy a „mágikus feloldás” a hang számára.
[beágyazott tartalom]
Yusuf Mehdi, a Microsoft fogyasztóvédelmi vezetője úgy véli, hogy ez a változás mélyreható lesz. „Számunk szerint a hang lesz a harmadik beviteli mechanizmus, amelyet a számítógéppel használunk” – magyarázta egy tájékoztatón.
Ez az ambíció túlmutat az egyszerű diktáláson, és a hangot olyan összetett parancsok és lekérdezések eszközeként pozicionálja, amelyek áthidalhatják a szakadékot a felhasználó szándéka és a mesterséges intelligencia késztetése között.
A végső számítógépes látásmód az igazán reagáló. „Képesnek kell lenned beszélni a számítógépeddel, meg kell értened veled, és akkor képesnek kell lenned arra, hogy varázslat történjen belőle.”
Mehdi hozzátette. Ez jelentős szerencsejátékot jelent, ami arra utal, hogy a mesterséges intelligencia végre kellően meggyőzővé tette a hangos interakciót ahhoz, hogy megváltoztassák a billentyűzet és az egér köré épülő több évtizedes felhasználói szokásokat.
A képernyőt látó mesterséges intelligencia: a Copilot Vision globálisan elterjed
A mesterséges intelligencia-központú jövő kulcsfontosságú eleme, amelyen a Copilot már csak a Copilot piacán elérhető. A funkció lehetővé teszi a mesterséges intelligencia számára, hogy „lássa” és elemezze a felhasználó képernyőjét, kontextuális segítséget nyújtva bármely alkalmazáshoz.
Ez a képesség gyorsan fejlődött az első korlátozott előnézet óta, amely az Edge böngészőre korlátozódott, és fizetős előfizetést igényelt.
A funkció a Copilotot passzív chatbotból aktív, vizuális útmutatóvá alakítja át. Az ellentmondásos Recall funkciótól eltérően a Vision szigorúan be van kapcsolva, és nincs mindig bekapcsolva.
A felhasználóknak kifejezetten engedélyt kell adniuk minden egyes munkamenethez úgy, hogy rákattintnak egy különálló „szemüveg ikonra”, ami lényegében a Teams-híváshoz hasonló módon streameli képernyőnézetüket.
A Vision aktiválása után a képernyőn megjelenő problémákkal kapcsolatban részletes utasításokat, tartalmakat vagy kérdéseket kínálhat. A képesség az egyes alkalmazások megtekintéséről a teljes „Desktop Share” módra bővült, amely lehetővé teszi a mesterséges intelligencia számára, hogy megértse a felhasználó teljes munkafolyamatának kontextusát.
[beágyazott tartalom]
A Microsoft Copilot csapata elmagyarázta a funkcionalitást, és kijelentette: „amikor megosztja az asztalát (vagy bármely meghatározott böngészőt vagy alkalmazás ablakát), a Copilot valós időben láthatja, mit lát róla, és beszélhet róla.”
A gyakorlati alkalmazások széleskörűek. A felhasználó tippeket kérhet egy kreatív projekthez, segítséget kaphat önéletrajzának javításához, vagy útmutatást kaphat egy új játékban való navigálás során. A „Kiemelések” funkció még azt is lehetővé teszi, hogy a másodpilóta vizuálisan mutassa meg, hova kell kattintani a feladat elvégzéséhez. A hatékonyság érdekében a teljes PowerPoint-prezentációt képes elemezni anélkül, hogy a felhasználónak át kellene lapoznia az egyes diákat.
A Vision lát és tanácsot is lát, de nem tud semmit tenni a felhasználó nevében; ez a képesség a különálló másodpilóta műveletek funkció számára van fenntartva. Az élmény sokoldalúbbá tétele érdekében a Microsoft egy „Text-in Text-out” módot is készít, amely lehetővé teszi a felhasználók számára, hogy a Vision szolgáltatással szövegen keresztül kommunikáljanak a hang helyett.
Ez a rendszerszintű tudatosság elengedhetetlen a valóban kontextus szerinti segítségnyújtáshoz. Azáltal, hogy megérti, mit csinál a felhasználó, a Copilot releváns támogatást nyújthat anélkül, hogy hosszas magyarázatra lenne szüksége, így közelebb kerülhet a „mindennapi társ” céljához. Egy újragondolt tálca egyetlen kattintással hozzáférést biztosít ezekhez az eszközökhöz, tovább integrálva őket az alapvető Windows-élménybe.
From A: A frissítés talán legelőremutatóbb eleme a Copilot Actions helyi fájlok kísérleti előnézete. A Windows Insiderek számára a Copilot Labs szolgáltatáson keresztül elérhető funkció lehetővé teszi az AI számára, hogy többlépéses feladatokat hajtson végre közvetlenül a felhasználó számítógépén. Ez jelentős lépést jelent az ügynöki mesterséges intelligencia jövője felé, ahol az asszisztens nem csak válaszol, hanem aktívan dolgozik az Ön nevében. Ez az új képesség a Copilotot a Microsoft által „általános célú ügynöknek” nevezettvé alakítja. Ahelyett, hogy csak válaszolna a kérdésekre, alkalmazásokat nyithat meg, gépelhet, görgethet, és összetett műveletláncokat hajthat végre. A felhasználók saját szavaikkal írhatnak le egy feladatot – például nyaralási fényképek rendezése vagy információk kinyerése PDF-ből –, és az ügyintéző asztali és webes alkalmazásokkal együttműködve kísérli meg a feladat végrehajtását. A rendszert úgy tervezték, hogy valódi digitális együttműködőként működjön. Míg az ügynök a háttérben dolgozik, a felhasználók szabadon más dolgokra összpontosíthatnak. Bármikor nyomon követhetik az ügynök előrehaladását, áttekinthetik az általa végrehajtott konkrét műveleteket, vagy akár teljesen visszavehetik a feladat irányítását. Ez a képesség a Microsoft áprilisban bejelentett webalapú műveleteire is kiterjed, és az automatizálás erejét közvetlenül a Windows asztalra viszi. A vállalat azonban áttekinthető kísérleti jellegét illetően, és a valós optimalizálási vagy felhasználási esetek szűk köréből indul ki és tanul. használja. Navjot Virk, a Microsoft Windows Experiences vállalati alelnöke figyelmeztetett, hogy a rendszer még tanul. „Kezdetben azt tapasztalhatja, hogy az ügynök hibázik, vagy kihívásokba ütközik, amikor nagyon összetett alkalmazásokat próbál használni” – jegyezte meg. Ez az átláthatóság annak a szándékos stratégiának a része, amellyel kezelni kívánjuk a felhasználók elvárásait ezzel a nagy teljesítményű, de születőben lévő technológiával szemben. [beágyazott tartalom] Tanulás a Recallból: Új fókusz az Opt-In és a biztonságraMicrosofth3. hangsúlyozva ezen új funkciók adatvédelmi központú, opcionális kialakítását. Ez az óvatos megközelítés közvetlen és szükséges válasz a Windows Recall szolgáltatása miatti heves visszhangra, amelyet súlyosan kritizáltak a bemutatása utáni jelentős biztonsági rés miatt.
A Recallt eredetileg az eszközön belüli adatvédelem ígéretével adták el. Yusuf Mehdi akkoriban kijelentette:”A Recall az Ön személyes szemantikai indexét használja fel, amelyet teljes egészében az Ön eszközén építettek fel és tároltak. A pillanatképek a tiéd; helyben maradnak a számítógépen.”
Ez az ígéret megtört, amikor a kutatók felfedezték, hogy a funkció titkosítatlan helyi adatbázisban tárolja adatait, létrehozva a sokak által”goldpintense>”-nek nevezett kártevőt. a kritika arra kényszerítette a vállalatot, hogy elhalassza a funkciót, és újratervezze a biztonságát. A Copilot Vision és az Actions segítségével a Microsoft nem kockáztat.
A vállalat egyértelmű biztonsági kötelezettségvállalásokat tett közzé, hangsúlyozva, hogy ezeket a hatékony ügynöki élményeket felelősségteljesen vezetik be.
Lényeges, hogy a Copilot Actions alapértelmezés szerint ki van kapcsolva. A felhasználóknak kifejezetten el kell dönteniük, hogy engedélyezik-e, és bármikor szüneteltethetik, átvehetik az irányítást vagy letilthatják.
A Microsoft teljes láthatóságot is ígér, lehetővé téve a felhasználók számára, hogy nyomon kövessék az ügynök előrehaladását, és áttekintsék minden lépését. Érzékeny döntések esetén az ügynök akár külön jóváhagyást is kérhet a folytatás előtt.
A Recall passzív adatrögzítésétől való elfordulás kritikus fontosságú a felhasználói bizalom kialakítása szempontjából. A Copilot Actions új modelljét úgy tervezték, hogy mindig a felhasználó kezében legyen az irányítás, ami éles ellentétben áll a Recall kezdeti mindig bekapcsolt megközelítésével. Ez a gondos, előzetes előzetes bevezetés arra szolgál, hogy visszajelzéseket gyűjtsön és finomítsa a biztonsági ellenőrzéseket a szélesebb körű kiadás előtt.
Végül a Microsoft megbízható partnerként pozicionálja AI PC-jét. Ahogy Mehdi kijelentette: „Szeretnénk, ha mindenki megtapasztalná, mit jelent egy olyan PC-vel rendelkezni, amely nem csak eszköz, hanem igazi partner is.”
Ennek az ambiciózus jövőképnek a sikere nemcsak a technológia képességén múlik, hanem azon is, hogy a vállalat képes-e meggyőzni a felhasználókat arról, hogy hatékony új AI-eszközei biztonságosak és biztonságosak is.
[emb]