Az AI ügynökök tendenciája, hogy a csevegésen túlmenően mozognak, hogy aktívan végezzék a dolgokat a számítógépen, újabb lépést tesznek előre. A Microsoft ezen a héten megkezdte a „számítógépes használat” funkció előnézetét a Copilot Studio alacsony kódú platformon, amelynek célja, hogy a vállalkozások olyan AI asszisztenseket építsenek, amelyek navigálhatnak és működtethetnek mind a webhelyek, mind a hagyományos asztali alkalmazásokat. Ezek az ágensek az emberi tevékenységek szimulálásával-a gombok kattintásával, a mezükbe történő beírásával, a menük kiválasztásával-működnek, hogy automatizálják a feladatok automatizálását, még olyan rendszereken is, amelyekben nincsenek modern programozási interfészek a közvetlen integrációhoz. A Copilot fogyasztói verziójában a korlátozottabb „műveletek” funkcióval ellentétben ez a Copilot Studio képesség szélesebb körű vállalati automatizálási forgatókönyveket céloz meg. Antropikus hullámok 2024 októberében egy olyan funkció bevezetésével, amelynek pontosan ugyanaz a neve, a „számítógépes felhasználás”, a Claude 3.5 szonett modelljéhez, lehetővé téve az asztali feladatok kezelését. A Google-ról is ismert, hogy hasonló képességeket fejleszt a Mariner Project néven. A Microsoft bejegyzését, amelyet a Copilot Studio Tool-ban (amely integrálódik a Power Platform-hoz), mind a Web, a Támogató Edge, a Chrome és a Firefox böngészőket célozza meg a hivatalos blog szerint), mind az asztali környezetet, amely potenciálisan szélesebb automatizálási lehetőséget kínál, mint az operátor, közvetlenül a Microsoft felhőinfrastruktúráján. src=”https://winbuzzer.com/wp-content/uploads/2025/04/microsoft-copilot-studio-computer-use-tool-umcial.jpg”>
Ai interfész-automatizáláshoz az automatizáláshoz nem volt a szoftver, a szoftvert, hogy a szoftvert az automatizáláshoz
Az alapvető problémákhoz az AI automatizáláshoz. Könnyű gépvezérlés. „Ha egy személy használhatja az alkalmazást, akkor az ügynök is lehet”, stated carles lamna lamanna , a Micrograpros, a-automation/”Target=”_ Üres”> Stated CharlesaMaNaTo-> Vállalati alelnök az üzleti és iparági és iparági copilotért, a társaság bejelentésében. Ez lehetővé teszi a nehézkes folyamatok automatizálását, például az adatbeviteli űrlapok feltöltését, az online piackutatáshoz szükséges információk összesítését vagy a digitális számlák kézi beavatkozás nélkül történő kezelését. A Microsoft számára: „valós időben beépül a beépített érveléssel a problémák kijavításához, tehát a munka megszakítás nélkül folytatódik.” Ezen automatizálás felépítése magában foglalja a kívánt feladat természetes nyelvben történő leírását, és a fejlesztők valós idejű video-visszajelzéseket kapnak, amelyek megmutatják az ügynök tervezett lépéseit a könnyebb finomítás érdekében. A társaság nemrégiben részletezte a Microsoft 365 („Kutató” és „elemző”) és a kiberbiztonság más speciális ügynökeit, és 2025 februárjában mutatták be a Magma AI Multimodal Alapítvány modelljét, amelyet a látás és cselekvés magában foglaló összetett interakciós feladatokra terveztek. A számítógéphasználati funkció előnyei ebből a háttérből, elméletileg lehetővé téve, hogy intelligensebben megértse és kölcsönhatásba lépjen a GUI-kkal. A hivatalos blog megjegyzi, hogy „a gyártók a számítógépes felhasználási tevékenységek történetét megtekinthetik, beleértve a rögzített képernyőképeket és az érvelési lépéseket.” Mindazonáltal, ha az AI-nek a szoftver interfészek működtetésére szolgáló kulcsokat adnak, a biztonsági szempontok középpontjában állnak. A funkcionalitás és a biztonság közötti megfelelő egyensúly megteremtése kulcsfontosságú lesz. Az érdeklődő feleknek az Egyesült Államokban található előnézeti környezetre van szükségük a