A
Openai ma elindította a Chatgpt Agent-et, a mai napig a legerősebb AI-asszisztenst, amelynek célja egy olyan eszköz létrehozása, amely aktívan befejezi a felhasználók számára a munkát, ahelyett, hogy csak a kérdések megválaszolná. Az új ügynök „virtuális számítógépet” üzemeltet komplex, többlépcsős feladatok elvégzésére. Ez az indítás eszkalálja az Agentic AI-ben a felsőbbrendű versenyt, és az Openai-t a Google, az Antropic és a Microsoft kezdeményezései ellen. src=”https://winbuzzer.com/wp-content/uploads/2025/07/openai-chatgpt-agent.jpg”>
A lépés stratégiai elmozdulást jelez a beszélgetési AI-ről olyan rendszerekre, amelyek autonóm módon kezelhetik a digitális munkafolyamatokat. Felhelyezi a vállalat üzemeltetői eszközét, amelyet először 2025 januárjában vezettek be egy korlátozottabb, böngésző-alapú ügynökként. képviseli az Openai legmerészebb kísérletét, még egy valóban agentikus termék létrehozására. Ez Az Openai O3 család új, névtelen modelljével hajtja meg. A rendszert úgy tervezték, hogy összetett feladatokat töltsön el a felhasználóktól, például az események tervezési naptárának ellenőrzésével vagy egy csúszdakép létrehozásával. Ez a belső szerkezetátalakítás hangsúlyozza az egyszerű chatbotok túllépésének stratégiai fontosságát. Egyesíti a távoli vizuális böngészőt egy terminálral a kód végrehajtásához, az adatok elemzéséhez és akár a táblázatok létrehozásához. olyan források és alkalmazások, mint a Google Drive, ami jelentős lépés a korábbi ajánlatokhoz képest. A Frontiermath-on, egy kihívást jelentő matematikai teszten, az ügynök 27,4%-ot szerzett szerszámok használatakor, ez egy hatalmas ugrás az előző csúcsmodell, az O4-mini. Az Isa Fulford kutatási vezetője megjegyezte, hogy a felhasználók nem célja, hogy figyeljék, hogy működik, és háttér-asszisztensnek tekintik.”Még ha 15 percbe telik, fél órát is igénybe vesz, ez elég nagy gyorsítás, összehasonlítva azzal, hogy mennyi ideig tartana, hogy megtegye”-mondta a nő, hangsúlyozva az időigényes folyamatok kezelésében játszott szerepét. href=”https://cdn.openai.com/pdf/18a02b5d-6b67-4cec-ab64-68cdfbddebcd/preparedness-framework-v2.pdf”cél=”_ blank”> Megbiztonságok az előkészítő keretről. Ez egy óvintézkedés a potenciális visszaélés ellen, különösen a biológiai és kémiai területeken, még a kockázat közvetlen bizonyítéka nélkül is.
A felhasználói ellenőrzés központi téma. Fulford megerősítette, hogy „mielőtt a Chatgpt ügynök bármi„ visszafordíthatatlan “, például e-mail küldése vagy foglalás elküldése, először engedélyt kér.”Ez a felhasználói megerősítési lépés kritikus jelentőségű a valós következményekkel járó tevékenységekhez, a korábbi operátor ügynökének első első tervezésére építve. Ez a szolgáltatás automatikusan szünetelteti az ügynök végrehajtását az érzékeny webhelyeken, például a pénzügyi portálokon, ha a felhasználó elindul a laptól. Ezenkívül az OpenAi letiltotta a CHATGPT memória funkcióját az indításkor, hogy enyhítse az adatok exfiltrációs kockázatait az azonnali injekciós támadásokból. Ez egy közvetlen válasz a riválisok hasonló eszközeire. Az antropikus korai volt a Claude Models „Computer Használat” funkciójával, amelyet 2024 októberében adtak ki. A Microsoft is beágyazódik az ügynöki jellegű funkciókba a Copilot Stúdiójába. Charles Lamanna, a Microsoft VP, tömören megragadta a célt: „Ha egy személy használhatja az alkalmazást, akkor az ügynök is képes.”
Még az indítás előtt, az Openai operátora versenyképes, túlteljesítő riválisokat mutatott be olyan referenciaértékeken, mint a WebVoyager és az OsWorld, amelyek tesztelőkor és rendszerszintek. Ez a történelem magas rudat állít be az új, tehetségesebb ügynök számára. Egy nemrégiben készült Carnegie Mellon-tanulmány kimutatta, hogy még a legnépszerűbb AI modellek is küzdenek az üzleti automatizálási feladatokkal, kiemelve a józan ész és a webböngészés kérdéseit. Az Openai új ügynökét mérni kell ezeknek a valós teljesítményű referenciaértékeknek.