OpenAI a lansat astăzi ChatGPT Agent, cel mai puternic asistent AI până în prezent, urmărind să creeze un instrument care să completeze activ munca pentru utilizatori, mai degrabă decât să răspundă la întrebări. Noul agent operează un „computer virtual” pentru a efectua sarcini complexe, cu mai multe etape.
Disponibil pentru abonații plătiți începând cu 17 iulie, agentul integrează capacitățile anterioare de operator și instrumente de cercetare profundă. Această lansare escaladează cursa pentru supremația în AI agentic, implicând Openai împotriva inițiativelor de la Google, Antropic și Microsoft.
înrudit: OpenAI intră în modul de criză: De ce GPT-5 va fi momentul adevărului pentru The Chatgpt-Maker
Mutarea semnalează o schimbare strategică de la AI de conversație la sisteme care pot gestiona autonomul fluxuri de lucru digitale. Acesta înlocuiește instrumentul de operare al companiei, care a fost introdus pentru prima dată în ianuarie 2025 ca un agent mai limitat, bazat pe browser.
un agent mai puternic pentru a-ți face licitația
chatgpt agent Reprezintă cea mai îndrăzneață încercare a lui Openai de a crea un produs cu adevărat agentic. Este alimentat de un model nou, fără nume din familia Openai O3 . Sistemul este conceput pentru a descărca sarcini complexe de la utilizatori, cum ar fi planificarea evenimentelor prin verificarea unui calendar sau generând o punte de diapozitive.
Pentru a construi noul instrument, OpenAI a combinat echipele din spatele operatorului și cercetării profunde, creând un grup unificat axat pe această nouă direcție agentică. Această restructurare internă subliniază importanța strategică a trecerii dincolo de chatbot-uri simple.
Spre deosebire de predecesorii săi, agentul ChatGPT este echipat cu un set de instrumente mai cuprinzător. Acesta combină un browser vizual de la distanță cu un terminal pentru executarea codului, efectuarea analizei datelor și chiar crearea foilor de calcul.
[Conținut încorporat]
Yash Kumar, liderul produsului Openai pentru agent, a explicat că „Deoarece agentul ChatGPT are acces la un„ întreg computer “, în loc de un instrument de browser, include și conectarea, a permis agentul de acces. Surse de date externe și aplicații precum Google Drive, un pas semnificativ de la ofertele anterioare.
Modelul de bază are performanțe de ultimă generație pe valori de referință dificile. Pe Frontiermath, un test de matematică provocator, agentul a marcat 27,4% atunci când a folosit instrumentele sale, un salt masiv de la 6,3% obținut de modelul de top anterior, O4-Mini.
OpenAI recunoaște că instrumentul nu este construit pentru viteză. Conducerea cercetării, Isa Fulford, a menționat că utilizatorii nu sunt meniți să o urmărească să funcționeze, încadrându-l ca asistent de fond. “Even if it takes 15 minutes, half an hour, it’s quite a big speed-up compared to how long it would take you to do it,”she said, emphasizing its role in handling time-consuming processes.
A ‘Precautionary Approach’ to Safety and Control
Given the agent’s enhanced capabilities, OpenAI is activating SafeGuards din cadrul pregătirii sale . Aceasta este o măsură de precauție împotriva potențialului utilizare necorespunzătoare, în special în domeniile biologice și chimice, chiar și fără dovezi directe ale riscului.
Controlul utilizatorului este o temă centrală. Fulford a confirmat că „Înainte de chatgpt agent face ceva„ ireversibil “, cum ar fi trimiterea unui e-mail sau a face o rezervare, acesta solicită permisiunea mai întâi.”Această etapă de confirmare a utilizatorului este esențială pentru acțiunile cu consecințe din lumea reală, bazându-se pe proiectarea în primul rând a agentului de operator anterior.
Straturile suplimentare de siguranță includ un „mod de vizionare”. Această caracteristică întrerupe automat execuția agentului pe site-uri web sensibile, cum ar fi portalurile financiare, dacă utilizatorul navighează departe de filă. În plus, OpenAI a dezactivat funcția de memorie a lui Chatgpt la lansare pentru a atenua riscurile de exfiltrare a datelor din atacuri de injecție promptă.
Cursa pentru AI agent se încălzește
Lansarea agentului ChatGPT intensifică competiția în rândul jucătorilor importanți de tehnologie. Este un răspuns direct la instrumente similare de la rivali. Antropic a fost timpuriu cu caracteristica sa „Utilizarea computerului” pentru Claude Models, lansată în octombrie 2024.
Google este, de asemenea, investită puternic, cu proiectul său marinar și testele unei funcții „de utilizare a computerului” în studioul său AI. Microsoft, de asemenea, încorporează caracteristici asemănătoare cu agentul în studioul său de copilot. Charles Lamanna, un VP Microsoft, a capturat succint obiectivul: „Dacă o persoană poate folosi aplicația, agentul poate. Această istorie stabilește o bară înaltă pentru noul agent mai capabil.
Această apăsare competitivă vine în ciuda întrebărilor despre eficacitatea agentului. Un studiu recent Carnegie Mellon a descoperit că chiar și modelele de top AI se luptă cu sarcinile de automatizare a afacerilor, evidențiind problemele cu bunul simț și navigarea pe web. Noul agent al lui OpenAI va fi măsurat în raport cu aceste repere de performanță din lumea reală.