Openai sot nisi Agjentin ChatGPT, ndihmësi i tij më i fuqishëm i AI deri më sot, duke synuar të krijojë një mjet që përfundon në mënyrë aktive punën për përdoruesit në vend se të përgjigjet vetëm në pyetje. Agjenti i ri operon një”kompjuter virtual”për të kryer detyra komplekse, me shumë hapa. Kjo nisje përshkallëzon garën për epërsi në AI Agent, duke hedhur Openai kundër iniciativave nga Google, Antropic dhe Microsoft. Ai mbivendos mjetin e operatorit të kompanisë, i cili u prezantua për herë të parë në janar 2025 si një agjent më i kufizuar, i bazuar në shfletues. Oferta

Agjenti chatgpt Përfaqëson përpjekjen më të guximshme të Openai për të krijuar një produkt vërtet agjent. Isshtë Mundësuar nga një model i ri, pa emër nga familja Openai O3 . Sistemi është krijuar për të mbingarkuar detyra komplekse nga përdoruesit, të tilla si planifikimi i ngjarjeve duke kontrolluar një kalendar ose duke gjeneruar një kuvertë rrëshqitëse. Kjo ristrukturim i brendshëm nënvizon rëndësinë strategjike të lëvizjes përtej chatbots të thjeshtë. Ai kombinon një shfletues vizual të largët me një terminal për ekzekutimin e kodit, kryerjen e analizës së të dhënave, dhe madje krijimin e spreadsheets. Burimet e të dhënave dhe aplikacionet si Google Drive, një hap i rëndësishëm nga ofertat e mëparshme. Në Frontiermath, një test matematikor sfidues, agjenti shënoi 27.4% kur përdor mjetet e tij, një kërcim masiv nga 6.3% i arritur nga modeli i mëparshëm i lartë, O4-Mini.

Openai pranon se mjeti nuk është ndërtuar për shpejtësi. Udhëheqësi i hulumtimit Isa Fulford vuri në dukje se përdoruesit nuk kanë për qëllim ta shikojnë atë duke punuar, duke e përshtatur atë si një asistent në sfond.”Edhe nëse duhen 15 minuta, gjysmë ore, është një shpejtësi e madhe në krahasim me sa kohë do të të duhej ta bësh atë,”tha ajo, duke theksuar rolin e saj në trajtimin e proceseve që kërkon kohë. href=”https://cdn.openai.com/pdf/18a02b5d-6b67-4cec-ab64-68cdfbddebcd/peparedness-framework-v2.pdf”target=”_ bosh”nga korniza e tij e gatishmërisë . Kjo është një masë paraprake kundër keqpërdorimit të mundshëm, veçanërisht në fushat biologjike dhe kimike, edhe pa prova të drejtpërdrejta të rrezikut.

Kontrolli i përdoruesit është një temë qendrore. Fulford konfirmoi se”Para se Agjenti Chatgpt të bëjë ndonjë gjë”të pakthyeshme”, si dërgimi i një emaili ose bërja e një prenotimi, ai kërkon së pari lejen”. Ky hap i konfirmimit të përdoruesit është kritik për veprimet me pasoja të botës reale, duke u bazuar në hartimin e parë të sigurisë së agjentit të mëparshëm të operatorit. Kjo veçori automatikisht ndalon ekzekutimin e agjentit në faqet e internetit të ndjeshme, si portalet financiare, nëse përdoruesi lundron larg nga skedari. Për më tepër, Openai ka çaktivizuar veçorinë e kujtesës së ChatGPT në nisje për të zbutur rreziqet e eksfiltrimit të të dhënave nga sulmet e shpejtë të injektimit. Shtë një përgjigje e drejtpërdrejtë ndaj mjeteve të ngjashme nga rivalët. Antropik ishte herët me veçorinë e tij”Përdorimi i kompjuterit”për Claude Models, lëshuar në tetor 2024. Edhe Microsoft është duke futur tipare të ngjashme me agjentin në studion e saj Copilot. Charles LaManna, një Microsoft VP, kapi në mënyrë të përmbledhur qëllimin:”Nëse një person mund të përdorë aplikacionin, edhe agjenti mund.”Kjo histori vendos një bar të lartë për agjentin e ri, më të aftë.

Kjo shtytje konkurruese vjen pavarësisht pyetjeve në lidhje me efektivitetin e agjentit. Një studim i fundit i Carnegie Mellon zbuloi se edhe modelet e Top AI luftojnë me detyrat e automatizimit të biznesit, duke theksuar çështjet me sensin e përbashkët dhe shfletimin në internet. Agjenti i ri i Openai do të matet kundër këtyre standardeve të performancës në botë reale.

Categories: IT Info