Openai uruchomił dziś Agent Chatgpt, jego najpotężniejszego asystenta AI do tej pory, mającym na celu stworzenie narzędzia, które aktywnie wypełnia prace dla użytkowników, a nie tylko odpowiadanie na pytania. Nowy agent obsługuje „komputer wirtualny” do wykonywania złożonych, wieloetapowych zadań.
Dostępne dla płatnych subskrybentów od 17 lipca agent integruje możliwości poprzedniego operatora Operatora i głębokich narzędzi badawczych Openai. Ta premiera eskaluje wyścig o supremację w Agentic AI, stawiając Openai przeciwko inicjatywom Google, Anthropic i Microsoft.
Przeniesienie sygnalizuje strategiczne przesunięcie z konwersacyjnej sztucznej inteligencji na systemy, które mogą autonomicznie zarządzać cyfrowymi przepływami pracy. Zastępuje narzędzie operatora firmy, które zostało po raz pierwszy wprowadzone w styczniu 2025 r. Jako bardziej ograniczony agent oparty na przeglądarce.
agent chatgpt reprezentuje najodważniejszą próbę openai, aby stworzyć prawdziwie agencyjny produkt. Jest to zasilane nowym, nienazwanym modelem z rodziny Openai O3 . System został zaprojektowany w celu wyłudzania złożonych zadań od użytkowników, takich jak planowanie zdarzeń poprzez sprawdzanie kalendarza lub generowanie pokładu slajdów. Aby zbudować nowe narzędzie, Openai połączył zespoły za operatorem i głębokim badania, tworząc zjednoczoną grupę skupioną na tym nowym kierunku agencyjnym. Ta wewnętrzna restrukturyzacja podkreśla strategiczne znaczenie wyjścia poza proste chatboty. W przeciwieństwie do swoich poprzedników, agent Chatgpt jest wyposażony w bardziej kompleksowy zestaw narzędzi. Łączy zdalną przeglądarkę wizualną z terminalem do wykonywania kodu, wykonywania analizy danych, a nawet tworzenia arkuszy kalkulacyjnych. [Wbudowana treść] Yash Kumar, przewód produktu Openai dla agenta, wyjaśnił, że „ponieważ agent chatgpt ma dostęp do„ całego komputera “zamiast tylko przeglądarki,„ wzmocniono zestaw narzędzi “.” To rozszerzyło się narzędzia, które obejmuje połączenie, również zezwala na połączenie, również zezwolenie na komputer, a także zezwolenie na Agent, a także zezwala na Agent Acces Zewnętrzne źródła danych i aplikacje, takie jak Dysk Google, znaczący krok w stosunku do poprzednich ofert. Podstawowy model oferuje najnowocześniejszą wydajność trudnych punktów odniesienia. Na Frontiermath, wymagającym testu matematycznym, agent uzyskał 27,4% przy użyciu swoich narzędzi, ogromny skok z 6,3% osiągnięty przez poprzedni model, O4-Mini. Openai potwierdza, że narzędzie nie jest zbudowane dla prędkości. Kierownik ds. Badań ISA Fulford zauważył, że użytkownicy nie mają oglądać, jak działa, określając go jako asystenta tła. „Nawet jeśli zajmuje to 15 minut, pół godziny, jest to dość duża przyspieszenie w porównaniu z tym, jak długo to zajmie to”-powiedziała, podkreślając swoją rolę w postępowaniu z czasochłonnym procesami. Biorąc pod uwagę zwiększone możliwości agenta, które otwartei, aktywuje SafeEgUards z jego ram gotowości . Jest to środek ostrożności w stosunku do potencjalnego niewłaściwego użycia, szczególnie w domenach biologicznych i chemicznych, nawet bez bezpośredniego dowodów na ryzyko. Kontrola użytkownika jest głównym tematem. Fulford potwierdził, że „zanim agent Chatgpt robi coś„ nieodwracalnego “, na przykład wysyłanie wiadomości e-mail lub dokonanie rezerwacji, najpierw prosi o pozwolenie”. Ten etap potwierdzenia użytkownika ma kluczowe znaczenie dla działań o realnych konsekwencjach, opierając się na pierwszym konstrukcji bezpieczeństwa wcześniejszego agenta operatora. Dalsze warstwy bezpieczeństwa obejmują „tryb obserwacyjny”. Ta funkcja automatycznie zatrzymuje wykonanie agenta na wrażliwych stronach internetowych, takich jak portale finansowe, jeśli użytkownik odsuwa się od karty. Ponadto OpenAI wyłączyła funkcję pamięci Chatgpt podczas premiery, aby złagodzić ryzyko exfiltracji danych z szybkich ataków wtrysku. Uruchomienie agenta Chatgpt zintensyfikuje konkurencję wśród głównych graczy technicznych. Jest to bezpośrednia odpowiedź na podobne narzędzia rywali. Anthropic był wcześnie z funkcją „używania komputera” dla modeli Claude, wydanej w październiku 2024 r. Google jest również intensywnie zainwestowany, z projektem Mariner i testami funkcji „używania komputera” w jej studio AI. Microsoft również jest osadzającym funkcje podobne do agenta w swoim studio Copilot. Charles Lamanna, wiceprezes Microsoft, zwięźle uchwycił cel: „Jeśli osoba może korzystać z aplikacji, agent też może.” Nawet przed tym uruchomieniem operator Openai wykazał przewagę konkurencyjną, przewyższając rywale na testach porównawczych, takich jak WebVoyager i Osworld, które testują Browser i systemową. Historia ta ustawia wysoki pasek nowego, bardziej zdolnego agenta. Ten konkurencyjny nacisk pojawia się pomimo pytań dotyczących skuteczności agenta. Ostatnie badanie Carnegie Mellon wykazało, że nawet najlepsze modele AI zmagają się z zadaniami automatyzacji biznesu, podkreślając problemy z zdrowym rozsądkiem i przeglądaniem stron internetowych. Nowy agent Openai zostanie zmierzony w stosunku do tych rzeczywistych testów porównawczych wydajności. „podejście ostrożności” do bezpieczeństwa i kontroli
Wyścig o agencję AI podgrzewa