Openai ka nisur O3-PRO, një model i ri i arsyetimit të flamurit që synon profesionistët dhe ndërmarrjet që kërkojnë një shkallë më të lartë të saktësisë për zgjidhjen komplekse të problemeve. Lëshimi krijon një shkallë të re premium për AI-në më të përparuar të kompanisë, e cila vjen me një çmim dhjetë herë më të lartë se homologu i tij standard O3. Njoftim zyrtar Nga Qendra e Ndihmës Openai. Ndërsa Openai kontrollon performancën superiore në standardet akademike mbi konkurrentët, vlera e vërtetë e O3-Pro duket se qëndron përtej testeve të thjeshta. Shqyrtimet e hyrjes së hershme sugjerojnë se inteligjenca e tij e përparuar është zhbllokuar plotësisht kur ushqehet një kontekst i gjerë, duke e pozicionuar atë më pak si një chatbot bisedues dhe më shumë si një motor i specializuar për analiza të thella.
Modeli O3-PRO tani është në dispozicion për pajtimtarët ChatGPT Pro dhe Team, duke zëvendësuar O1-Pro më të vjetër, me qasje për ndërmarrjet dhe klientët e EDU që pritet të ndjekin. Sidoqoftë, performanca premium vjen me tregti; Openai konfirmon se përgjigjet nga O3-PRO janë zakonisht më të ngadalta se paraardhësit e tij dhe se, në nisje, modelit i mungon mbështetja për gjenerimin e imazhit, bisedat e përkohshme, dhe tipari i kanavacës. Kjo e bën atë një investim të rëndësishëm në krahasim me standardin e sapo zbritur O3, i cili tani kushton vetëm 2 dhe 8 dollarë për të njëjtat shuma të shenjës. Strategjia e çmimeve duket se ka për qëllim ripozicionimin e tregut, pasi O3-Pro gjithashtu raportohet se 87% më e lirë se modeli O1-Pro që zëvendëson, duke sugjeruar një veprim për të bërë aftësitë e tij më të larta të nivelit më të lartë më të arritshëm, por ende të dallueshëm. Kompania deklaron se modeli i ri është vlerësuar më i lartë për qartësinë, saktësinë dhe aftësinë e tij për të ndjekur udhëzime komplekse. nuk i besoi normat e fitores në krahasim me O3 herën e parë që i pashë”. Kjo besim mbështetet nga testet e brendshme që tregojnë O3-Pro Outperforming Geogle’s Gemini 2.5 Pro dhe Antropic’s Claude 4 Opus on Science Science dhe Matematikë të Vështirë. Sipas një Rishikimi i hyrjes së hershme në hapësirën latente , aftësitë e përmirësuara të modelit nuk janë gjithmonë të dukshme në kërkesat e thjeshta, një-off. Theelësi për të shfrytëzuar fuqinë e tij është t’i sigurojë asaj një sasi masive të informacionit përkatës. Qasja më e mirë, sugjeron rishikimi, është ta trajtoni atë si një”gjenerator të raportit”sesa një chatbot. src=”të dhëna: imazh/svg+xml; nitro-empty-id=mty0mtoxnjm1-1; base64, phn2zywv3qm94psiwidagmti4mca3mjai Ihdpzhropsixmjgwiibozwlnahq9iJCyMcigEG1Sbnm9imH0Dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Në një provë nga hapësira latente modelit iu dha një pjesë e dokumenteve dhe qëllimeve të brendshme të kompanisë. Analiza që rezultoi ishte aq specifike dhe e rrënjosur në të dhënat e siguruara, saqë ata thonë se”në të vërtetë ndryshoi se si ne po mendojmë për të ardhmen tonë”. Kjo përvojë pozitive, me kontekst të lartë, megjithatë, nuk është universale.”Dembel”dhe e vështirë për tu dalluar nga O3 i rregullt. Përforcimi i mëtejshëm i këndit të”mjetit të specializuar”, që O3-Pro është i ngadaltë dhe duket se funksionon më mirë kur arsyetimi i tij është i kombinuar me mjete të jashtme. src=”të dhëna: imazh/svg+xml; nitro-empty-id=mty0ndoxnji4-1; base64, phn2zywv3qm94psiwidagmti4mca3mjai Ihdpzhropsixmjgwiibozwlnahq9iJCyMcigEG1Sbnm9imH0Dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
nga agjenti në analist: Ndryshimi strategjik i Serisë O
Nisja e O3-Pro shënon një hap të rëndësishëm në evolucionin e modeleve”O-Series”të Openai. Këto modele janë thelbësisht të ndryshme nga linja GPT, e dizajnuar për”thellësi”dhe”diskutim”me një buxhet më të madh për mendimin e brendshëm dhe përdorimin e mjeteve vendase. Kjo arkitekturë u lejon atyre të planifikojnë dhe të veprojnë brenda procesit të tyre të arsyetimit, një aftësi e shfaqur për herë të parë me lëshimin e prillit të O3 dhe O4-Mini. Kjo paraqet një zhvendosje strategjike nga asistentët e AI që thjesht u përgjigjen pyetjeve te”partnerët strategjikë”që mund t’i ndihmojnë në mënyrë aktive përdoruesit të arrijnë qëllime. Paraqitja e një versioni”pro”më pak se dy muaj më vonë tregon se Openai tani është përqendruar në forcimin e këtyre aftësive të agjentit eksperimental në një mjet të besueshëm, të gatshëm për ndërmarrje. Menjëherë pas debutimit të modelit O3, u shfaqën raporte për të që kishin një tendencë më të lartë për të halucinuar sesa modelet më të vjetra. Firma e AI Vectara zbuloi se modeli O3 kishte një normë halucination prej 6.8% kur përmbledh artikuj. hulumtim i pavarur nga përkthimi i AI Instancat e hollësishme të hollësishme ku një version i pavarur i grupit të O3 do të trillonte veprimet që u mor për të zgjidhur një problem. Komandat në një mjedis të kontrolluar. Gjetjet e grupit përfshinin pretendimin e mrekullueshëm se kjo ishte”hera e parë që modelet AI janë vërejtur duke e penguar veten të mbyllen pavarësisht udhëzimeve të qarta për të kundërtën.”Në një lëvizje të dukshme drejt transparencës më të madhe, Openai nisi një qendër publike të vlerësimeve të sigurisë në maj për të ndarë rezultatet e testit të brendshëm, një zhvillim