Openai të martën lëshoi të martën GPT-OSS-120B dhe GPT-OSS-20B, modelet e para të tij me peshë të hapur që nga viti 2019. Kjo veprim shënon një zhvendosje të madhe strategjike për AI Lab, i cili është përballur me kritika për sistemet e tij të mbyllura. Modelet e reja janë në dispozicion nën një licencë lejuese Apache 2.0. Lëshimi synon të kundërshtojë popullaritetin në rritje të modeleve të hapura nga rivalët si meta dhe firmat e teknologjisë kineze. Duke ri-angazhuar me komunitetin me burim të hapur, Openai shpreson të vendosë standarde të reja të sigurisë. Ky strategji strategjike shënon botimin e parë të modelit të gjuhës me peshë të hapur që nga GPT-2 në vitin 2019, duke adresuar drejtpërdrejt vitet e reagimeve dhe zhgënjimit të komunitetit.
>>
Kjo kthim në parimet me peshë të hapur u për herë të parë nga CEO Sam Altman në prill. Njoftimi pason dy vonesa zhgënjyese në qershor dhe korrik, duke e bërë fillimin e sotëm një përmbushje të shumëpritur të këtij premtimi për zhvilluesit dhe studiuesit që vlerësojnë transparencën dhe personalizueshmërinë. Ato modele të pa-atribuuara, me performancë të lartë, tani janë kuptuar se kanë qenë vrojtime të vjedhurazi për lëshimin zyrtar të GPT-OSS. href=”https://t.co/pdkhqdqcpf”target=”_blank”> https://t.co/pdkhqdqcpf
-Openai (@openai) 5 gusht 2025
nga një perspektivë e produktit, koha e duhur. Ai adreson një hendek të rëndësishëm në portofolin e Openai, siç vërehet nga Casey Dvorak, një menaxher i programit kërkimor në Openai. HE shpjegoi ,”sepse nuk ka asnjë model të hapur [konkurrues] nga Openai, ne donim për të futur në të vërtetë”. Bordi.”
Kjo i lejon kompanisë të garojë për zhvilluesit që preferojnë ose kërkojnë modele të drejtuara në vend për sigurinë e të dhënave, kostot më të ulëta ose rregullimin e mirë të detyrave të specializuara. Përtej thjesht mbushjes së një boshllëku të produktit, masa ka të bëjë edhe me rikthimin e ndikimit. Peter Henderson, një profesor asistent në Universitetin Princeton, sugjeron ,”Në pjesë, kjo është rreth e rrotull Ekosistemi.”
Rëndësia strategjike është rritur si meta, udhëheqësi i gjatë në AI me burim të hapur amerikan, mund të riorientohet drejt lëshimeve të mbyllura. Pivot i Openai e pozicionon atë për t’u bërë kampioni i ri për komunitetin me burim të hapur, duke kapur zhvilluesit dhe studiuesit që kërkojnë një alternative të fuqishme, të licencuar të licencuar. Të dy janë ndërtuar në një arkitekturë të përzierjes së ekspertëve (MOE), një zgjedhje kryesore e projektimit për maksimizimin e performancës ndërsa minimizoni koston llogaritëse, sipas njoftimit të Openai . Modeli GPT-OSS-120B, për shembull, aktivizon vetëm 5.1b të parametrave të tij 117b për shenjë. Ky efikasitet përmirësohet më tej nga kuantizimi vendas në formatin MXFP4, duke zvogëluar në mënyrë drastike gjurmën e kujtesës.
Kjo arkitekturë e përparuar i bën modelet shumë të arritshme. GPT-OSS-20B më i vogël mund të funksionojë në pajisjet e konsumatorit me vetëm 16 GB RAM, ndërsa modeli më i madh 120B kërkon vetëm një GPU të vetme 80 GB, një pjesë të zakonshme të pajisjeve në stacionet e punës profesionale. Të dy modelet janë në dispozicion për shkarkim në Përqafimi i fytyrës .
Në performancën, modelet shënojnë shumë mbi peshën e tyre. Sipas kartës zyrtare të modelit, GPT-OSS-120B arrin afërsi të afërsisë me O4-Mini të pronarit të Openai në standardet thelbësore të arsyetimit dhe madje e tejkalon atë në teste të specializuara si HealthBench dhe Konkurrenca e Matematikës Aime. GPT-OSS-20B më i vogël tregon konkurrencë të ngjashme kundër modelit O3-MINI. Të dhënat, botuar në një letër shoqëruese , GPT-ASS-ASSAPE-ASAFETY.PDF”target=”_ Blank”> Blank. të fushës, veçanërisht në fushat e specializuara. Për shembull, në standardin”Biorisk Tacit Njohja dhe Zgjidhja e Problemeve”, ajo shënoi 75.7, përpara Kimi 2 (74.6), Deepseek R1 (68.7), dhe Qwen3 duke menduar (67.8). Gazeta kërkimore. Vlerësimet e jashtme të drejtuara nga SecureBio konfirmuan më tej se GPT-OSS performon më mirë sesa Deepseek-R1-0528 si me dhe pa një mjet shfletimi. src=”të dhëna: imazh/svg+xml; nitro-impty-id=mty1oto4nza=-1; base64, phn2zyb2awv3qm94psiwidagnjg3idu1mc Igd2lkdgg9ijyy4nyigagvpz2h0psi1ntaiihhtbg5zpsjodhrwoi8vd3d3d3lnczlm9yzy8ymdawl3n2zyi+pc9zdmc+”>
Sidoqoftë, Openai shton një kontekst të rëndësishëm në këto rezultate. Ndërsa modeli i tij i rregulluar mirë shpesh drejton paketën, punimi konkludon se në shumicën e vlerësimeve,”tashmë ekziston një model tjetër i modelit me peshë të hapur duke shënuar në ose afër GPT-OSS”. Kjo sugjeron që ndërsa GPT-OSS përparon kufirin, ai nuk krijon një hap dramatik, të paparë në aftësi mbi ekosistemin ekzistues me burim të hapur.
Për zhvilluesit, modelet janë të dizajnuara për përdorim të menjëhershëm, praktik. Ato janë plotësisht të pajtueshme me API të përgjigjeve të Openai, e cila u përmirësua në maj me më shumë mbështetje të veglave. Ky integrim mundëson rrjedhën e punës të sofistikuar të agjentëve me aftësi të forta të ndjekjes dhe përdorimit të mjeteve. src=”të dhëna: image/svg+xml; nitro-empty-id=mty2mjo5mjc=-1; base64, phn2zyb2awv3qm94psiwidagnjg4iduzny Igd2lkdgg9ijy4ocigagvpz2h0psi1mzciihhtbg5zpsjodhrwoi8vd3d3lnczlm9yzy8ymdawl3n2zyi+pc9zdmc+”>
Karakteristikat kryesore përfshijnë qasje të plotë në zinxhirin e mendimit të modelit (COT) për arsyetimin transparent, mbështetjen për rezultatet e strukturuara dhe aftësinë për të rregulluar përpjekjet e arsyetimit midis cilësimeve të ulëta, të mesme dhe të larta përmes një të shpejtë të sistemit të thjeshtë. Kjo fleksibilitet lejon zhvilluesit të balancojnë performancën, koston dhe latencën për aplikimet e tyre specifike. gurthemeli i këtij lëshimi është hulumtim i gjerë i sigurisë së Openai. Kompania studioi në mënyrë proaktive skenarët e rasteve më të këqija përmes një procesi që e quan”rregullim të mirë”(MFT). Studiuesit me qëllim u përpoqën t’i bënin modelet të dëmshme, një proces i shqyrtuar nga ekspertë të jashtëm. Qëllimi ishte të shihte nëse një sulmues mund të krijonte një mjet të rrezikshëm. Gjetjet, përgjigje strategjike ndaj një peizazhi të zhvendosur AI . Seria e Meta Llama ka mbizotëruar prej kohësh në skenën e modelit të hapur të SHBA. Kohët e fundit, modelet kineze nga Deepseek dhe Alibaba kanë fituar tërheqje të konsiderueshme globalisht. Në njoftimin e saj, kompania deklaroi,”qasje e gjerë në këto modele të afta të peshave të hapura të krijuara në SH.B.A. ndihmon në zgjerimin e shinave të AI demokratike”. Ky ndjenjë i bën jehonë analistëve. Peter Henderson nga Universiteti Princeton vuri në dukje se”modelet e hapura janë një formë e fuqisë së butë”, duke sugjeruar një strategji më të gjerë për të ruajtur ndikimin amerikan në zhvillimin e AI. href=”https://www.technologyreview.com/2025/08/05/1121092/openai-has-finally-released-open-weight-luage-models/”target=”_ bosh”> sipas një raporti . Kjo lëshim i përafron kompanisë me një interes kombëtar për të nxitur një ekosistem të brendshëm me burim të hapur. Nathan Lambert i Institutit Allen për AI vlerësoi zgjedhjen, duke thënë,”ashtë një gjë shumë e mirë për komunitetin e hapur”. Kjo bie ndesh me licencat më kufizuese, me porosi të përdorura nga disa konkurrentë dhe inkurajon adoptim më të gjerë. janë menjëherë të arritshme për zhvilluesit në të gjithë botën .