OpenAI ka zgjeruar ofertat e saj të zhvilluesve duke nxjerrë versionin e plotë të modelit të tij o1 përmes API-së së tij. Ky model i avancuar arsyetimi, i cili shkëlqen në detyrat komplekse me shumë hapa, prezanton veçori të reja që premtojnë të riformësojnë mënyrën se si zhvilluesit ndërtojnë aplikacione të fuqizuara nga AI.

Krahas modelit o1, OpenAI ka njoftuar gjithashtu përmirësime në API-në e tij Realtime për ndërveprimet zanore dhe një metodë të re të rregullimit të preferencave, duke u ofruar zhvilluesve fleksibilitet të paparë.

O1-2024. Modeli-12-17 zëvendëson versionin o1-preview të lansuar në fillim të këtij viti. Sipas OpenAI, modeli i përditësuar ofron “përgjigje më gjithëpërfshirëse dhe të sakta, veçanërisht për pyetjet që kanë të bëjnë me programimin dhe biznesin, dhe ka më pak gjasa të refuzojë gabimisht kërkesat.” Këto përmirësime, shoqëruar me një reduktim prej 60% në përdorimin e argumenteve të arsyetimit, bëjnë që modeli o1 më i shpejtë, më efikas dhe më i gjithanshëm.

Avansimi i arsyetimit nëpërmjet API me Modelin o1

Modeli i tackle o1 i OpenAI është projektuar për të rishikuar qëndrueshmëri logjike dhe analitike thellësia, duke tejkaluar përsëritjet e mëparshme në standardet si SWE-Bench Verified dhe AIME

OpenAI raporton se saktësia për detyrat e programimit është rritur nga 52.3% në 76.6%, ndërsa performanca në problemet matematikore është rritur nga 42% në gati. 80%.

KategoriaEvalo1-2024-12-17o1-previewGeneralGPQA diamanti75.773.3MMLU (kalimi @1)91.890.8CodingSWE-bench Verified48.941.3LiveCodeBench76.652.3Math1509. (kaloni @1) 79.242.0MGSM (kaloni @1) 89.390.8VisionMMMU (kaloni @1) 77.3—MathVista (kaloni @1)71.0—FactualitySimpleQA42.642.4AgjentëtTAU-bench (me pakicë) (2air)-73,5—Tline

Burimi: OpenAI

Një veçori e spikatur është mbështetja e strukturuar e daljes, duke i lejuar zhvilluesit të gjenerojnë përgjigje në formate të paracaktuara si JSON.

Kjo siguron integrim pa probleme me sistemet e jashtme si API dhe bazat e të dhënave, duke e bërë modelin ideal për aplikime në mbështetjen e klientit, logjistikën dhe analizën e të dhënave.

Modeli gjithashtu prezanton aftësitë e arsyetimit vizual, duke mundësuar analizën e imazheve për detyra të tilla si korrigjimi ose kërkimi shkencor. Për shembull, zhvilluesit tani mund të futin të dhëna vizuale, të tilla si dokumente të skanuara ose plane, dhe të marrin përgjigje të vetëdijshme për kontekstin.

Për më tepër, një parametër i ri”përpjekje arsyetimi”i lejon zhvilluesit të kontrollojnë se sa kohë shpenzon modeli për secilën detyrë, duke balancuar saktësinë dhe efikasitetin.

OpenAI shpjegoi në blogun e tij,”Ne po rrokulliset”. hiq aksesin gradualisht ndërsa punon për të zgjeruar aksesin në nivele shtesë të përdorimit dhe duke rritur kufijtë e tarifave.”

Përmirësimi i ndërveprimeve zanore me Realtime API

OpenAI bëri gjithashtu përditësime të rëndësishme në API-në e tij në kohë reale, i cili fuqizon ndërveprimet zanore në kohë reale. Shtimi i WebRTC, Web-Real-Time Communication-një protokoll për komunikim me vonesë të ulët-u mundëson zhvilluesve të krijojnë aplikacione zanore pa probleme për tutorët virtualë, asistentët dhe mjetet e përkthimit. Ai mundëson lidhje peer-to-peer (P2P) pa kërkuar shtojca ose softuer shtesë.

OpenAI theksoi avantazhet e WebRTC, duke deklaruar, “Në skenarët ku dëshironi të lidheni me një model Realtime nga një klient i pasigurt përmes rrjetit (si p.sh. një shfletues ueb), ne rekomandojmë përdorimin e metodës së lidhjes WebRTC. WebRTC është i pajisur më mirë për të trajtuar gjendjet e lidhjeve të ndryshueshme dhe ofron një numër API-sh të përshtatshme për kapjen e hyrjeve audio të përdoruesit dhe luajtjen e transmetimeve audio në distancë nga modeli.“

Zbatimi i WebRTC përdor të ashtuquajturat shenja kalimtare, çelësat e përkohshëm API të krijuar posaçërisht për vërtetimin e sigurt të aplikacioneve nga ana e klientit kur lidheni me OpenAI API Realtime përmes WebRTC. Qëllimi i tyre është të sigurojnë një mekanizëm vërtetimi të sigurt dhe jetëshkurtër që shmang ekspozimin e çelësave standard të ndjeshëm API drejtpërdrejt në mjediset e klientëve si shfletuesit e uebit.

Imazhi: OpenAI

Përmirësimet në API në kohë reale thjeshtoni procesin e zhvillimit, duke reduktuar kodin e kërkuar për aplikacionet zanore duke përmirësuar cilësinë e audios dhe saktësinë e përgjigjes. Zhvilluesit tani mund të ndërtojnë aplikacione që fillojnë të formulojnë përgjigje ndërsa përdoruesit janë ende duke folur, duke rritur përgjegjshmërinë.

Rregullimet e çmimeve i bëjnë aplikacionet zanore më të aksesueshme. Kostoja e kodeve audio GPT-4o është ulur me 60%, ndërsa argumentet hyrëse të memorizuara tani janë 87,5% më të lira. OpenAI ka prezantuar gjithashtu GPT-4o mini, një opsion me kosto efektive për zhvilluesit që kërkojnë alternativa të përballueshme, me çmim prej 10 dollarë për milion argumente hyrëse.

Rafinimi i sjelljes së AI me rregullim të mirë të preferencës

Rregullimi i mirë i preferencës është një metodë e re personalizimi që lejon zhvilluesit të përsosin sjelljen e modelit bazuar në krahasimet e çiftuara të përgjigjet. Ndryshe nga sintonizimi tradicional, i cili mbështetet në çiftet e sakta hyrje-dalje, akordimi i preferencave i mëson modelit të bëjë dallimin midis përgjigjeve të preferuara dhe më pak të dëshirueshme.

OpenAI e përshkruan këtë metodë si veçanërisht efektive për detyrat subjektive, si p.sh. si përshtatja e tonit dhe stilit në shkrimin krijues ose sigurimi i përputhjes me kërkesat specifike të formatimit. Sipas OpenAI, adoptuesit e hershëm si një firmë analitike financiare, raportuan se rregullimi i mirë i preferencës përmirësoi saktësinë e përgjigjes me 5% për pyetje komplekse, jashtë shpërndarjes.

“Ne filluam të testonim Preference Fine-Tuning me partnerë të besuar që kanë parë rezultate premtuese deri më tani. Për shembull, Rogo AI⁠ (hapet në një dritare të re) po ndërton një asistent të AI për analistët financiarë që zbërthen pyetjet komplekse në nën-pyetje.

Duke përdorur standardin e tyre të krijuar nga ekspertët, Rogo-Golden, ata zbuluan se ndërsa rregullimi i shkëlqyeshëm i mbikëqyrur u përball me sfida me zgjerimin e pyetjeve jashtë shpërndarjes—si p.sh. metrikat që mungojnë si ARR për pyetje si”sa i shpejtë është kompania X në rritje”—Preferenca Fine-Tuning i zgjidhi këto çështje, duke përmirësuar performancën nga saktësia 75% në modelin bazë në mbi 80%.”

Zgjerimi i opsioneve të SDK-së për Zhvilluesit

Për të mbështetur një gamë më të gjerë mjedisesh programimi, OpenAI ka prezantuar gjithashtu SDK-të zyrtare për Shko dhe Java, krahas tijbibliotekat ekzistuese për Python, Node.js dhe.NET. Këto SDK thjeshtojnë integrimi, duke u mundësuar zhvilluesve të vendosin modele të AI në sisteme të shkallëzueshme të mbështetjes ose aplikacione të ndërmarrjes.

Go SDK është projektuar për aplikacione të lehta dhe efikase nga ana e serverit, ndërsa Java SDK kujdeset për zgjidhjet e nivelit të ndërmarrjes, duke ofruar të fortë shtypja dhe mbështetje e fuqishme për projekte në shkallë të gjerë. Dokumentacioni i OpenAI ofron udhëzime të hollësishme për përdorimin e këtyre mjeteve të reja.

Categories: IT Info