Sipërmarrja e inteligjencës artificiale e Elon Musk, xAI, po bën hapa përpara në përmirësimin e chatbot-it të tij Grok me aftësi multimodale. Sipas dokumentet më të fundit të zhvilluesit, përdoruesit së shpejti do të jenë në gjendje të ngarkojnë imazhe në Grok dhe të marrin përgjigje të bazuara në tekst.

Dokumentet e zhvilluesit përfshijnë një shembull skripti Python që përshkruan procesin e integrimit. Ky skript demonstron se si zhvilluesit mund të përdorin kompletin e zhvillimit të softuerit xAI (SDK) për të përpunuar hyrjen e tekstit dhe të imazhit. Skripti detajon hapat për të lexuar një skedar imazhi, për të vendosur një kërkesë teksti dhe për të gjeneruar një përgjigje duke përdorur SDK-në xAI, duke treguar një lëvizje drejt metodave më të sofistikuara të ndërveprimit.

Evolucioni dhe versioni i mëparshëm

Evolucioni dhe versioni i mëparshëm

strong>

Grok u vu për herë të parë në dispozicion në nëntor 2023 dhe është i aksesueshëm për abonentët e shërbimit X Premium Plus. Përsëritja e fundit, Grok 1.5, u lëshua në mars, duke shfaqur aftësi të përmirësuara arsyetimi. Modeli është trajnuar mbi një gamë të larmishme të të dhënave tekstuale nga interneti deri në tremujorin e tretë të 2023, të plotësuar nga grupe të dhënash të kuruara nga recensues njerëzorë. Veçanërisht, ndërsa Grok-1 nuk ishte trajnuar për të dhënat nga X (dikur Twitter), ai ka qasje në kohë reale në postimet publike në platformë.

Pozicioni konkurrues dhe zhvillimet e ardhshme

Themeluar nga Elon Musk në mars 2023, xAI është një lojtar relativisht i ri në sektorin e AI, duke konkurruar me entitete të themeluara si ChatGPT i OpenAI. Pavarësisht statusit të tij të sapoardhur, xAI pohon se Grok 1.5 po ngushton hendekun e performancës me GPT-4 të OpenAI në standarde të ndryshme, duke përfshirë problemet e konkurrencës akademike. Megjithatë, është e rëndësishme të merret parasysh se standardet për modelet e mëdha të gjuhëve shpesh përballen me shqyrtimin për përfshirjen e mundshme të të dhënave të testit në grupet e tyre të trajnimit, gjë që mund të ndikojë në rezultatet e performancës.

Modelet multimodale në domene të ndryshme

Një postim në blog nga muaji i kaluar tregoi se Grok-1.5V do të ofrojë”modele shumëmodale në një numër fushash.”Përditësimi i fundit në dokumentet e zhvilluesit sugjeron përparim drejt lëshimit të një modeli të ri. Ky model është trajnuar mbi një sërë të dhënash teksti nga burime të disponueshme publikisht të internetit deri në tremujorin e tretë 2023 dhe grupe të dhënash të shqyrtuara nga ekspertë njerëzorë. Grok gjithashtu krenohet me njohuri në kohë reale për botën, duke përfshirë postimet në X.

Zhvillimi i chatbot-eve multimodale shihet si një përparim i rëndësishëm në teknologjinë e AI me njoftimet e fundit nga Google I/O dhe lëshimin e OpenAI GPT-4o, mungesa e mëparshme e aftësive multimodale të Grokut e kishte vendosur atë në një disavantazh konkurrues. Përditësimet e vazhdueshme synojnë të kapërcejnë këtë hendek dhe të përmirësojnë funksionalitetin e Grok.

Categories: IT Info