Modeli i ri i të menduarit Flash Gemini 2.0 i Google sfidon o1 Pro të OpenAI me performancë të shkëlqyeshme

Google ka prezantuar Gemini 2.0 Flash Thinking, një model arsyetimi eksperimental i krijuar për zgjidhjen e problemeve komplekse duke përdorur lloje të shumta të dhënash. Modeli i ri i lejon përdoruesit të shohin hapat që duhet për të arritur në një përgjigje, duke ofruar njohuri mbi procesin e tij analitik.

Gemini 2.0 Flash Thinking është një përgjigje e drejtpërdrejtë ndaj modeleve të arsyetimit o1 të OpenAI, me Google që thekson transparencën dhe shpejtësia si tipare kryesore të dizajnit të tij.

Modeli ynë më i menduar deri tani:) https://t.co/xIz3w5dtGJ

— Sundar Pichai (@sundarpichai) 19 dhjetor 2024

Arsyetimi Shfaqet hap pas hapi

A Karakteristika kryesore e Gemini 2.0 Flash Thinking është fokusi i tij në bërjen e procesit të arsyetimit të tij të kuptueshëm për përdoruesit. Kjo është në kontrast me disa sisteme të avancuara të AI ku procesi i vendimmarrjes është shpesh i paqartë.

Ndryshe nga modelet e arsyetimit o1 të OpenAI, modeli i ri i Google ofron një mënyrë që përdoruesit të ndjekin hapat e tij njohës përmes një ndërfaqeje përdoruesi. Sipas dokumentacionit zyrtar të Google,”Mënyra e të menduarit”në këtë model ofron aftësi më të forta arsyetimi në krahasim me modelin standard Gemini 2.0 Flash.

Kjo veçori trajton shqetësimin e”kutisë së zezë”që shpesh lidhet me AI, duke përafruar model me idenë për t’i bërë më të kuptueshme operacionet e tij. Vëzhgimet fillestare sugjerojnë se modeli mund të zgjidhë në mënyrë efektive dhe të shpejtë problemet që kanë qenë të vështira për sistemet e tjera të AI.

Përpunimi multimodal i integruar

Një veçori tjetër e rëndësishme. i Gemini 2.0 Flash Thinking është aftësia e tij për të përpunuar hyrjet e imazhit krahas tekstit. Ndërsa o1 i OpenAI fillimisht funksionoi vetëm me tekst përpara se të shtonte më vonë aftësitë e imazhit, modeli i Google është krijuar për të trajtuar lloje të shumta të dhënash që në fillim.

Kjo aftësi e integruar lejon modelin të adresojë situata komplekse që kërkojnë analizën e lloje të ndryshme informacioni. Për shembull, modeli ka qenë në gjendje të zgjidhë enigmat që kërkojnë përdorimin e tekstit dhe imazheve, duke demonstruar aftësinë e tij për të punuar me formate të ndryshme të të dhënave. Zhvilluesit aktualisht mund t’i qasen këtyre funksioneve nëpërmjet Google AI Studio dhe Vertex AI .

Rezultatet e standardeve

Rezultatet e para nga tabela e standardeve Chatbot Arena për të testuarit Modeli Gemini-2.0-Flash-Thinking-exp-1219 tregon një performancë përgjithësisht superiore kur krahasohet me modelet e listuara OpenAi o1 (o1-preview dhe o1-mini).

Gemini-2.0-Flash.-Mendimi #1 në të gjitha kategoritë! pic.twitter.com/mRctNA31B9

— lmarena.ai (formerly lmsys.org) (@lmarena_ai) 19 dhjetor 2024

Kundër o1-preview, Binjakët-2.0-Flash-Të menduarit e tejkalon ndjeshëm atë në Performancën e përgjithshme, Përgjithshme me Kontrollin e Stilit, Shkrim Kreativ, Ndjekje të Udhëzimeve dhe Pyetje më të gjata. Ata arrijnë të njëjtën gradë në Hard Prompts, Hard Prompts me kontrollin e stilit, kodimin dhe matematikën. Kundër o1-mini, Gemini-2.0-Flash-Thinking e tejkalon dukshëm atë në performancën e përgjithshme, në përgjithësi me kontrollin e stilit, kërkesat e vështira, kërkesat e vështira me kontrollin e stilit, shkrimin krijues, ndjekjen e udhëzimeve dhe më gjatë Pyetje. Ata arrijnë të njëjtën gradë në kodim dhe matematikë.

Është e rëndësishme të theksohet se ky krahasim përfshin vetëm versionet”parapamje”dhe”mini”të modeleve o1. Versionet e lëshimit të qëndrueshëm të o1 dhe o1 Pro mungojnë në këtë përmbledhje, që do të thotë se nuk pasqyron një krahasim me versionet e qëndrueshme potencialisht më të afta të familjes së modeleve o1.

Megjithatë, bazuar në të dhënat e disponueshme, Gemini-2.0-Flash-Thinking-exp-1219 demonstron një profil performancë shumë më të fortë në krahasim me o1-preview dhe o1-mini modele.

Detajet e Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking aktualisht disponohet si eksperiment brenda Google AI Studio. Është ndërtuar mbi bazën e modelit Gemini 2.0 Flash të lëshuar së fundmi.

Jeff Dean, Shkencëtari kryesor i Google DeepMind, shpjegoi se modeli është”i trajnuar për të përdorur mendimet për të forcuar arsyetimin e tij”. Ai gjithashtu vuri në dukje”rezultate premtuese kur rritim llogaritjen e kohës së përfundimit”, duke iu referuar sasisë së burimet kompjuterike të përdorura gjatë përpunimit të pyetjeve.

Prezantimi i Gemini 2.0 Flash Thinking, një model eksperimental që tregon në mënyrë eksplicite mendimet e tij.

I ndërtuar mbi shpejtësinë dhe performancën e Flash 2.0, ky model është trajnuar për të përdorur mendimet për të forcuar arsyetimin e tij.

Dhe ne shohim rezultate premtuese kur rrisim kohën e përfundimit…

— Jeff Dean (@JeffDean) 19 dhjetor 2024

Dean ndau gjithashtu një demonstrim ku modelja zgjidhi një kompleks problemi i fizikës.

Dëshiron të shoh Gemini 2.0 Flash Mendoni në veprim? Shikoni këtë demonstrim ku modeli zgjidh një problem fizik dhe shpjegon arsyetimin e tij. pic.twitter.com/Nl0hYj7ZFS

— Jeff Dean (@JeffDean) Dhjetor 19, 2024

Modeli mbështet një gjatësi konteksti më të madhe se 128k, ka një kufi prej 32,000 shenjash për hyrje dhe mund të gjenerojë rezultate deri në 8,000 argumente në gjatësi. Ajo vjen me një ndërprerje njohurish të gushtit 2024. Dokumentacioni i Google thotë se”Mënyra e të menduarit është e aftë për aftësi më të forta arsyetimi në përgjigjet e saj sesa modeli bazë Gemini 2.0 Flash,”duke theksuar analitikën e përmirësuar të tij. aftësitë.

Aktualisht, modeli ofrohet pa tarifë brenda Google AI Studio, por dokumentacioni tregon se disa integrime, si funksioni i Kërkimit në Google, nuk janë ende të disponueshme. Modeli është krijuar veçanërisht për”multimodal”. detyrat e të kuptuarit, arsyetimit”dhe”kodimit”.

Konkurrenca me Ofertën Premium të OpenAI

Pranimi i Gemini 2.0 Flash Thinking vjen pak pasi OpenAI lançoi ChatGPT Pro versionin e plotë të modelit të arsyetimit o1 më 5 dhjetor, duke theksuar konkurrencën në rritje në fushën e AI të avancuar.

Lansimi i Gemini 2.0 Flash Thinking nga Google ndodh pasi OpenAI ka krijuar së fundmi ofertat e tij premium për aftësitë e përparuara të arsyetimit. Ndërsa modaliteti o1 pro i OpenAI thekson performancën përmes rritjes së burimeve llogaritëse, Gemini 2.0 Flash Thinking i Google thekson transparencën e procesit të tij të arsyetimit.

Ky ndryshim nxjerr në pah strategjitë e kundërta që përdoren në zhvillimin e AI, me disa të fokusuara në fuqinë llogaritëse dhe të tjera duke i dhënë përparësi të kuptuarit dhe besimit të përdoruesit.

Modeli i ri i të menduarit Flash Gemini 2.0 i Google sfidon o1 Pro të OpenAI me performancë të shkëlqyeshme

Published by All Things Windows on December 19, 2024

Arsyetimi Shfaqet hap pas hapi

Përpunimi multimodal i integruar

Rezultatet e standardeve

Detajet e Gemini 2.0 Flash Thinking

Konkurrenca me Ofertën Premium të OpenAI

IT Info

CISA kërkon të mos përdoret SMS për vërtetimin me shumë faktorë

IT Info

Home Assistant lëshon një pajisje të asistentit zanor të fokusuar në privatësi

IT Info

Si ta bëni ChatGPT motorin tuaj të paracaktuar të kërkimit për Edge dhe Chrome në Windows 11, 10

Modeli i ri i të menduarit Flash Gemini 2.0 i Google sfidon o1 Pro të OpenAI me performancë të shkëlqyeshme

Published by All Things Windows on December 19, 2024

Arsyetimi Shfaqet hap pas hapi

Përpunimi multimodal i integruar

Rezultatet e standardeve

Detajet e Gemini 2.0 Flash Thinking

Konkurrenca me Ofertën Premium të OpenAI

Related Posts

IT Info

CISA kërkon të mos përdoret SMS për vërtetimin me shumë faktorë

IT Info

Home Assistant lëshon një pajisje të asistentit zanor të fokusuar në privatësi

IT Info

Si ta bëni ChatGPT motorin tuaj të paracaktuar të kërkimit për Edge dhe Chrome në Windows 11, 10