Google heeft Gemini 2.0 Flash Thinking aangekondigd, een experimenteel redeneermodel dat is ontworpen voor het oplossen van complexe problemen met behulp van meerdere soorten gegevens. Het nieuwe model stelt gebruikers in staat de stappen te zien die nodig zijn om tot een antwoord te komen, en biedt inzicht in het analytische proces.
Gemini 2.0 Flash Thinking is een direct antwoord op de o1 redeneermodellen van OpenAI, waarbij Google de nadruk legt op transparantie en snelheid als belangrijkste kenmerken van het ontwerp.
Ons meest doordachte model tot nu toe:) https://t.co/xIz3w5dtGJ
— Sundar Pichai (@sundarpichai) 19 december 2024
Redeneringsproces stap voor stap getoond
Een belangrijk kenmerk van Gemini 2.0 Flash Thinking is de focus over het begrijpelijk maken van het redeneerproces voor gebruikers. Dit staat in contrast met sommige geavanceerde AI-systemen waarbij het besluitvormingsproces vaak onduidelijk is.
In tegenstelling tot de o1 redeneermodellen van OpenAI biedt het nieuwe model van Google gebruikers een manier om de cognitieve stappen te volgen via een gebruikersinterface. Volgens de officiële documentatie van Google biedt de “Thinking Mode” in dit model sterkere redeneermogelijkheden vergeleken met het standaard Gemini 2.0 Flash-model.
Deze functie pakt het “black box”-probleem aan dat vaak wordt geassocieerd met AI, waardoor de model met het idee om de werking ervan begrijpelijker te maken. De eerste observaties suggereren dat het model problemen effectief en snel kan oplossen die moeilijk waren voor andere AI-systemen.
Ingebouwde multimodale verwerking
Nog een belangrijk kenmerk van Gemini 2.0 Flash Thinking is de mogelijkheid om naast tekst ook beeldinvoer te verwerken. Terwijl OpenAI’s o1 aanvankelijk alleen met tekst werkte voordat er later afbeeldingsmogelijkheden aan werden toegevoegd, is het model van Google vanaf het begin ontworpen om meerdere gegevenstypen te verwerken.
Dankzij deze ingebouwde mogelijkheid kan het model complexe situaties aanpakken die de analyse vereisen van verschillende soorten informatie. Het model heeft bijvoorbeeld puzzels kunnen oplossen waarbij zowel tekst als afbeeldingen moeten worden gebruikt, wat aantoont dat het in staat is om met verschillende dataformaten te werken. Ontwikkelaars hebben momenteel toegang tot deze functies via Google AI Studio en Vertex AI .
Benchmarkresultaten
Eerste resultaten van het Chatbot Arena benchmark-leaderboard voor de geteste Gemini-2.0-Flash-Thinking-exp-1219 model tonen over het algemeen superieure prestaties in vergelijking met de genoemde OpenAi o1-modellen (o1-preview en o1-mini).
Gemini-2.0-Flash-Thinking #1 in alle categorieën! pic.twitter.com/mRctNA31B9
— lmarena.ai (voorheen lmsys.org) (@lmarena_ai) 19 december 2024
Tegen o1-preview, Gemini-2.0-Flash-Thinking presteert aanzienlijk beter dan het in de algehele prestaties met stijlcontrole, creatief schrijven, instructies volgen en langere zoekopdrachten. Ze bereiken dezelfde rang in Harde Prompts, Harde Prompts met Stijlcontrole, Codering en Wiskunde. Vergeleken met o1-mini presteert Gemini-2.0-Flash-Thinking aanzienlijk beter dan het in algemene prestaties, algemeen met stijlcontrole, harde aanwijzingen, harde aanwijzingen met stijlcontrole, creatief schrijven, het volgen van instructies en langer Vraag. Ze bereiken dezelfde rang in Coderen en Wiskunde.
Het is belangrijk op te merken dat deze vergelijking alleen de’preview’-en’mini’-versies van de o1-modellen omvat. De stabiele releaseversies van o1 en o1 Pro ontbreken in dit overzicht, wat betekent dat het geen vergelijking weergeeft met de potentieel krachtigere stabiele releases van de o1-modellenfamilie.
Echter, gebaseerd op de beschikbare gegevens laat Gemini-2.0-Flash-Thinking-exp-1219 een aanzienlijk sterker prestatieprofiel zien vergeleken met de o1-preview-en o1-mini-modellen.
Details van Gemini 2.0 Flash Thinking
Gemini 2.0 Flash Thinking is momenteel beschikbaar als experiment binnen Google AI Studio. Het is gebouwd op de basis van het onlangs uitgebrachte Gemini 2.0 Flash-model.
Jeff Dean, hoofdwetenschapper van Google DeepMind, legde uit dat het model “getraind is om gedachten te gebruiken om de redenering te versterken”. Hij merkte ook “veelbelovende resultaten op als we de berekening van de inferentietijd vergroten”, verwijzend naar de hoeveelheid computerbronnen die worden gebruikt bij het verwerken van zoekopdrachten.
Introductie van Gemini 2.0 Flash Thinking, een experimenteel model dat expliciet zijn gedachten laat zien.
Gebouwd op de snelheid van 2.0 Flash en prestaties is dit model getraind om gedachten te gebruiken om zijn redenering te versterken.
En we zien veelbelovende resultaten als we de inferentietijd vergroten…
— Jeff Dean (@JeffDean) 19 december 2024
Dean deelde ook een demo waarin het model een complex natuurkundig probleem oploste.
Wil je Gemini 2.0 Flash Thinking in actie zien? Bekijk deze demo waarin het model een natuurkundig probleem oplost en de redenering ervan uitlegt. pic.twitter.com/Nl0hYj7ZFS
— Jeff Dean (@JeffDean) 19 december 2024
Het model ondersteunt een contextlengte groter dan 128k, heeft een limiet van 32.000 tokens voor invoer en kan uitvoer genereren met een lengte van maximaal 8.000 tokens. Het wordt geleverd met een kennislimiet van augustus 2024. in de documentatie van Google staat dat “De Thinking Mode beschikt over sterkere redeneermogelijkheden in zijn antwoorden dan het basismodel Gemini 2.0 Flash”, waarbij de verbeterde analytische vaardigheden worden benadrukt.
Momenteel is de model wordt kosteloos aangeboden binnen Google AI Studio, maar de documentatie geeft aan dat sommige integraties, zoals de Google Search-functionaliteit, nog niet beschikbaar zijn. Het model is speciaal ontworpen voor taken op het gebied van’multimodaal begrijpen, redeneren’en’coderen’.
Concurrentie met OpenAI’s Premium. Aanbod
De introductie van Gemini 2.0 Flash Thinking komt kort nadat OpenAI ChatGPT Pro, de volledige versie van het o1 redeneermodel, op 5 december lanceerde, wat de toenemende concurrentie op het gebied van geavanceerde AI benadrukt.
Google’s lancering van Gemini 2.0 Flash Thinking vindt plaats op het moment dat OpenAI onlangs zijn premiumaanbod voor geavanceerde redeneermogelijkheden heeft geïntroduceerd. Terwijl de o1 pro-modus van OpenAI de nadruk legt op prestaties door middel van verhoogde rekenbronnen, benadrukt Google’s Gemini 2.0 Flash Thinking de transparantie van het redeneringsproces.
Dit verschil benadrukt de contrasterende strategieën die worden gebruikt bij de ontwikkeling van AI, waarbij sommige zich richten op rekenkracht en andere prioriteit geven aan begrip en vertrouwen van de gebruiker.