Google heeft Gemini 2.5 Flash Image officieel gelanceerd, het krachtige AI-model dat in augustus viraal ging als’Nano Banana’, waardoor het algemeen beschikbaar is voor ontwikkelaars en ondernemingen over de hele wereld.
Aangekondigd op 2 oktober is de productieklare tool nu toegankelijk via de Gemini API, Google AI Studio en Vertex AI.
Deze grote release introduceert nieuwe creatieve mogelijkheden, waaronder ondersteuning voor 10 beeldverhoudingen en verbeterde tekenconsistentie voor realistischere bewerkingen.
Deze stap versterkt de uitdaging van Google tegenover concurrenten als OpenAI en Adobe, met als doel een state-of-the-art imago te creëren generatie in handen van meer makers.
Nieuwe creatieve besturingselementen en succes als early adopter
Het model verscheen voor het eerst anoniem op het crowdsourced evaluatieplatform LMArena als’nano-banaan’en werd al snel’s werelds best beoordeelde beeldbewerkingsmodel.
Deze strategie genereerde aanzienlijke organische buzz voordat de officiële branding werd onthuld.
De algemeen beschikbare release op 2 oktober omvat ook aanzienlijke productiegerichte upgrades.
Een belangrijke verbetering is de ondersteuning voor 10 verschillende beeldverhoudingen, variërend van filmisch landschap tot verticale sociale-mediaformaten. Hierdoor kunnen makers inhoud afstemmen op specifieke platforms.
De update verfijnt ook de kernkracht van het model: “karakterconsistentie.” Deze functie, die de gelijkenis van een onderwerp bij grote bewerkingen behoudt, pakt een gemeenschappelijk faalpunt voor veel AI-modellen aan.
Nicole Brichtova, productleider bij Google DeepMind, merkte op:”we geven mogelijkheden waarvoor vroeger gespecialiseerde tools nodig waren in handen van alledaagse makers, en het was inspirerend om te zien welke explosie van creativiteit dit heeft teweeggebracht.”
De native multimodale mogelijkheden van het model maken dit mogelijk. om tekst en afbeeldingen tegelijkertijd te verwerken. Dit betekent dat het een bestaande afbeelding kan begrijpen en deze kan opnemen in het creatieve proces, in plaats van alleen maar te genereren op basis van een tekstprompt.
Dit maakt nauwkeurigere en consistentere bewerkingen tijdens een gesprek mogelijk.
Early adopters integreren deze mogelijkheden al. AI-startup Cartwheel ontdekte dat het model op unieke wijze in staat is om complexe poses vanuit elke camerahoek aan te kunnen.
Mede-oprichter Andrew Carr prees Google en zei:”Andere modellen konden geen karakters vanuit willekeurige camerahoeken weergeven of trouw blijven aan een pose zonder’wereldkennis’op te offeren. Het nieuwe Gemini 2.5 Flash Image-model was de eerste die beide kon bieden.”
Google heeft de prijs vastgesteld op $0,039 per afbeelding en $30 per miljoen outputtokens, een concurrerend tarief gericht op het stimuleren van de adoptie door bedrijven via het Vertex AI-platform.
Een berekende zet in de overvolle AI Image Race
De lancering is een berekend antwoord op een fel concurrerende markt. De druk werd groter nadat OpenAI zijn GPT-4o-beeldgenerator rechtstreeks in ChatGPT had geïntegreerd, waardoor de betrokkenheid van gebruikers enorm is toegenomen.
De strategie van Google richt zich rechtstreeks op een breed publiek in de chat-app, met als doel massale acceptatie.
Recentelijk neemt de concurrentiedruk over de hele linie toe. ByteDance heeft zijn Seedream 4.0-model gelanceerd als een directe uitdager van “Nano Banana”.
Meta heeft ook zijn strategie voor het genereren van AI-beelden gewijzigd en ervoor gekozen om technologie van Midjourney te licentiëren na interne tegenslagen.
De markt ziet gespecialiseerde spelers opkomen, zoals Black Forest Labs dat zich richt op fotorealisme en het model van Alibaba dat uitblinkt in tekstweergave.
Creatieve kracht in evenwicht brengen met nieuwe waarborgen
De stap van Google komt na eerdere struikelblokken bij het genereren van AI-afbeeldingen.
Het bedrijf kreeg te maken met terugslag toen een vroege versie van Gemini historisch onjuiste afbeeldingen van mensen produceerde, waardoor een tijdelijke opschorting van de functie werd gedwongen. Deze nieuwe lancering gaat gepaard met robuustere veiligheidsprotocollen.
Om de groeiende dreiging van deepfakes aan te pakken, voegt Google alle gegenereerde inhoud toe aan een watermerk.
Afbeeldingen zullen zowel een zichtbare markering als een onzichtbaar, cryptografisch SynthID-watermerk bevatten om duidelijk aan te geven dat ze door AI zijn gegenereerd. Dit staat in contrast met de juridische strijd waarmee concurrenten als Midjourney verwikkeld zijn.
Midjourney wordt momenteel geconfronteerd met een spraakmakende auteursrechtzaak van Disney en Universal vanwege zijn trainingsgegevens.
Het benadrukt het complexe juridische en ethische landschap waar alle AI-bedrijven doorheen moeten navigeren, waardoor de proactieve watermerken van Google een belangrijke strategische beslissing zijn.
Door gebruiksvriendelijke inbedding bewerkingstools in zijn vlaggenschip AI-product positioneert Google Gemini niet alleen als een chatbot, maar in toenemende mate als een uitgebreide creatieve motor, vergelijkbaar met OpenAI, dat zojuist zijn Sora 2 AI-videomodel heeft gelanceerd.
Deze stap is een duidelijke gok dat toegankelijkheid en vertrouwen reguliere gebruikers kunnen overtuigen in het snel evoluerende veld van generatieve AI.