Google rolt dinsdag een krachtig nieuw beeldbewerkingsmodel uit voor zijn Gemini-app. Ontwikkeld door DeepMind, introduceert de update geavanceerde functies die zijn ontworpen om gebruikers meer creatieve controle en consistentie te geven, waardoor rivalen zoals Openai en Adobe direct uitdagen.

De upgrade is bedoeld om een ​​van de meest aanhoudende gebreken van AI op te lossen: het handhaven van de gelijkenis van een persoon over bewerkingen. Gebruikers kunnen nu outfits of achtergronden wijzigen zonder gezichten te vervormen, foto’s in een enkele scène te mengen of iteratieve wijzigingen aan te brengen in een conversatiestroom.

Deze beweging geeft de bedoeling van Google aan om de gebruikerskloof met concurrenten te dichten. Het nieuwe model is nu geïntegreerd in de Gemini-app voor alle gebruikers en is ook beschikbaar voor ontwikkelaars via de Gemini API, Google AI Studio en Vertex Ai, width=”1032″height=”505″src=”data: image/svg+xml; nitro-empty-id=mtyzodoxmja1-1; base64, phn2zyb2awv3qm94psiwidagmtazmia1md Uiihdpzhropsixmdmyiibozwlnahq9ijuwnsigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

Van ‘nano-banana’ tot een nieuwe benchmark in AI-bewerking

Het publieke debuut van het model werd voorafgegaan door een stealthy en wild succesvol, preview. Het verscheen anoniem op het evaluatieplatform Lmarena van het crowdsourced als”Nano-Banana”, snel buzz in de AI-gemeenschap genereren voordat hij’s werelds top-bewerkingsmodel wordt geworden, model . David Sharon, a lead for Gemini Apps, highlighted its enthusiastic reception, stating, “people have been going bananas over it already in early previews — it’s the top-rated image editing model in the world.”

Its core strength is “character consistency,”a groundbreaking feature that preserves the identity of a person or pet through major transformations. Dit behandelt een gemeenschappelijk faalpunt voor veel AI-modellen, waarbij het bewerken van een achtergrond of een outfit subtiel het gezicht van een onderwerp kan vervormen. Met deze update kunnen gebruikers onderwerpen in geheel nieuwe scenario’s plaatsen-verschillende outfits uitpakken, nieuwe beroepen voorstellen of zelfs zien hoe ze in een ander decennium zouden verschijnen-terwijl

De industrie wordt ook geconfronteerd met scepticisme over de betrouwbaarheid van AI-benchmarks. Zoals AI-strateeg Nate Jones opmerkte:”Op het moment dat we leaderboard dominantie stelen als het doel, lopen we het risico modellen te creëren die uitblinken in triviale oefeningen en bot bij de realiteit.”

Door krachtige, gebruiksvriendelijke bewerkingshulpmiddelen in het vlaggenschip AI-product in te bedden, gokt Google wedden dat toegankelijkheid en creatieve controle over mainstream-gebruikers kan worden gewonnen. De beweging positioneert Gemini niet alleen als een chatbot, maar als een uitgebreide creatieve motor in het snel evoluerende generatieve AI-landschap.