Google has officially escalated its campaign in the generative AI wars, launching its flagship text-to-image model, Imagen 4, alongside a more powerful counterpart, Imagen 4 Ultra. Június 24-én a modellek a Gemini API és korlátozott ingyenes tesztelésnél Gemini API-ban, valamint a Google Ai Studio , egy stratégiai lépés, amelynek célja a cég legfejlettebb kreatív eszközeinek közvetlenül a fejlesztők és a nyilvánosság kezébe. jelentős előrelépést jelent a vállalat ambícióiban. Google azt mondja: Ez a minőségre és a pontosságra való összpontosítás központi szerepet játszik a Google hangmagasságában, mivel az egyre zsúfoltabb és értékesebb piacon szereplő pozíciót foglalja el. Ez a szolgáltatás nem csupán technikai lábjegyzet, hanem közvetlen válasz az átláthatóság és az elszámoltathatóság növekvő igényére, mivel az AI által generált tartalom szinte megkülönböztethetetlenné válik a valóságtól. In May, Google launched SynthID Detector, a public tool which identifies AI-created media by checking for embedded digital watermarks in images, video, audio, and text
A Two-Tiered Strategy for Egy törött piac
Ezzel a kiadással a Google egyértelmű, kétlépcsős stratégiát hajt végre, amelyek különböző kreatív igényekhez igazodnak. A standard Imagen 4 sokoldalú munkakörként helyezkedik el a feladatok széles skálájához, míg a Premium Imagen 4 Ultra azoknak a szakembereknek szól, akiknek szigorú hűségre és pontos betartásra van szükségük az összetett utasításokhoz. A vállalat egyértelmű fizetési, as-you-go árképzési struktúrát állított fel, amely a standard modellre generált képenként 0,04 dollárba került, és az ultra 0,06 dollárba kerül, a “_ blank”> árazási oldal . agresszív. The cost for the standard Imagen 4 model is directly competitive with that of OpenAI’s DALL-E 3, signaling Google’s intent to compete not just on quality but also on accessibility. A további bírósági fejlesztők számára a Google részletes szakácskönyvek és a kezdeti API-határértéket. A tesztelők korai visszajelzése azt sugallja, hogy az erőfeszítés megtérül, mivel a felhasználók az élesebb betűkkel és kevesebb vizuális tárgyat jelentettek a korábbi verziókhoz képest. Bevezetően versenyképes piacra lép be , amely előrejelzések szerint 2024-ig az USD 60-ig terjed. Ebben a környezetben a kulcsfontosságú szereplők rendkívül eltérő stratégiákat folytatnak. Az Adobe, a kreatív szoftverterület titánja nemrégiben elindított egy Firefly Mobile alkalmazást, amely kreatív csomópontként működik, és a riválisok, például a Google és az Openai harmadik fél modelljeit integrálja a sajátja mellett. A Black Forest Labs, a korábbi stabilitási AI vezetők által alapított társaság, nemrégiben elindította a Flux.1 Kontext modelleket, és számos partner révén terjeszti őket, köztük a Canva és a Freepik. Eközben a verseny továbbra is a csendes képeken túl bővül. Csak a múlt héten a Midjourney elindította első AI videogenerációs modelljét, David Holz vezérigazgató alapvető lépésként vette fel a kiadást, amelyben egy blogbejegyzésben szerepel: „Az AI Model V1 csak a következő lépcső a valós idejű nyílt világú szimulációk felé.”