A Google új Gemini „Storybook" AI funkciója illusztrált meséket hoz létre szórakoztatóan bizarr eredményekkel

A Google elindította a „Storybook” új funkciót a Gemini alkalmazásban, amely lehetővé teszi a felhasználók számára, hogy személyre szabott, illusztrált történeteket készítsenek egyszerű szövegközlemények segítségével. A május 8-án világszerte közzétett eszköz 10 oldalas könyveket generál egyedi művészet és olvasás-hangos elbeszéléssel. Még inspirációt is készíthet a személyes fényképekből vagy a gyermekek rajzaiból. A korai tesztek azonban kiemelik a technológia jelenlegi megbízhatatlanságát, mivel a felhasználók szórakoztatóan bizarr eredményeket jelentettek. Az egyik korai felhasználó, Emma Roth, a Verge, megjegyezte: „Egy olyan illusztrációval találkoztam, amely emberi karot tett az egyik halra.” tökéletesen rögzítve a mai generatív modellek gyakran surreal kimenetét. src=”https://winbuzzer.com/wp-content/uploads/2025/08/google-gemini-storybook-feature-1.jpg”>

a személyre szabott képkönyvekig

A Storybook a felhasználóknak a Legyen azonnali szerzők. mély személyre szabásakor. A csak a szöveges utasításokon túl a felhasználók feltölthetik saját fényképeiket vagy akár egy gyermek rajzát, és arra kérik az Ikreket, hogy életre keltsék a vizuális koncepciót egy új narratívában. Ez átalakítja a funkciót egy egyszerű generátorról olyan eszközré, amely a személyes emlékek és alkotások egyedi, megosztható történetekké alakítására szolgál. A felhasználók olyan látványt kérhetnek, amely mindent utánoz, a pixel művészettől és a képregényektől az agyagolásig, horgolt és akár kifestőkönyvekig. Ez a rugalmasság több mint 45 nyelven érhető el, így globálisan hozzáférhető kreatív eszközt jelent. A vállalat javaslatokat javasol, mint például egy történet létrehozása, hogy elmagyarázza a Naprendszert egy ötévesnek, vagy tanítson leckét a kedvességről azáltal, hogy a főszereplőt a gyermek kedvenc állatává teszi. Ez a történetfüzetet nem pusztán újdonságként, hanem gyakorlati, személyre szabott tartalommotorként a családok és az oktatók számára. A megközelítés tükrözi a vállalat más legújabb kreatív frissítéseit, amelyek a statikus felhasználói bemenet átalakítására összpontosítanak dinamikus, vonzó médiaformátumokká. Ez a minta-a szövegtől az audio-ig a videóig-egyértelmű stratégiai lendületet ad a Google AI Tools platformjaihoz az ismeretek szintetizálásához és megosztásához, nem csak annak visszakereséséhez. AI képgeneráció. A technológia minden ereje érdekében továbbra is logikus koherenciával, tárgyi tartóssággal és kontextuális megértéssel küzd. Ez ahhoz vezet, amit általában „AI hallucinációknak” vagy vizuális tárgyaknak neveznek, amelyek nem pusztán hibák, hanem a technológia alapvető éretlenségének tünetei. Verge gyorsan feltárta ezeket a szürreális tendenciákat. Az egyik generált történet egy halat mutattak be, amely megmagyarázhatatlanul megnövelte az emberi karot. Egy másik olyan oldalt készített, amelyben a spagetti szósz magában foglalja a rajzfilm-bűncselekmény helyét, míg egy harmadik egy anyát és fiát ábrázolta, hogy tévesen nézzen. Ezek nem finom hibák, hanem a logikai hibák. Az egyik jelenetben egy karakter látható, hogy a „Tap, Tap, Top” zajt készít egy csavarkulcs tartása közben, egy értelmetlen művelet, amely kiemeli az AI sekély megértését, hogy az objektumok hogyan használják a való világban. Ezek az inkonzisztenciák azt mutatják, hogy még a gondosan kurátált példák nem mindig rejthetik el a rendszer hibáit. A tesztelők megjegyezték, hogy a karaktertervek gyakran következetlenül változtak az egyik oldalról a másikra. Ezenkívül, amikor arra kérték, hogy készítsen egy történetet egy macska feltöltött rajzán alapul, az AI nem tudta hűségesen megismételni a felhasználó művészi jövőképét, ehelyett saját általános értelmezését készíti. Ezek a korai AI modellek modern egyenértékűek, amelyek küzdenek azért, hogy az emberi kezeket helyesen állítsák, gyakran extra ujjakkal. Az olvasható szöveg előállításának nehézsége egy másik tartós akadály, amely annyira jelentős, hogy az Alibaba-hoz hasonló vállalatok speciális modelleket építenek csak annak megoldására. A Generative AI egy valószínűségi rendszer, amely rendkívül képzett a következő legvalószínűbb pixel vagy szó előrejelzésére a hatalmas edzési adatok alapján. Ez nem olyan érző művész, akinek valódi megértése van a fizika, az anatómiai vagy a narratív logika, és alkotásai továbbra is tükrözik ezt a furcsa, szokatlan völgyet, amíg az alapul szolgáló modellek tovább fejlődnek. Miközben a Google a széles fogyasztói vonzerejét célozza meg, a riválisok réseket készítenek olyan konkrét, nehéz problémák megoldásával, amelyek már régóta sújtják az AI-képtermelést. Ez egyre növekvő vágyat céloz meg az alkotók körében a finomabb és hitelesebb outputok iránt. Ez a képesség elengedhetetlen a szakmai felhasználási esetekben, például plakátok vagy marketing anyagok létrehozásában, egy olyan területen, ahol a legtöbb modell kudarcot vall. A siker új referenciaértéke a kép létrehozásának egyszerű, megbízhatósága és művészi ellenőrzésével való egyszerűbb kép előállításához változik. Az ezeknek a hatalmas modellek kiképzéséhez felhasznált adatok intenzív vita és magas téttel kapcsolatos peres eljárások tárgyát képezik, ami jelentős kockázatot jelent a fejlesztők számára. Ahogyan a Disney főtanácsosa nyersen kijelentette: „A kalózkodás kalózkodás, és az a tény, hogy egy A.I. társaság készítette, nem teszi kevésbé megsértővé.” Ez az eset precedenst teremthet az egész iparág számára. A referenciaértékek feletti verseny a supremacy elleni vádat vezette a „tesztelésre való tanítás” vádjához. Ahogyan Nate Jones, az AI stratégia figyelmeztette: „Abban a pillanatban, amikor a ranglistán dominanciát a célként állítottuk fel, kockáztatunk olyan modellek létrehozását, amelyek kitűnőek a triviális gyakorlatokban, és lepattannak, amikor a valósággal szembesülünk. href=”https://www.forbes.com/sites/bernardmarr/2025/08/05/what-is-ai-agent-washing-washing-why-is-it–risk-to-busines/”Target=”_ üres”>”Ügynökmosás”, A társaságok túlteljesítik az autonóm kapacitást. Ez egy olyan hype ciklust hoz létre, amely elhomályosíthatja a valós, növekményes haladás megtörténését. Erőteljes és kreatív, mégis egyszerre megbízhatatlan és hajlamos a komikus hibákra. Bemutatja a Google óriási ambícióját, miközben emlékezteti a felhasználókat, hogy a hibátlan, igazán intelligens AI mesemondók kora még nem érkezett meg.

A Google új Gemini „Storybook” AI funkciója illusztrált meséket hoz létre szórakoztatóan bizarr eredményekkel

Published by All Things Windows on August 5, 2025

a személyre szabott képkönyvekig

IT Info

Kötet licenc vs. kiskereskedelem vs. OEM: A Microsoft engedélyezési modelljeinek megértése

IT Info

Hogyan lehet megnyitni a parancssort, ha a Windows nem indul (3 módon)

IT Info

Meta Demos VR jövője a Tiramisu és a Boba 3 fejhallgatókkal

A Google új Gemini „Storybook” AI funkciója illusztrált meséket hoz létre szórakoztatóan bizarr eredményekkel

Published by All Things Windows on August 5, 2025

a személyre szabott képkönyvekig

Related Posts

IT Info

Kötet licenc vs. kiskereskedelem vs. OEM: A Microsoft engedélyezési modelljeinek megértése

IT Info

Hogyan lehet megnyitni a parancssort, ha a Windows nem indul (3 módon)

IT Info

Meta Demos VR jövője a Tiramisu és a Boba 3 fejhallgatókkal