Google啟動了“ Storybook”,這是其雙子座應用程序中的一項新功能,它允許用戶使用簡單的文本提示創建個性化的,插圖的故事。該工具於5月8日在全球發布,生成了10頁的書籍,該書籍具有自定義藝術和讀寫敘事。

該功能旨在使AI驅動的內容創建更容易訪問和個人化。它甚至可以從個人照片或兒童圖紙中汲取靈感。但是,早期測試突出了該技術當前的不可靠性,用戶報告了有趣的結果。

這種不可預測性揭示了拋光的AI營銷與現實世界的性能之間的差距。一位早期的用戶艾瑪·羅斯(Emma Roth)的《邊緣》(Emma Roth)指出:“我遇到了一個插圖,將人的手臂放在其中一條魚上。” 完美地捕獲了當今生成的模型的經常出現的輸出。 src=“ https://winbuzzer.com/wp-content/uploads/2025/08/google-google-geogle-gemini-storybook-feature-1.jpg”>

從提示到個性化的圖畫書 href=”https://blog.google/products/gemini/storybooks/” target=”_blank”>become instant authors. The process is designed for simplicity: a user describes any story they can imagine, and Gemini generates a unique, 10-page book complete with custom art and, crucially, read-aloud audio narration.

The tool’s true power lies在深厚的個性化中。除了文本提示外,用戶還可以上傳自己的照片甚至是孩子的圖紙,要求雙子座將視覺概念帶入新的敘述中。這將功能從簡單的生成器轉變為一種工具,可以將個人記憶和創作變成獨特的,可共享的故事。

[嵌入式內容]

以進一步增強創意控制,該平台支持各種各樣的藝術風格。用戶可以要求視覺效果模仿從像素藝術和漫畫到粘土,鉤針編織甚至著色書籍的所有內容。這種靈活性可在45種以上的語言中獲得,使其成為全球可訪問的創意工具。

Google正在積極鼓勵各種想像力的用例。該公司建議提示,例如創建一個故事來向五歲的孩子解釋太陽系,或者通過使主角成為孩子最喜歡的動物來教授善良的課程。這使故事書的定位不是僅僅是新穎性,而是為家庭和教育者提供的實用,個性化的內容引擎。

此發射是Google更廣泛的策略的關鍵部分,即將生成的AI深深地嵌入其整個產品生態系統中,超越簡單的聊天功能。該方法反映了公司的其他最新創意更新,該更新著重於將靜態用戶輸入轉換為動態,引人入勝的媒體格式。 This pattern—from text to audio to video—shows a clear strategic push to make Google’s AI tools platforms for synthesizing and sharing knowledge, not just for retrieving it.

The Ghost in the Machine: AI’s Unpredictable Artistry

While the concept of an instant, personal storyteller is compelling, the execution reveals the persistent and often comical quirks當前的AI圖像生成。儘管其所有力量,但仍在邏輯連貫性,對象永久性和上下文理解中掙扎。這導致通常稱為“ AI幻覺”或視覺偽像,這不僅是該技術基本不成熟的症狀。

a 迅速暴露了這些超現實的趨勢。一個產生的故事是一條莫名其妙地種植人手臂的魚。另一個涉及意大利麵條醬的頁面看起來像是卡通犯罪現場,而三分之一描繪了一個母親和兒子看著面對錯誤方式的電視。這些不是微妙的錯誤,而是明顯的邏輯失敗。

這個問題是如此普遍,甚至出現在Google自己的促銷視頻中。在一個場景中,顯示了一個角色,“握住扳手時,都會製作“敲擊,點擊,點擊”噪音,這是一種荒謬的動作,突出了AI對現實世界中對象的使用方式的淺色掌握。這些不一致表明,即使經過精心策劃的示例也不能總是隱藏系統的缺陷。

這些問題超出了簡單的對像生成,而不是更廣泛的概念失敗。測試人員指出,角色設計通常從一個頁面變為另一個頁面不一致。此外,當被要求根據上載貓的圖紙創建一個故事時,AI未能忠實地複制用戶的藝術視野,而是產生自己的通用解釋。

這樣的不一致之處在於有充分記錄的行業範圍內的挑戰。它們是現代的現代AI模型,努力使人的手正確渲染,通常會增加手指。產生清晰的文本的困難是另一個持久的障礙,如此重要,以至於像阿里巴巴這樣的公司正在建立專門的模型來解決它。

這些有趣的奇特輸出,這是公眾的重要提醒,以提醒人們這項技術實際上是如何工作的。生成AI是一種概率系統,旨在根據大量培訓數據預測下一個最可能的像素或單詞。它不是一個有知覺的藝術家,對物理學,解剖學或敘事邏輯有真正的了解,其創作將繼續反映出那個奇怪的,奇怪的山谷,直到基礎模型進一步發展為止。

AI講故事的人群擁擠的領域

google的故事書的故事書中的競爭力和快速的推銷。儘管Google的目標是廣泛的消費者吸引力,但競爭對手正在通過解決長期困擾AI圖像產生的特定困難問題來衡量壁ni。這是創造者對更微妙和可信的輸出的日益增長的渴望。

同樣,阿里巴巴的Qwen-Image模型解決了另一個主要障礙:在圖像中準確地渲染清晰的文本。此功能對於專業用例,例如創建海報或營銷材料,這是大多數模型失敗的領域。

這一行業趨勢的專業化趨勢會對故事書(如Storybook)等通用工具施加壓力。成功的新基準是從簡單地生成圖像轉變為以精確,可靠性和藝術控制的形式生成 *正確的圖像。

炒作,幻覺,幻覺和版權headwinds

在整個生成的AI領域都在法律和道德無關的範圍內運作。用於訓練這些強大模型的數據是激烈的辯論和高風險訴訟的主題,對開發人員造成了重大風險。

迪斯尼和環球公司針對Midjourney提起的具有里程碑意義的訴訟,指責該公司未經許可就其AI培訓其AI。正如迪斯尼總法律顧問直言不諱的那樣:“盜版是海盜行為,而A.I.公司完成的事實並沒有使其少於侵犯。”此案可能為整個行業樹立先例。

這種法律摩擦對評估AI模型的評估越來越複雜。基準至高無上的競賽導致指控“考驗”。正如AI戰略家內特·瓊斯(Nate Jones)警告說:“當我們將排行榜主導地位作為目標時,我們冒著創建模型在瑣碎的練習中表現出色的模型,而在面對現實時都會在比目魚中表現出色。”

“agent washing,” where companies overstate the autonomous capabilities of their AI, further complicates the landscape.它產生了一個炒作的循環,可以掩蓋實際的增量進展。

最終,故事書是AI當前狀態的迷人縮影。它具有強大而有創造力,但同時不可靠,容易出現可笑的錯誤。它展示了Google的巨大野心,同時提醒用戶,完美無瑕,真正聰明的AI講故事的年齡尚未到來。

Categories: IT Info