Google的新雙子座“故事書" AI功能創建了插圖的故事，並帶有有趣的結果

Google啟動了“ Storybook”，這是其雙子座應用程序中的一項新功能，它允許用戶使用簡單的文本提示創建個性化的，插圖的故事。該工具於5月8日在全球發布，生成了10頁的書籍，該書籍具有自定義藝術和讀寫敘事。

該功能旨在使AI驅動的內容創建更容易訪問和個人化。它甚至可以從個人照片或兒童圖紙中汲取靈感。但是，早期測試突出了該技術當前的不可靠性，用戶報告了有趣的結果。

這種不可預測性揭示了拋光的AI營銷與現實世界的性能之間的差距。一位早期的用戶艾瑪·羅斯（Emma Roth）的《邊緣》（Emma Roth）指出:“我遇到了一個插圖，將人的手臂放在其中一條魚上。” 完美地捕獲了當今生成的模型的經常出現的輸出。 src=“ https://winbuzzer.com/wp-content/uploads/2025/08/google-google-geogle-gemini-storybook-feature-1.jpg”>

從提示到個性化的圖畫書 href=”https://blog.google/products/gemini/storybooks/” target=”_blank”>become instant authors. The process is designed for simplicity: a user describes any story they can imagine, and Gemini generates a unique, 10-page book complete with custom art and, crucially, read-aloud audio narration.

The tool’s true power lies在深厚的個性化中。除了文本提示外，用戶還可以上傳自己的照片甚至是孩子的圖紙，要求雙子座將視覺概念帶入新的敘述中。這將功能從簡單的生成器轉變為一種工具，可以將個人記憶和創作變成獨特的，可共享的故事。

[嵌入式內容]

以進一步增強創意控制，該平台支持各種各樣的藝術風格。用戶可以要求視覺效果模仿從像素藝術和漫畫到粘土，鉤針編織甚至著色書籍的所有內容。這種靈活性可在45種以上的語言中獲得，使其成為全球可訪問的創意工具。

Google正在積極鼓勵各種想像力的用例。該公司建議提示，例如創建一個故事來向五歲的孩子解釋太陽系，或者通過使主角成為孩子最喜歡的動物來教授善良的課程。這使故事書的定位不是僅僅是新穎性，而是為家庭和教育者提供的實用，個性化的內容引擎。

此發射是Google更廣泛的策略的關鍵部分，即將生成的AI深深地嵌入其整個產品生態系統中，超越簡單的聊天功能。該方法反映了公司的其他最新創意更新，該更新著重於將靜態用戶輸入轉換為動態，引人入勝的媒體格式。 This pattern—from text to audio to video—shows a clear strategic push to make Google’s AI tools platforms for synthesizing and sharing knowledge, not just for retrieving it.

The Ghost in the Machine: AI’s Unpredictable Artistry

While the concept of an instant, personal storyteller is compelling, the execution reveals the persistent and often comical quirks當前的AI圖像生成。儘管其所有力量，但仍在邏輯連貫性，對象永久性和上下文理解中掙扎。這導致通常稱為“ AI幻覺”或視覺偽像，這不僅是該技術基本不成熟的症狀。

a 迅速暴露了這些超現實的趨勢。一個產生的故事是一條莫名其妙地種植人手臂的魚。另一個涉及意大利麵條醬的頁面看起來像是卡通犯罪現場，而三分之一描繪了一個母親和兒子看著面對錯誤方式的電視。這些不是微妙的錯誤，而是明顯的邏輯失敗。

這個問題是如此普遍，甚至出現在Google自己的促銷視頻中。在一個場景中，顯示了一個角色，“握住扳手時，都會製作“敲擊，點擊，點擊”噪音，這是一種荒謬的動作，突出了AI對現實世界中對象的使用方式的淺色掌握。這些不一致表明，即使經過精心策劃的示例也不能總是隱藏系統的缺陷。

這些問題超出了簡單的對像生成，而不是更廣泛的概念失敗。測試人員指出，角色設計通常從一個頁面變為另一個頁面不一致。此外，當被要求根據上載貓的圖紙創建一個故事時，AI未能忠實地複制用戶的藝術視野，而是產生自己的通用解釋。

這樣的不一致之處在於有充分記錄的行業範圍內的挑戰。它們是現代的現代AI模型，努力使人的手正確渲染，通常會增加手指。產生清晰的文本的困難是另一個持久的障礙，如此重要，以至於像阿里巴巴這樣的公司正在建立專門的模型來解決它。

這些有趣的奇特輸出，這是公眾的重要提醒，以提醒人們這項技術實際上是如何工作的。生成AI是一種概率系統，旨在根據大量培訓數據預測下一個最可能的像素或單詞。它不是一個有知覺的藝術家，對物理學，解剖學或敘事邏輯有真正的了解，其創作將繼續反映出那個奇怪的，奇怪的山谷，直到基礎模型進一步發展為止。

AI講故事的人群擁擠的領域

google的故事書的故事書中的競爭力和快速的推銷。儘管Google的目標是廣泛的消費者吸引力，但競爭對手正在通過解決長期困擾AI圖像產生的特定困難問題來衡量壁ni。這是創造者對更微妙和可信的輸出的日益增長的渴望。

同樣，阿里巴巴的Qwen-Image模型解決了另一個主要障礙:在圖像中準確地渲染清晰的文本。此功能對於專業用例，例如創建海報或營銷材料，這是大多數模型失敗的領域。

這一行業趨勢的專業化趨勢會對故事書（如Storybook）等通用工具施加壓力。成功的新基準是從簡單地生成圖像轉變為以精確，可靠性和藝術控制的形式生成 *正確的圖像。

炒作，幻覺，幻覺和版權headwinds

在整個生成的AI領域都在法律和道德無關的範圍內運作。用於訓練這些強大模型的數據是激烈的辯論和高風險訴訟的主題，對開發人員造成了重大風險。

迪斯尼和環球公司針對Midjourney提起的具有里程碑意義的訴訟，指責該公司未經許可就其AI培訓其AI。正如迪斯尼總法律顧問直言不諱的那樣:“盜版是海盜行為，而A.I.公司完成的事實並沒有使其少於侵犯。”此案可能為整個行業樹立先例。

這種法律摩擦對評估AI模型的評估越來越複雜。基準至高無上的競賽導致指控“考驗”。正如AI戰略家內特·瓊斯（Nate Jones）警告說:“當我們將排行榜主導地位作為目標時，我們冒著創建模型在瑣碎的練習中表現出色的模型，而在面對現實時都會在比目魚中表現出色。”

“agent washing,” where companies overstate the autonomous capabilities of their AI, further complicates the landscape.它產生了一個炒作的循環，可以掩蓋實際的增量進展。

最終，故事書是AI當前狀態的迷人縮影。它具有強大而有創造力，但同時不可靠，容易出現可笑的錯誤。它展示了Google的巨大野心，同時提醒用戶，完美無瑕，真正聰明的AI講故事的年齡尚未到來。

Google的新雙子座“故事書” AI功能創建了插圖的故事，並帶有有趣的結果

Published by All Things Windows on August 5, 2025

The Ghost in the Machine: AI’s Unpredictable Artistry

AI講故事的人群擁擠的領域

炒作，幻覺，幻覺和版權headwinds

IT Info

Google在雙子座的“指導學習”上向輔導學生啟動“指導學習”，並與Chatgpt學習模式競爭

IT Info

Microsoft將游戲Copilot AI直接集成到Windows遊戲欄中，用於PC內部人員

IT Info

如何重置Windows 11中的默認防火牆設置

Google的新雙子座“故事書” AI功能創建了插圖的故事，並帶有有趣的結果

Published by All Things Windows on August 5, 2025

The Ghost in the Machine: AI’s Unpredictable Artistry

AI講故事的人群擁擠的領域

炒作，幻覺，幻覺和版權headwinds

Related Posts

IT Info

Google在雙子座的“指導學習”上向輔導學生啟動“指導學習”，並與Chatgpt學習模式競爭

IT Info

Microsoft將游戲Copilot AI直接集成到Windows遊戲欄中，用於PC內部人員

IT Info

如何重置Windows 11中的默認防火牆設置