คุณสมบัติ AI ของ Gemini ‘Storybook’ ใหม่ของ Google สร้างนิทานที่มีภาพประกอบพร้อมผลลัพธ์ที่แปลกประหลาดอย่างน่าอัศจรรย์

Google ได้เปิดตัว“ นิทาน” คุณสมบัติใหม่ในแอพราศีเมถุนที่อนุญาตให้ผู้ใช้สร้างเรื่องราวที่เป็นส่วนตัวโดยใช้ข้อความแจ้งง่าย ๆ เปิดตัวทั่วโลกเมื่อวันที่ 8 พฤษภาคมเครื่องมือสร้างหนังสือ 10 หน้าพร้อมงานศิลปะที่กำหนดเองและคำบรรยายแบบอ่านออกเสียง

คุณลักษณะนี้มีวัตถุประสงค์เพื่อให้การสร้างเนื้อหาที่ขับเคลื่อนด้วย AI เข้าถึงได้ง่ายขึ้นและเป็นส่วนตัว มันสามารถดึงแรงบันดาลใจจากภาพถ่ายส่วนตัวหรือภาพวาดของเด็ก ๆ อย่างไรก็ตามการทดสอบก่อนหน้านี้เน้นถึงความไม่น่าเชื่อถือในปัจจุบันของเทคโนโลยีโดยผู้ใช้รายงานผลลัพธ์ที่แปลกประหลาดอย่างน่าอัศจรรย์

ความไม่แน่นอนนี้แสดงให้เห็นถึงช่องว่างระหว่างการตลาด AI ที่ขัดเงาและประสิทธิภาพในโลกแห่งความเป็นจริง ผู้ใช้รายแรกคนแรกเอ็มม่ารอ ธ แห่ง The Verge กล่าวว่า“ ฉันเจอภาพประกอบหนึ่งที่วางแขนมนุษย์ไว้บนปลาตัวหนึ่ง” การจับเอาท์พุทที่เกิดขึ้นบ่อยครั้งของแบบจำลองการกำเนิดของวันนี้ src=”https://winbuzzer.com/wp-content/uploads/2025/08/google-gemini-storybook-feature-1.jpg”>

href=”https://blog.google/products/gemini/storybooks/”target=”_ blank”> กลายเป็นผู้เขียนทันที กระบวนการนี้ออกแบบมาเพื่อความเรียบง่าย: ผู้ใช้อธิบายเรื่องราวใด ๆ ในความเป็นส่วนตัวลึก นอกเหนือจากการแจ้งข้อความเพียงแค่ข้อความผู้ใช้สามารถอัปโหลดรูปภาพของตัวเองหรือแม้กระทั่งภาพวาดของเด็กขอให้ราศีเมถุนให้นำแนวคิดภาพมาสู่ชีวิตในการเล่าเรื่องใหม่ สิ่งนี้จะเปลี่ยนคุณสมบัติจากเครื่องกำเนิดไฟฟ้าที่เรียบง่ายให้เป็นเครื่องมือในการเปลี่ยนความทรงจำและการสร้างสรรค์ส่วนบุคคลให้กลายเป็นเรื่องราวที่ไม่เหมือนใครและแบ่งปันได้

[เนื้อหาฝังตัว]

เพื่อเพิ่มการควบคุมความคิดสร้างสรรค์เพิ่มเติมแพลตฟอร์มรองรับสไตล์ศิลปะมากมาย ผู้ใช้สามารถขอภาพที่เลียนแบบทุกอย่างตั้งแต่ศิลปะพิกเซลและการ์ตูนไปจนถึงดินเหนียวโครเชต์และแม้แต่สมุดระบายสี ความยืดหยุ่นนี้มีให้บริการมากกว่า 45 ภาษาทำให้เป็นเครื่องมือสร้างสรรค์ที่สามารถเข้าถึงได้ทั่วโลก

Google กำลังส่งเสริมกรณีการใช้งานจินตนาการที่หลากหลาย บริษัท แนะนำให้พร้อมที่จะสร้างเรื่องราวเพื่ออธิบายระบบสุริยจักรวาลให้กับเด็กอายุห้าขวบหรือสอนบทเรียนเกี่ยวกับความเมตตาด้วยการทำให้ตัวละครหลักเป็นสัตว์ที่เด็กโปรดปราน นี่เป็นตำแหน่งนิทานที่ไม่แปลกใหม่ แต่เป็นเครื่องมือเนื้อหาที่เป็นส่วนตัวสำหรับครอบครัวและนักการศึกษา

การเปิดตัวนี้เป็นส่วนสำคัญของกลยุทธ์ที่กว้างขึ้นของ Google ในการฝัง AI ที่เกิดขึ้นอย่างลึกซึ้งในระบบนิเวศผลิตภัณฑ์ทั้งหมด วิธีการสะท้อนการอัปเดตที่สร้างสรรค์ล่าสุดจาก บริษัท ซึ่งมุ่งเน้นไปที่การเปลี่ยนการป้อนข้อมูลผู้ใช้แบบคงที่เป็นรูปแบบสื่อแบบไดนามิกที่มีส่วนร่วม

ตัวอย่างเช่นผู้ช่วยวิจัยโน้ตบุ๊กของ บริษัท ได้พัฒนาอย่างต่อเนื่องเมื่อเร็ว ๆ นี้เพิ่ม“ ภาพรวมวิดีโอ” ที่เปลี่ยนบันทึกการวิจัย รูปแบบนี้-จากข้อความไปจนถึงเสียงไปจนถึงวิดีโอ-แสดงให้เห็นถึงการผลักดันเชิงกลยุทธ์ที่ชัดเจนในการสร้างแพลตฟอร์มเครื่องมือ AI ของ Google สำหรับการสังเคราะห์และแบ่งปันความรู้ไม่เพียง แต่สำหรับการดึงมัน

ผีในเครื่อง: AI ที่ไม่สามารถคาดเดาได้ การสร้างภาพ AI เทคโนโลยีสำหรับพลังทั้งหมดยังคงดิ้นรนกับการเชื่อมโยงเชิงตรรกะความคงทนของวัตถุและความเข้าใจตามบริบท สิ่งนี้นำไปสู่สิ่งที่เรียกว่า”ภาพหลอน AI”หรือสิ่งประดิษฐ์ภาพซึ่งไม่ได้เป็นเพียงข้อบกพร่อง แต่เป็นอาการของความไม่แน่นอนของเทคโนโลยี Verge เปิดเผยแนวโน้มเซอร์เรียลเหล่านี้อย่างรวดเร็ว เรื่องราวหนึ่งที่สร้างขึ้นเป็นปลาที่มีแขนมนุษย์โตขึ้นอย่างลึกลับ อีกหน้าหนึ่งทำหน้าที่เกี่ยวกับซอสสปาเก็ตตี้ดูเหมือนฉากอาชญากรรมการ์ตูนในขณะที่หนึ่งในสามแสดงให้เห็นถึงแม่และลูกชายที่ดูทีวีที่กำลังเผชิญกับวิธีที่ผิด สิ่งเหล่านี้ไม่ใช่ข้อผิดพลาดเล็กน้อย แต่เป็นความล้มเหลวเชิงตรรกะที่จ้องมอง

ปัญหานั้นแพร่หลายมากจนปรากฏขึ้นในวิดีโอส่งเสริมการขายของ Google สำหรับคุณสมบัตินี้ ในฉากหนึ่งตัวละครจะแสดงให้เห็นว่า“ แตะ, แตะ, แตะ” เสียงในขณะที่ถือประแจการกระทำที่ไร้สาระที่เน้นความเข้าใจที่ตื้นเขินของ AI เกี่ยวกับวิธีการใช้วัตถุในโลกแห่งความเป็นจริง ความไม่สอดคล้องกันเหล่านี้แสดงให้เห็นว่าแม้ตัวอย่างที่รวบรวมไว้อย่างระมัดระวังไม่สามารถซ่อนข้อบกพร่องของระบบได้เสมอ

ปัญหาเหล่านี้ขยายเกินกว่าการสร้างวัตถุอย่างง่ายเพื่อความล้มเหลวของแนวคิดที่กว้างขึ้น ผู้ทดสอบระบุว่าการออกแบบตัวละครมักจะเปลี่ยนไปอย่างไม่สอดคล้องกันจากหน้าหนึ่งไปยังอีกหน้าหนึ่ง นอกจากนี้เมื่อถูกขอให้สร้างเรื่องราวตามภาพวาดแมวที่อัปโหลด AI ไม่สามารถทำซ้ำวิสัยทัศน์ทางศิลปะของผู้ใช้ได้อย่างซื่อสัตย์แทนที่จะสร้างการตีความทั่วไปของตัวเอง

ความไม่สอดคล้องกันดังกล่าวเป็นความท้าทายทั่วทั้งอุตสาหกรรม พวกเขามีความทันสมัยเทียบเท่ากับรุ่น AI รุ่นแรกที่พยายามดิ้นรนเพื่อทำให้มือมนุษย์อย่างถูกต้องมักจะเพิ่มนิ้วพิเศษ ความยากลำบากในการสร้างข้อความที่อ่านง่ายเป็นสิ่งกีดขวางที่ต่อเนื่องกันดังนั้น บริษัท ต่างๆเช่นอาลีบาบากำลังสร้างแบบจำลองพิเศษเพื่อแก้ปัญหา

เอาท์พุทที่แปลกประหลาดเหล่านี้ทำหน้าที่เป็นเครื่องเตือนความทรงจำสาธารณะที่สำคัญว่าเทคโนโลยีนี้ใช้งานได้จริงอย่างไร Generative AI เป็นระบบความน่าจะเป็นซึ่งมีทักษะเป็นพิเศษในการทำนายพิกเซลหรือคำที่เป็นไปได้มากที่สุดต่อไปตามข้อมูลการฝึกอบรมที่กว้างใหญ่ มันไม่ใช่ศิลปินที่มีความรู้สึกที่มีความเข้าใจที่แท้จริงเกี่ยวกับฟิสิกส์กายวิภาคศาสตร์หรือตรรกะการเล่าเรื่องและการสร้างสรรค์ของมันจะยังคงสะท้อนให้เห็นถึงความแปลกประหลาดที่แปลกประหลาดในหุบเขาที่แปลกประหลาดจนกระทั่งนางแบบพื้นฐานมีวิวัฒนาการมาไกลกว่านี้

ในขณะที่ Google ตั้งเป้าหมายสำหรับการอุทธรณ์ของผู้บริโภคในวงกว้างคู่แข่งกำลังแกะสลัก niches โดยการแก้ปัญหาที่เฉพาะเจาะจงและยากลำบากที่ทำให้เกิดการสร้างภาพ AI มานาน

ตัวอย่างเช่นฟลักซ์ของห้องปฏิบัติการป่าสีดำ 1 Krea นั้นได้รับการออกแบบมาโดยเฉพาะ นี่เป็นเป้าหมายที่เพิ่มขึ้นในหมู่ผู้สร้างสำหรับผลลัพธ์ที่ลึกซึ้งและน่าเชื่อถือมากขึ้น

ในทำนองเดียวกันโมเดล Qwen-Image ของอาลีบาบาจะจัดการกับอุปสรรคสำคัญอีกอย่างหนึ่ง: แสดงข้อความที่ชัดเจนภายในภาพ ความสามารถนี้เป็นสิ่งสำคัญสำหรับกรณีการใช้งานระดับมืออาชีพเช่นการสร้างโปสเตอร์หรือสื่อการตลาดโดเมนที่โมเดลส่วนใหญ่ล้มเหลว

แนวโน้มอุตสาหกรรมนี้มีความเชี่ยวชาญในการกดดันเครื่องมืออเนกประสงค์ทั่วไปเช่นนิทาน เกณฑ์มาตรฐานใหม่เพื่อความสำเร็จคือการเปลี่ยนจากการสร้างภาพเพื่อสร้างภาพ * ขวา * ที่มีความแม่นยำความน่าเชื่อถือและการควบคุมทางศิลปะ

hype, ภาพหลอนและลมพัดผ่านทางกฎหมาย ข้อมูลที่ใช้ในการฝึกอบรมโมเดลที่ทรงพลังเหล่านี้เป็นเรื่องของการอภิปรายอย่างเข้มข้นและการดำเนินคดีที่มีเดิมพันสูงสร้างความเสี่ยงที่สำคัญสำหรับนักพัฒนา

คดีความสำคัญที่ยื่นโดยดิสนีย์และสากลต่อมิดเจร์นีย์กล่าวหาว่า บริษัท ฝึกอบรม AI เกี่ยวกับตัวละครที่มีลิขสิทธิ์โดยไม่ได้รับอนุญาต ตามที่ปรึกษาทั่วไปของดิสนีย์กล่าวอย่างตรงไปตรงมาว่า“ การละเมิดลิขสิทธิ์คือการละเมิดลิขสิทธิ์และความจริงที่ว่า บริษัท A.I. ทำไม่ได้ทำให้การละเมิดน้อยลง” กรณีนี้สามารถกำหนดแบบอย่างสำหรับอุตสาหกรรมทั้งหมด

แรงเสียดทานทางกฎหมายนี้ประกอบไปด้วยการเพิ่มความสงสัยในการประเมินแบบจำลอง AI การแข่งขันเพื่อมาตรฐานอำนาจสูงสุดได้นำไปสู่การกล่าวหาว่า”การสอนสู่การทดสอบ”ในฐานะนักยุทธศาสตร์ AI Nate Jones เตือนว่า“ ช่วงเวลาที่เราตั้งค่าการปกครองลีดเดอร์บอร์ดเป็นเป้าหมายเราเสี่ยงต่อการสร้างแบบจำลองที่ยอดเยี่ยมในการออกกำลังกายเล็กน้อยและดิ้นรนเมื่อเผชิญกับความเป็นจริง”

ปรากฏการณ์ของ

คุณสมบัติ AI ของ Gemini ‘Storybook’ ใหม่ของ Google สร้างนิทานที่มีภาพประกอบพร้อมผลลัพธ์ที่แปลกประหลาดอย่างน่าอัศจรรย์

Published by All Things Windows on August 5, 2025

IT Info

Google ปลดปล่อยความวุ่นวายของตัวแทน AI ใหม่เปิดตัวเพื่อนร่วมทีม GitHub และพนักงานคลาวด์ข้อมูลใหม่

IT Info

ตัวแทนการเข้ารหัส Jules AI ของ Google ออกจากเบต้าด้วยราคาและคุณสมบัติใหม่

IT Info

วิธีเปิดใช้งานหรือปิดการใช้งาน HDR ใน Windows 11

คุณสมบัติ AI ของ Gemini ‘Storybook’ ใหม่ของ Google สร้างนิทานที่มีภาพประกอบพร้อมผลลัพธ์ที่แปลกประหลาดอย่างน่าอัศจรรย์

Published by All Things Windows on August 5, 2025

Related Posts

IT Info

Google ปลดปล่อยความวุ่นวายของตัวแทน AI ใหม่เปิดตัวเพื่อนร่วมทีม GitHub และพนักงานคลาวด์ข้อมูลใหม่

IT Info

ตัวแทนการเข้ารหัส Jules AI ของ Google ออกจากเบต้าด้วยราคาและคุณสมบัติใหม่

IT Info

วิธีเปิดใช้งานหรือปิดการใช้งาน HDR ใน Windows 11