Google ได้เปิดตัว“ นิทาน” คุณสมบัติใหม่ในแอพราศีเมถุนที่อนุญาตให้ผู้ใช้สร้างเรื่องราวที่เป็นส่วนตัวโดยใช้ข้อความแจ้งง่าย ๆ เปิดตัวทั่วโลกเมื่อวันที่ 8 พฤษภาคมเครื่องมือสร้างหนังสือ 10 หน้าพร้อมงานศิลปะที่กำหนดเองและคำบรรยายแบบอ่านออกเสียง
คุณลักษณะนี้มีวัตถุประสงค์เพื่อให้การสร้างเนื้อหาที่ขับเคลื่อนด้วย AI เข้าถึงได้ง่ายขึ้นและเป็นส่วนตัว มันสามารถดึงแรงบันดาลใจจากภาพถ่ายส่วนตัวหรือภาพวาดของเด็ก ๆ อย่างไรก็ตามการทดสอบก่อนหน้านี้เน้นถึงความไม่น่าเชื่อถือในปัจจุบันของเทคโนโลยีโดยผู้ใช้รายงานผลลัพธ์ที่แปลกประหลาดอย่างน่าอัศจรรย์
ความไม่แน่นอนนี้แสดงให้เห็นถึงช่องว่างระหว่างการตลาด AI ที่ขัดเงาและประสิทธิภาพในโลกแห่งความเป็นจริง ผู้ใช้รายแรกคนแรกเอ็มม่ารอ ธ แห่ง The Verge กล่าวว่า“ ฉันเจอภาพประกอบหนึ่งที่วางแขนมนุษย์ไว้บนปลาตัวหนึ่ง” การจับเอาท์พุทที่เกิดขึ้นบ่อยครั้งของแบบจำลองการกำเนิดของวันนี้ src=”https://winbuzzer.com/wp-content/uploads/2025/08/google-gemini-storybook-feature-1.jpg”>
href=”https://blog.google/products/gemini/storybooks/”target=”_ blank”> กลายเป็นผู้เขียนทันที กระบวนการนี้ออกแบบมาเพื่อความเรียบง่าย: ผู้ใช้อธิบายเรื่องราวใด ๆ ในความเป็นส่วนตัวลึก นอกเหนือจากการแจ้งข้อความเพียงแค่ข้อความผู้ใช้สามารถอัปโหลดรูปภาพของตัวเองหรือแม้กระทั่งภาพวาดของเด็กขอให้ราศีเมถุนให้นำแนวคิดภาพมาสู่ชีวิตในการเล่าเรื่องใหม่ สิ่งนี้จะเปลี่ยนคุณสมบัติจากเครื่องกำเนิดไฟฟ้าที่เรียบง่ายให้เป็นเครื่องมือในการเปลี่ยนความทรงจำและการสร้างสรรค์ส่วนบุคคลให้กลายเป็นเรื่องราวที่ไม่เหมือนใครและแบ่งปันได้
[เนื้อหาฝังตัว]
เพื่อเพิ่มการควบคุมความคิดสร้างสรรค์เพิ่มเติมแพลตฟอร์มรองรับสไตล์ศิลปะมากมาย ผู้ใช้สามารถขอภาพที่เลียนแบบทุกอย่างตั้งแต่ศิลปะพิกเซลและการ์ตูนไปจนถึงดินเหนียวโครเชต์และแม้แต่สมุดระบายสี ความยืดหยุ่นนี้มีให้บริการมากกว่า 45 ภาษาทำให้เป็นเครื่องมือสร้างสรรค์ที่สามารถเข้าถึงได้ทั่วโลก
Google กำลังส่งเสริมกรณีการใช้งานจินตนาการที่หลากหลาย บริษัท แนะนำให้พร้อมที่จะสร้างเรื่องราวเพื่ออธิบายระบบสุริยจักรวาลให้กับเด็กอายุห้าขวบหรือสอนบทเรียนเกี่ยวกับความเมตตาด้วยการทำให้ตัวละครหลักเป็นสัตว์ที่เด็กโปรดปราน นี่เป็นตำแหน่งนิทานที่ไม่แปลกใหม่ แต่เป็นเครื่องมือเนื้อหาที่เป็นส่วนตัวสำหรับครอบครัวและนักการศึกษา
การเปิดตัวนี้เป็นส่วนสำคัญของกลยุทธ์ที่กว้างขึ้นของ Google ในการฝัง AI ที่เกิดขึ้นอย่างลึกซึ้งในระบบนิเวศผลิตภัณฑ์ทั้งหมด วิธีการสะท้อนการอัปเดตที่สร้างสรรค์ล่าสุดจาก บริษัท ซึ่งมุ่งเน้นไปที่การเปลี่ยนการป้อนข้อมูลผู้ใช้แบบคงที่เป็นรูปแบบสื่อแบบไดนามิกที่มีส่วนร่วม
ตัวอย่างเช่นผู้ช่วยวิจัยโน้ตบุ๊กของ บริษัท ได้พัฒนาอย่างต่อเนื่องเมื่อเร็ว ๆ นี้เพิ่ม“ ภาพรวมวิดีโอ” ที่เปลี่ยนบันทึกการวิจัย รูปแบบนี้-จากข้อความไปจนถึงเสียงไปจนถึงวิดีโอ-แสดงให้เห็นถึงการผลักดันเชิงกลยุทธ์ที่ชัดเจนในการสร้างแพลตฟอร์มเครื่องมือ AI ของ Google สำหรับการสังเคราะห์และแบ่งปันความรู้ไม่เพียง แต่สำหรับการดึงมัน
ผีในเครื่อง: AI ที่ไม่สามารถคาดเดาได้ การสร้างภาพ AI เทคโนโลยีสำหรับพลังทั้งหมดยังคงดิ้นรนกับการเชื่อมโยงเชิงตรรกะความคงทนของวัตถุและความเข้าใจตามบริบท สิ่งนี้นำไปสู่สิ่งที่เรียกว่า”ภาพหลอน AI”หรือสิ่งประดิษฐ์ภาพซึ่งไม่ได้เป็นเพียงข้อบกพร่อง แต่เป็นอาการของความไม่แน่นอนของเทคโนโลยี Verge เปิดเผยแนวโน้มเซอร์เรียลเหล่านี้อย่างรวดเร็ว เรื่องราวหนึ่งที่สร้างขึ้นเป็นปลาที่มีแขนมนุษย์โตขึ้นอย่างลึกลับ อีกหน้าหนึ่งทำหน้าที่เกี่ยวกับซอสสปาเก็ตตี้ดูเหมือนฉากอาชญากรรมการ์ตูนในขณะที่หนึ่งในสามแสดงให้เห็นถึงแม่และลูกชายที่ดูทีวีที่กำลังเผชิญกับวิธีที่ผิด สิ่งเหล่านี้ไม่ใช่ข้อผิดพลาดเล็กน้อย แต่เป็นความล้มเหลวเชิงตรรกะที่จ้องมอง
ปัญหานั้นแพร่หลายมากจนปรากฏขึ้นในวิดีโอส่งเสริมการขายของ Google สำหรับคุณสมบัตินี้ ในฉากหนึ่งตัวละครจะแสดงให้เห็นว่า“ แตะ, แตะ, แตะ” เสียงในขณะที่ถือประแจการกระทำที่ไร้สาระที่เน้นความเข้าใจที่ตื้นเขินของ AI เกี่ยวกับวิธีการใช้วัตถุในโลกแห่งความเป็นจริง ความไม่สอดคล้องกันเหล่านี้แสดงให้เห็นว่าแม้ตัวอย่างที่รวบรวมไว้อย่างระมัดระวังไม่สามารถซ่อนข้อบกพร่องของระบบได้เสมอ
ปัญหาเหล่านี้ขยายเกินกว่าการสร้างวัตถุอย่างง่ายเพื่อความล้มเหลวของแนวคิดที่กว้างขึ้น ผู้ทดสอบระบุว่าการออกแบบตัวละครมักจะเปลี่ยนไปอย่างไม่สอดคล้องกันจากหน้าหนึ่งไปยังอีกหน้าหนึ่ง นอกจากนี้เมื่อถูกขอให้สร้างเรื่องราวตามภาพวาดแมวที่อัปโหลด AI ไม่สามารถทำซ้ำวิสัยทัศน์ทางศิลปะของผู้ใช้ได้อย่างซื่อสัตย์แทนที่จะสร้างการตีความทั่วไปของตัวเอง
ความไม่สอดคล้องกันดังกล่าวเป็นความท้าทายทั่วทั้งอุตสาหกรรม พวกเขามีความทันสมัยเทียบเท่ากับรุ่น AI รุ่นแรกที่พยายามดิ้นรนเพื่อทำให้มือมนุษย์อย่างถูกต้องมักจะเพิ่มนิ้วพิเศษ ความยากลำบากในการสร้างข้อความที่อ่านง่ายเป็นสิ่งกีดขวางที่ต่อเนื่องกันดังนั้น บริษัท ต่างๆเช่นอาลีบาบากำลังสร้างแบบจำลองพิเศษเพื่อแก้ปัญหา
เอาท์พุทที่แปลกประหลาดเหล่านี้ทำหน้าที่เป็นเครื่องเตือนความทรงจำสาธารณะที่สำคัญว่าเทคโนโลยีนี้ใช้งานได้จริงอย่างไร Generative AI เป็นระบบความน่าจะเป็นซึ่งมีทักษะเป็นพิเศษในการทำนายพิกเซลหรือคำที่เป็นไปได้มากที่สุดต่อไปตามข้อมูลการฝึกอบรมที่กว้างใหญ่ มันไม่ใช่ศิลปินที่มีความรู้สึกที่มีความเข้าใจที่แท้จริงเกี่ยวกับฟิสิกส์กายวิภาคศาสตร์หรือตรรกะการเล่าเรื่องและการสร้างสรรค์ของมันจะยังคงสะท้อนให้เห็นถึงความแปลกประหลาดที่แปลกประหลาดในหุบเขาที่แปลกประหลาดจนกระทั่งนางแบบพื้นฐานมีวิวัฒนาการมาไกลกว่านี้
ในขณะที่ Google ตั้งเป้าหมายสำหรับการอุทธรณ์ของผู้บริโภคในวงกว้างคู่แข่งกำลังแกะสลัก niches โดยการแก้ปัญหาที่เฉพาะเจาะจงและยากลำบากที่ทำให้เกิดการสร้างภาพ AI มานาน
ตัวอย่างเช่นฟลักซ์ของห้องปฏิบัติการป่าสีดำ 1 Krea นั้นได้รับการออกแบบมาโดยเฉพาะ นี่เป็นเป้าหมายที่เพิ่มขึ้นในหมู่ผู้สร้างสำหรับผลลัพธ์ที่ลึกซึ้งและน่าเชื่อถือมากขึ้น
ในทำนองเดียวกันโมเดล Qwen-Image ของอาลีบาบาจะจัดการกับอุปสรรคสำคัญอีกอย่างหนึ่ง: แสดงข้อความที่ชัดเจนภายในภาพ ความสามารถนี้เป็นสิ่งสำคัญสำหรับกรณีการใช้งานระดับมืออาชีพเช่นการสร้างโปสเตอร์หรือสื่อการตลาดโดเมนที่โมเดลส่วนใหญ่ล้มเหลว
แนวโน้มอุตสาหกรรมนี้มีความเชี่ยวชาญในการกดดันเครื่องมืออเนกประสงค์ทั่วไปเช่นนิทาน เกณฑ์มาตรฐานใหม่เพื่อความสำเร็จคือการเปลี่ยนจากการสร้างภาพเพื่อสร้างภาพ * ขวา * ที่มีความแม่นยำความน่าเชื่อถือและการควบคุมทางศิลปะ
hype, ภาพหลอนและลมพัดผ่านทางกฎหมาย ข้อมูลที่ใช้ในการฝึกอบรมโมเดลที่ทรงพลังเหล่านี้เป็นเรื่องของการอภิปรายอย่างเข้มข้นและการดำเนินคดีที่มีเดิมพันสูงสร้างความเสี่ยงที่สำคัญสำหรับนักพัฒนา
คดีความสำคัญที่ยื่นโดยดิสนีย์และสากลต่อมิดเจร์นีย์กล่าวหาว่า บริษัท ฝึกอบรม AI เกี่ยวกับตัวละครที่มีลิขสิทธิ์โดยไม่ได้รับอนุญาต ตามที่ปรึกษาทั่วไปของดิสนีย์กล่าวอย่างตรงไปตรงมาว่า“ การละเมิดลิขสิทธิ์คือการละเมิดลิขสิทธิ์และความจริงที่ว่า บริษัท A.I. ทำไม่ได้ทำให้การละเมิดน้อยลง” กรณีนี้สามารถกำหนดแบบอย่างสำหรับอุตสาหกรรมทั้งหมด
แรงเสียดทานทางกฎหมายนี้ประกอบไปด้วยการเพิ่มความสงสัยในการประเมินแบบจำลอง AI การแข่งขันเพื่อมาตรฐานอำนาจสูงสุดได้นำไปสู่การกล่าวหาว่า”การสอนสู่การทดสอบ”ในฐานะนักยุทธศาสตร์ AI Nate Jones เตือนว่า“ ช่วงเวลาที่เราตั้งค่าการปกครองลีดเดอร์บอร์ดเป็นเป้าหมายเราเสี่ยงต่อการสร้างแบบจำลองที่ยอดเยี่ยมในการออกกำลังกายเล็กน้อยและดิ้นรนเมื่อเผชิญกับความเป็นจริง”
ปัญหานั้นแพร่หลายมากจนปรากฏขึ้นในวิดีโอส่งเสริมการขายของ Google สำหรับคุณสมบัตินี้ ในฉากหนึ่งตัวละครจะแสดงให้เห็นว่า“ แตะ, แตะ, แตะ” เสียงในขณะที่ถือประแจการกระทำที่ไร้สาระที่เน้นความเข้าใจที่ตื้นเขินของ AI เกี่ยวกับวิธีการใช้วัตถุในโลกแห่งความเป็นจริง ความไม่สอดคล้องกันเหล่านี้แสดงให้เห็นว่าแม้ตัวอย่างที่รวบรวมไว้อย่างระมัดระวังไม่สามารถซ่อนข้อบกพร่องของระบบได้เสมอ
ปัญหาเหล่านี้ขยายเกินกว่าการสร้างวัตถุอย่างง่ายเพื่อความล้มเหลวของแนวคิดที่กว้างขึ้น ผู้ทดสอบระบุว่าการออกแบบตัวละครมักจะเปลี่ยนไปอย่างไม่สอดคล้องกันจากหน้าหนึ่งไปยังอีกหน้าหนึ่ง นอกจากนี้เมื่อถูกขอให้สร้างเรื่องราวตามภาพวาดแมวที่อัปโหลด AI ไม่สามารถทำซ้ำวิสัยทัศน์ทางศิลปะของผู้ใช้ได้อย่างซื่อสัตย์แทนที่จะสร้างการตีความทั่วไปของตัวเอง
ความไม่สอดคล้องกันดังกล่าวเป็นความท้าทายทั่วทั้งอุตสาหกรรม พวกเขามีความทันสมัยเทียบเท่ากับรุ่น AI รุ่นแรกที่พยายามดิ้นรนเพื่อทำให้มือมนุษย์อย่างถูกต้องมักจะเพิ่มนิ้วพิเศษ ความยากลำบากในการสร้างข้อความที่อ่านง่ายเป็นสิ่งกีดขวางที่ต่อเนื่องกันดังนั้น บริษัท ต่างๆเช่นอาลีบาบากำลังสร้างแบบจำลองพิเศษเพื่อแก้ปัญหา
เอาท์พุทที่แปลกประหลาดเหล่านี้ทำหน้าที่เป็นเครื่องเตือนความทรงจำสาธารณะที่สำคัญว่าเทคโนโลยีนี้ใช้งานได้จริงอย่างไร Generative AI เป็นระบบความน่าจะเป็นซึ่งมีทักษะเป็นพิเศษในการทำนายพิกเซลหรือคำที่เป็นไปได้มากที่สุดต่อไปตามข้อมูลการฝึกอบรมที่กว้างใหญ่ มันไม่ใช่ศิลปินที่มีความรู้สึกที่มีความเข้าใจที่แท้จริงเกี่ยวกับฟิสิกส์กายวิภาคศาสตร์หรือตรรกะการเล่าเรื่องและการสร้างสรรค์ของมันจะยังคงสะท้อนให้เห็นถึงความแปลกประหลาดที่แปลกประหลาดในหุบเขาที่แปลกประหลาดจนกระทั่งนางแบบพื้นฐานมีวิวัฒนาการมาไกลกว่านี้
ในขณะที่ Google ตั้งเป้าหมายสำหรับการอุทธรณ์ของผู้บริโภคในวงกว้างคู่แข่งกำลังแกะสลัก niches โดยการแก้ปัญหาที่เฉพาะเจาะจงและยากลำบากที่ทำให้เกิดการสร้างภาพ AI มานาน
ตัวอย่างเช่นฟลักซ์ของห้องปฏิบัติการป่าสีดำ 1 Krea นั้นได้รับการออกแบบมาโดยเฉพาะ นี่เป็นเป้าหมายที่เพิ่มขึ้นในหมู่ผู้สร้างสำหรับผลลัพธ์ที่ลึกซึ้งและน่าเชื่อถือมากขึ้น
ในทำนองเดียวกันโมเดล Qwen-Image ของอาลีบาบาจะจัดการกับอุปสรรคสำคัญอีกอย่างหนึ่ง: แสดงข้อความที่ชัดเจนภายในภาพ ความสามารถนี้เป็นสิ่งสำคัญสำหรับกรณีการใช้งานระดับมืออาชีพเช่นการสร้างโปสเตอร์หรือสื่อการตลาดโดเมนที่โมเดลส่วนใหญ่ล้มเหลว
แนวโน้มอุตสาหกรรมนี้มีความเชี่ยวชาญในการกดดันเครื่องมืออเนกประสงค์ทั่วไปเช่นนิทาน เกณฑ์มาตรฐานใหม่เพื่อความสำเร็จคือการเปลี่ยนจากการสร้างภาพเพื่อสร้างภาพ * ขวา * ที่มีความแม่นยำความน่าเชื่อถือและการควบคุมทางศิลปะ