Google ได้เปิดตัว Gemma 3N อย่างสมบูรณ์ซึ่งเป็นรุ่นปัญญาประดิษฐ์โอเพนซอร์ซรุ่นใหม่ที่ออกแบบมาเพื่อนำความสามารถหลายอย่างที่ทรงพลังโดยตรงไปยังอุปกรณ์ผู้บริโภค ในการย้ายอย่างมีนัยสำคัญในการทำให้เป็นประชาธิปไตย AI ขั้นสูงแบบจำลองเหล่านี้สามารถประมวลผลภาพเสียงและวิดีโออินพุตเพื่อสร้างข้อความในขณะที่ทำงานบนฮาร์ดแวร์ที่มีหน่วยความจำเพียง 2GB เพียง 2GB href=”https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/”target=”_ blank”> คู่มือนักพัฒนาอย่างเป็นทางการ แนะนำตระกูล”มือถือ”ของแบบจำลอง รุ่นใหม่มีให้เลือกสองขนาดหลักคือ E2B และ E4B ซึ่งใช้นวัตกรรมทางสถาปัตยกรรมเพื่อทำงานด้วยรอยเท้าหน่วยความจำที่เทียบเท่ากับรุ่นที่เล็กกว่ามาก การพัฒนาประสิทธิภาพนี้หมายความว่านักพัฒนาสามารถสร้างและปรับใช้แอพพลิเคชั่น AI ที่มีความซับซ้อนและไม่สามารถใช้งานได้บนฮาร์ดแวร์ทุกวันมากมายตั้งแต่สมาร์ทโฟนไปจนถึงแล็ปท็อป
การเปิดตัวดังต่อไปนี้ดูตัวอย่างที่ Google I/O การเปิดตัวเต็มรูปแบบทำให้ Google ผลักดันให้ชุมชนนักพัฒนาซอฟต์แวร์มีเครื่องมือที่ก่อนหน้านี้เป็นโดเมนของศูนย์ข้อมูลขนาดใหญ่โดยพื้นฐานการเปลี่ยนแปลงผู้ที่สามารถสร้างด้วยการตัด AI.
matformer หรือ matryoshka transformer สถาปัตยกรรม สิ่งนี้ช่วยให้นักพัฒนาสามารถปรับใช้สเปกตรัมของขนาดโมเดลที่ปรับให้เหมาะกับข้อ จำกัด ของฮาร์ดแวร์ที่เฉพาะเจาะจงโดย Google ให้ matformer lab เพื่อช่วยระบุการกำหนดค่าที่ดีที่สุด นวัตกรรมนี้ช่วยให้พารามิเตอร์ส่วนใหญ่ของโมเดลได้รับการประมวลผลบน CPU หลักของอุปกรณ์ลดปริมาณหน่วยความจำเร่งความเร็วความเร็วสูง (VRAM) อย่างมาก สถาปัตยกรรมยังใช้การแบ่งปันแคช KV ซึ่ง บริษัท อ้างว่าเพิ่มความเร็วในการประมวลผลครั้งแรกเป็นสองเท่า
[เนื้อหาที่ฝังตัว]
‘Gemmaverse’ และกลยุทธ์เปิดของ Google
Gemma 3N ไม่ใช่ผลิตภัณฑ์แบบสแตนด์อโลน กลยุทธ์ระบบนิเวศนี้ดูเหมือนจะเป็นส่วนสำคัญของวิธีการสองง่ามของ บริษัท ในการพัฒนา AI อ้างอิงจาก การสัมภาษณ์ VentureBeat กับผู้จัดการผลิตภัณฑ์ Google Priya Singh Google ไม่เห็น Gemma และ Gemini เป็นคู่แข่งและเหรียญเดียวกันสองด้าน บริษัท วิเคราะห์สิ่งที่นักพัฒนาสร้างกับ Gemma เพื่อระบุว่าจะไปที่ไหนต่อไปด้วยการวิจัย Frontier
กลยุทธ์นี้เห็นได้ชัดในความหลากหลายของโมเดลที่มีแบรนด์ Gemma ที่มีความเชี่ยวชาญในปีที่ผ่านมา เหล่านี้รวมถึง TxGemma ชุดเครื่องมือสำหรับการค้นพบยาที่สร้างขึ้นบนสถาปัตยกรรม Gemma 2 ก่อนหน้านี้และ Dolphingemma ที่มีความเชี่ยวชาญสูง หลังเป็นการทำงานร่วมกันที่ไม่เหมือนใครกับโครงการ Wild Dolphin เพื่อวิเคราะห์การบันทึกปลาโลมาหลายทศวรรษพยายามค้นหารูปแบบในการสื่อสารสัตว์-งานที่ผลักดันขอบเขตของแอปพลิเคชัน AI
มุมมองของนักพัฒนา: การเปิดตัวของผู้พัฒนา ความกระตือรือร้นในการใช้งานทันที Simon Willison นักพัฒนาอิสระยกย่องลักษณะที่ครอบคลุมของการเปิดตัวเรียกมันว่า“ Gemma 3N เป็นวันที่ครอบคลุมมากที่สุดที่ฉันเคยเห็นสำหรับรุ่นใด ๆ ” ในการทดสอบด้วยมือ รายละเอียดในบล็อกของเขา วิลลิสันเน้นการสนับสนุนในวงกว้าง ในขณะที่เขาใช้โมเดลรุ่นหนึ่งสำหรับการถอดความเสียงได้สำเร็จเขายังสังเกตเห็นนิสัยใจคอเริ่มต้นด้วยแบบจำลองที่ไม่สามารถอธิบายภาพที่เพิ่งสร้างได้อย่างถูกต้อง
เพื่อกระตุ้นการมีส่วนร่วมของชุมชนเช่นนี้ target=”_ blank”> Gemma 3n Impact Challenge การแข่งขันที่มีรางวัล $ 150,000 สำหรับนักพัฒนาที่ใช้โมเดลใหม่เพื่อสร้างผลิตภัณฑ์เพื่อประโยชน์ทางสังคม
การวัด: การแข่งขันแบบหลายรูปแบบ โมเดลมีตัวเข้ารหัสเสียงขั้นสูงขึ้นอยู่กับ โมเดลคำพูดสากล (USM) ของประสิทธิภาพและพลังงานได้ให้ผลลัพธ์ที่น่าประทับใจบนกระดานผู้นำ ตัวแปร Gemma 3N E4B ที่ใหญ่กว่านั้นเป็นรุ่นแรกภายใต้พารามิเตอร์ 10 พันล้านพารามิเตอร์เพื่อให้ได้คะแนน Lmarena มากกว่า 1,300, เกณฑ์มาตรฐานที่วัดประสิทธิภาพตามการตั้งค่าของมนุษย์
เส้นทางนี้ไปสู่การเปิดตัวครั้งแรก
โดยวิศวกรรมแบบจำลองหลายรูปแบบที่มีประสิทธิภาพซึ่งสามารถใช้ชีวิตบนอุปกรณ์ที่ผู้คนใช้ทุกวัน Google ไม่เพียง แต่ปล่อยเครื่องมือใหม่ แต่กำลังแถลงที่ชัดเจน การเคลื่อนไหวนี้ท้าทายความคิดที่ว่า AI ที่ทันสมัยจะต้องอาศัยอยู่ในคลาวด์โดยเฉพาะเพิ่มขีดความสามารถของนักพัฒนาใหม่เพื่อสร้างแอพพลิเคชั่นอัจฉริยะอัจฉริยะส่วนตัวและเข้าถึงได้
เส้นทางนี้ไปสู่การเปิดตัวครั้งแรก
โดยวิศวกรรมแบบจำลองหลายรูปแบบที่มีประสิทธิภาพซึ่งสามารถใช้ชีวิตบนอุปกรณ์ที่ผู้คนใช้ทุกวัน Google ไม่เพียง แต่ปล่อยเครื่องมือใหม่ แต่กำลังแถลงที่ชัดเจน การเคลื่อนไหวนี้ท้าทายความคิดที่ว่า AI ที่ทันสมัยจะต้องอาศัยอยู่ในคลาวด์โดยเฉพาะเพิ่มขีดความสามารถของนักพัฒนาใหม่เพื่อสร้างแอพพลิเคชั่นอัจฉริยะอัจฉริยะส่วนตัวและเข้าถึงได้