Google กำลังรวบรวมปรัชญา“ น้อยกว่านั้นมากขึ้น” ด้วยการเปิดตัว AI ล่าสุดโดยเปิดตัว Gemma 3 270M เปิดรุ่นที่มีประสิทธิภาพสูง ด้วยพารามิเตอร์เพียง 270 ล้านพารามิเตอร์โมเดลขนาดกะทัดรัดนี้ได้รับการออกแบบทางวิศวกรรมสำหรับนักพัฒนาเพื่อสร้างแอปพลิเคชั่นพิเศษที่ปรับจูนซึ่งสามารถทำงานได้โดยตรงบนอุปกรณ์เช่นสมาร์ทโฟนหรือแม้กระทั่งภายในเว็บเบราว์เซอร์
เป้าหมายคือการเปิดใช้งานคลาสใหม่ที่รวดเร็ว แทนที่จะพึ่งพาระบบคลาวด์ขนาดใหญ่ Gemma 3 270m มุ่งเน้นไปที่ประสิทธิภาพการใช้พลังงานที่รุนแรงสำหรับงานที่กำหนดไว้อย่างดีทำให้ AI ขั้นสูงสามารถเข้าถึงได้มากขึ้นสำหรับการคำนวณบนอุปกรณ์และขอบ
การเปิดตัว Gemma 3 270M เป็นล่าสุด target=”_ blank”> ขยาย”gemmaverse”ของโมเดลเปิด มันเป็นไปตามการเปิดตัวครั้งแรกของ Gemma 3 Series ในเดือนมีนาคมการเปิดตัวรุ่น QAT สำหรับ GPU ผู้บริโภคในเดือนเมษายนและการเปิดตัว Gemma แรกมือถือ 3N ในเดือนมิถุนายน
>>>
กลยุทธ์นี้สอดคล้องกับการเปลี่ยนอุตสาหกรรมที่กว้างขึ้นไปสู่รูปแบบภาษาขนาดเล็ก (SLMS) บริษัท อย่าง Microsoft ที่มีซีรี่ส์ PHI, Mistral AI ที่มีโมเดลขนาดเล็กขนาดเล็กและกอดใบหน้าด้วยรุ่น Smolvlm ล้วน แต่ลงทุนอย่างหนักใน AI ที่มีประสิทธิภาพ
การเปิดตัวแสดงถึงการหมุนเชิงกลยุทธ์ในการแข่งขัน AI AI โดยจัดลำดับความสำคัญของการผ่าตัด มันเป็นการตอกย้ำแนวโน้มอุตสาหกรรมที่กำลังเติบโตซึ่งโมเดลที่มีขนาดเล็กกว่าและพิเศษกำลังกลายเป็นเครื่องมือที่จำเป็นสำหรับการปรับใช้ในโลกแห่งความเป็นจริง
“ เครื่องมือที่เหมาะสมสำหรับงาน” ปรัชญา
href=”https://developers.googleblog.com/en/introducing-gemma-3-270m”target=”_ blank”> Google กำลังวางตำแหน่ง Gemma 3 270m ไม่ใช่คู่แข่งที่มีขนาดใหญ่ การประกาศอย่างเป็นทางการของ บริษัท เรียกใช้หลักการทางวิศวกรรมคลาสสิก: คุณจะไม่ใช้ค้อนขนาดใหญ่เพื่อแขวนกรอบรูป โมเดลนี้ รวบรวม”เครื่องมือที่เหมาะสมสำหรับงาน”ฟังก์ชั่นที่กำหนดไว้อย่างดีซึ่งความเร็วและความคุ้มค่าเป็นสิ่งสำคัญยิ่ง Google ระบุกรณีการใช้งานในอุดมคติเช่นการวิเคราะห์ความเชื่อมั่นการสกัดเอนทิตีการกำหนดเส้นทางแบบสอบถามการเขียนเชิงสร้างสรรค์การตรวจสอบการปฏิบัติตามกฎระเบียบและการแปลงข้อความที่ไม่มีโครงสร้างเป็นข้อมูลที่มีโครงสร้าง เป้าหมายคือการเพิ่มขีดความสามารถให้กับนักพัฒนาในการสร้างและปรับใช้โมเดลที่กำหนดเองหลายแบบแต่ละแบบที่ได้รับการฝึกฝนอย่างเชี่ยวชาญสำหรับงานที่แตกต่างโดยไม่มีค่าใช้จ่ายที่ต้องห้ามที่เกี่ยวข้องกับระบบที่มีขนาดใหญ่กว่า
พลังของวิธีการพิเศษนี้ได้แสดงให้เห็นแล้วในโลกแห่งความเป็นจริง Google เน้นการทำงานของ Adaptive ML ด้วย SK Telecom ซึ่งเป็นแบบจำลอง Gemma ที่ได้รับการปรับแต่งอย่างละเอียดได้รับมอบหมายให้มีการควบคุมเนื้อหาที่หลากหลายและหลากหลาย ผลลัพธ์เป็นผลงาน: โมเดลพิเศษไม่เพียง แต่ได้พบกัน แต่มีประสิทธิภาพสูงกว่าระบบที่มีขนาดใหญ่กว่ามากในงานที่เฉพาะเจาะจง เรื่องราวความสำเร็จนี้ทำหน้าที่เป็นพิมพ์เขียวที่ใช้งานได้จริงสำหรับวิธีที่นักพัฒนาสามารถใช้ประโยชน์จากประสิทธิภาพของ Gemma 3 270m
โดยเริ่มต้นด้วยฐานขนาดกะทัดรัดและมีความสามารถนักพัฒนาสามารถสร้างระบบการผลิตที่เร็วขึ้นและถูกกว่าอย่างมาก กลยุทธ์นี้มีเป้าหมายโดยตรงกับความต้องการที่เพิ่มขึ้นสำหรับ AI ที่มีประสิทธิภาพซึ่งสามารถปรับใช้ได้ในระดับโดยไม่ต้องเสียค่าใช้จ่ายในการอนุมานขนาดใหญ่ ขนาดเล็กของโมเดลช่วยให้การวนซ้ำอย่างรวดเร็วทำให้การทดลองปรับแต่งเสร็จสมบูรณ์ในเวลาไม่กี่ชั่วโมง สำหรับบทบาทที่มีความเชี่ยวชาญสูงบางอย่างเช่นเกมสวมบทบาท NPCs หรือบ็อตการจดบันทึกที่กำหนดเองความสามารถของโมเดลในการ“ ลืม” ความรู้ทั่วไปผ่านการ overfitting กลายเป็นคุณสมบัติทำให้มั่นใจได้ว่ามันจะเน้นไปที่การทำงานที่กำหนดด้วยเลเซอร์ Punch ซึ่งเป็นผลมาจากการแลกเปลี่ยนสถาปัตยกรรมโดยเจตนา พารามิเตอร์ 270 ล้านตัวของโมเดลนั้นมีการกระจายอย่างไม่เป็นทางการ: มี 170 ล้านคนที่อุทิศให้กับชั้นการฝังของมันเหลือเพียง 100 ล้านสำหรับบล็อกหม้อแปลงหลัก ตัวเลือกการออกแบบนี้ช่วยให้คุณลักษณะที่โดดเด่นของโมเดลได้โดยตรง: คำศัพท์ขนาดใหญ่ 256,000 Token
คำศัพท์ขนาดใหญ่นี้เป็นกุญแจสำคัญในความกล้าหาญที่มีความเชี่ยวชาญ ช่วยให้แบบจำลองสามารถจัดการโทเค็นที่หายากและเฉพาะเจาะจงและมีความซื่อสัตย์สูงทำให้เป็นรากฐานที่แข็งแกร่งเป็นพิเศษสำหรับการปรับจูนในโดเมนเฉพาะเช่นกฎหมายยาหรือการเงิน โดยการทำความเข้าใจศัพท์แสงเฉพาะอุตสาหกรรมตั้งแต่เริ่มต้นมันต้องใช้ข้อมูลการฝึกอบรมน้อยลงเพื่อเป็นผู้เชี่ยวชาญ สิ่งนี้ได้รับการเสริมด้วยหน้าต่างบริบท 32K ที่น่านับถือซึ่งช่วยให้สามารถประมวลผลคำแจ้งและเอกสารที่สำคัญ
เพื่อให้แน่ใจว่าการใช้งานทันที Google กำลังปล่อยจุดตรวจสอบทั้งที่ผ่านการฝึกอบรมล่วงหน้าและได้รับการฝึกอบรม บริษัท มีความชัดเจนว่า Gemma 3 270m ไม่ได้ออกแบบมาสำหรับกรณีการใช้งานที่ซับซ้อนและเปิดกว้างเช่น chatbot แต่เวอร์ชันที่ปรับแต่งคำสั่งนั้นได้รับการออกแบบมาเพื่อทำตามพรอมต์และคำสั่งที่มีโครงสร้างอย่างมีประสิทธิภาพออกจากกล่องซึ่งเป็นฐานที่เชื่อถือได้สำหรับการปรับแต่งเพิ่มเติม
การออกแบบที่แข็งแกร่งนี้ได้รับการตรวจสอบโดยประสิทธิภาพของมาตรฐานอุตสาหกรรม ในการทดสอบ IFEVAL ซึ่งวัดความสามารถของแบบจำลองในการปฏิบัติตามคำแนะนำที่ตรวจสอบได้ Gemma 3 270M ได้คะแนน 51.2 เปอร์เซ็นต์ คะแนนนี้สูงกว่ารุ่นที่มีน้ำหนักเบาอื่น ๆ ที่มีพารามิเตอร์มากขึ้นแสดงให้เห็นว่ามันมีน้ำหนักมากกว่าน้ำหนัก ในขณะที่มันคาดการณ์ว่าจะสั้นไปกับรุ่นพารามิเตอร์พันล้าน แต่ประสิทธิภาพของมันมีการแข่งขันอย่างน่าทึ่งสำหรับขนาดเศษส่วน
ประสิทธิภาพที่รุนแรงสำหรับ AI on-device
ข้อได้เปรียบที่สำคัญของ Gemma 3 270m คือการใช้พลังงานต่ำ การทดสอบภายในของ Pixel 9 Pro แสดงให้เห็นว่ารุ่น INT4-quantized ใช้เพียง 0.75% ของแบตเตอรี่ของอุปกรณ์สำหรับการสนทนา 25 ครั้งทำให้รุ่น Gemma ที่ประหยัดพลังงานมากที่สุดของ Google จนถึงปัจจุบัน
ประสิทธิภาพสุดขั้วนี้มีความสำคัญสำหรับการใช้งานบนอุปกรณ์ที่อายุการใช้งานแบตเตอรี่ นอกจากนี้ยังช่วยให้มั่นใจได้ถึงความเป็นส่วนตัวของผู้ใช้เนื่องจากข้อมูลที่ละเอียดอ่อนสามารถประมวลผลได้โดยไม่ต้องส่งไปยังคลาวด์
เพื่ออำนวยความสะดวกในสิ่งนี้ Google ให้จุดตรวจสอบที่ได้รับการฝึกอบรมเชิงปริมาณ (QAT) สิ่งนี้ช่วยให้นักพัฒนาสามารถเรียกใช้โมเดลได้ที่ความแม่นยำ Int4 ด้วยการลดลงของประสิทธิภาพน้อยที่สุดซึ่งเป็นคุณสมบัติสำคัญสำหรับการปรับใช้กับฮาร์ดแวร์ที่มีทรัพยากรที่ จำกัด