Google DeepMind ได้แนะนำ Gemini Robotics และ Gemini Robotics-er โมเดล AI ขั้นสูงสองรุ่นที่พัฒนาขึ้นเพื่อปรับปรุงวิธีการที่หุ่นยนต์เรียนรู้และปรับให้เข้ากับงานทางกายภาพกับการฝึกอบรมก่อนหน้านี้น้อยที่สุด
สร้างขึ้นบนสถาปัตยกรรม Robot 2.0 การเปิดตัวของพวกเขาสะท้อนให้เห็นถึงการมุ่งเน้นที่เพิ่มขึ้นของความสามารถในการปฏิสัมพันธ์ในโลกแห่งความเป็นจริงในภาคการพัฒนา AI Models.
การเปิดใช้งานการปรับตัวด้วย AI Multimodal
Gemini Robotics รวมการจดจำภาพ ความสูง=”352″src=”data: image/svg+xml; nitro-empty-id=mtcxntoymduy-1; base64, phn2zyb2awv3qm94psiwidagmtayncaznt iiihdpzhropsixmdi0iibozwlnahq9ijm1miigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>>
โมเดลใช้วิธีการเรียนรู้แบบไม่มีการยิงและไม่กี่ครั้งทำให้หุ่นยนต์สามารถจัดการงานได้โดยไม่ต้องฝึกอบรมมาก่อนหรือปรับตัวได้อย่างรวดเร็วจากตัวอย่างน้อยที่สุด วิธีการนี้สามารถช่วยอุตสาหกรรมเช่นการผลิตและโลจิสติกส์โดยการลดรอบการฝึกอบรมและอำนวยความสะดวกในการปรับใช้ระบบหุ่นยนต์ได้เร็วขึ้น
Gemini Robotics-er สร้างขึ้นตามความสามารถเหล่านี้โดยการเพิ่มการใช้เหตุผลเชิงพื้นที่และทางโลก หุ่นยนต์ที่ใช้โมเดลนี้สามารถวิเคราะห์สภาพแวดล้อม 3 มิติทำนายวิถีวัตถุและเข้าใจว่าวัตถุมีปฏิสัมพันธ์ภายในพื้นที่อย่างไร
ผลลัพธ์คือระบบที่สามารถปรับให้เข้ากับสถานการณ์ที่ไม่สามารถคาดเดาได้ อยู่ในความสามารถในการปรับตัวในบริบทการดำเนินงานที่หลากหลาย หุ่นยนต์ที่ใช้โมเดลเหล่านี้สามารถเปลี่ยนระหว่างงานหรือปรับให้เข้ากับสภาพแวดล้อมใหม่ที่มีการเขียนโปรแกรมใหม่น้อยที่สุด
ตัวอย่างเช่นหุ่นยนต์ที่ได้รับการกำหนดค่าสำหรับการประกอบผลิตภัณฑ์สามารถปรับให้เข้ากับการประกอบสายผลิตภัณฑ์ที่แตกต่างกันลดค่าใช้จ่ายในการพัฒนา ความสามารถข้ามแพลตฟอร์มนี้ทำให้กระบวนการปรับขนาดของ บริษัท ที่รวมหุ่นยนต์ขั้นสูงเข้ากับการดำเนินงานของพวกเขาได้ง่ายขึ้นการจัดการกับความท้าทายภายในเวิร์กโฟลว์ระบบอัตโนมัติโดยตรง
ในเดือนธันวาคม 2567 มหาวิทยาลัย Carnegie Mellon ได้เปิดตัว Genesis AI Simulator ซึ่งเร่งการฝึกอบรมหุ่นยนต์โดยการสร้างแบบจำลองที่ซับซ้อนได้เร็วกว่าเงื่อนไขในโลกแห่งความเป็นจริงถึง 81 เท่า (ที่มา: Genesis gitHub หน้า )
Genesis ช่วยให้การสร้างสถานการณ์แบบไดนามิกจากข้อความที่มีความเสี่ยงต่ำ การตอบสนองและการปรับตัว การดำเนินงานทั้งหมดบน GPU แบบฝังตัว Helix ช่วยให้หุ่นยนต์เข้าใจคำสั่งเสียงปรับให้เข้ากับวัตถุที่ไม่คุ้นเคยและทำงานร่วมกันแบบเรียลไทม์โดยไม่ต้องอาศัยระบบคลาวด์
[เนื้อหาฝังตัว]
Microsoft ในเดือนกุมภาพันธ์ประกาศรุ่น Magma AI โดยมุ่งเน้นไปที่การเชื่อมโยงซอฟต์แวร์อัตโนมัติด้วยหุ่นยนต์ แมกมารวมข้อมูลวิสัยทัศน์ภาษาและแอ็คชั่นเพื่อทำให้เวิร์กโฟลว์อัตโนมัติในสภาพแวดล้อมอุตสาหกรรมและองค์กรเพิ่มความสามารถในการปรับตัวและลดความซับซ้อนในการปฏิบัติงาน
ใช้งาน ตัวอย่างกรณีสำหรับแมกมา AI (ที่มา: Microsoft)
ในขณะเดียวกัน Meta ได้มุ่งเน้นไปที่การจัดหาเทคโนโลยี AI พื้นฐาน ในช่วงต้นเดือนกุมภาพันธ์ บริษัท ได้เปิดตัว Meta Motivo AI Model ซึ่งออกแบบมาเพื่อปรับปรุงความแม่นยำและการเคลื่อนไหวที่เหมือนจริงในหุ่นยนต์ วิธีการของ Meta สนับสนุนผู้ผลิตบุคคลที่สามในการสร้างระบบหุ่นยนต์ขั้นสูง
ภาพหน้าจอ จากการจำลองการจำลอง Meta Motivo Interactive
การจำลองการขับเคลื่อนการพัฒนา AI ที่เร็วขึ้น
การจำลองได้กลายเป็นองค์ประกอบสำคัญของการพัฒนา AI ทำให้สภาพแวดล้อมที่มีความเสี่ยงต่ำเพื่อปรับแต่งพฤติกรรมหุ่นยนต์ Genesis Emulator ช่วยให้นักวิจัยสามารถสร้างสถานการณ์ที่สมจริงจากการแจ้งข้อความพื้นฐานเร่งการปรับตัวของโมเดล AI เช่นหุ่นยนต์ราศีเมถุนก่อนการปรับใช้ในโลกแห่งความเป็นจริง
โดยการกำจัดกระบวนการเรียนรู้และการเรียนรู้ที่แตกต่างกัน สิ่งนี้ช่วยให้ระบบ AI สามารถเพิ่มประสิทธิภาพการกระทำของพวกเขาผ่านการจำลองซ้ำเพื่อให้มั่นใจว่าพฤติกรรมที่ดีขึ้นในสภาพโลกแห่งความเป็นจริงที่คาดเดาไม่ได้ สำหรับหุ่นยนต์ราศีเมถุนเทคนิคนี้ช่วยให้มั่นใจได้ว่าการปรับตัวและความแม่นยำในงานและสภาพแวดล้อมที่หลากหลาย
นอกเหนือจากวิธีการฝึกอบรมความสามารถในการประมวลผลแบบเรียลไทม์ก็กลายเป็นปัจจัยกำหนดสำหรับหุ่นยนต์ขั้นสูง รูปที่ระบบเกลียวของ AI เป็นตัวอย่างนี้โดยใช้ GPU แบบฝังตัวสำหรับการตัดสินใจในท้องถิ่นลดเวลาแฝงและเปิดใช้งานการตอบสนองทันที สิ่งนี้มีความสำคัญอย่างยิ่งในอุตสาหกรรมเช่นโลจิสติกส์ที่การปรับตัวอย่างรวดเร็วเป็นสิ่งจำเป็นสำหรับประสิทธิภาพการปฏิบัติงาน
หุ่นยนต์ราศีเมถุนของ DeepMind มีการใช้เหตุผลที่เป็นตัวเป็นตนเพื่อเปิดใช้งานการตัดสินใจบริบท สิ่งนี้ช่วยให้หุ่นยนต์ปรับพฤติกรรมของพวกเขาตามข้อมูลสิ่งแวดล้อมแบบเรียลไทม์ลดความต้องการคำแนะนำที่กำหนดไว้ล่วงหน้า
การปรับตัวดังกล่าวเป็นสิ่งจำเป็นสำหรับการปรับใช้ในสภาพแวดล้อมแบบไดนามิกที่ความยืดหยุ่นเป็นข้อได้เปรียบในการแข่งขัน