Amazon ได้ก้าวไปข้างหน้าเชิงกลยุทธ์ด้วยการแนะนำพระราชบัญญัติ Nova Act SDK และเปิดตัว nova.amazon.com เพื่อให้ประชาชนเข้าถึงโมเดลมูลนิธิโนวา สิ่งนี้ส่งสัญญาณการเปลี่ยนแปลงในกลยุทธ์ AI ของ บริษัท-จากการดำเนินงานในฐานะพันธมิตรโครงสร้างพื้นฐานคลาวด์ไปจนถึงการจัดเตรียมเครื่องมือนักพัฒนาซอฟต์แวร์ในการสร้างตัวแทน AI ที่สามารถแสดงภายในเว็บเบราว์เซอร์ได้โดยตรง
Nova Act SDK สำหรับ AI Agents สภาพแวดล้อมของเบราว์เซอร์ ตัวแทนเหล่านี้สามารถคลิกปุ่มกรอกแบบฟอร์มหน้าเลื่อนและโต้ตอบกับองค์ประกอบของไซต์ที่ซับซ้อนทั้งหมดผ่านการทำความเข้าใจด้วยภาพและการโต้ตอบแบบไดนามิก แทนที่จะเสนอตัวแทนที่เสร็จแล้วอเมซอนกำลังให้ฐานที่ยืดหยุ่นแก่นักพัฒนาเพื่อสร้างเครื่องมือของตัวเอง
Google ในการเปรียบเทียบได้พัฒนาเฟรมเวิร์กสายโซ่ของตัวแทนที่ออกแบบมาเพื่อประสานงานตัวแทน AI หลายตัวผ่านหน่วยความจำที่ใช้ร่วมกันและการสื่อสารแบบแยกส่วน พระราชบัญญัติ Nova ของ Amazon ดูเหมือนจะใช้เส้นทางที่เปิดกว้างมากขึ้นโดยให้การควบคุมที่ลึกซึ้งยิ่งขึ้น src=”ข้อมูล: image/svg+xml; nitro-empty-id=mty3odoyotk=-1; base64, phn2zyb2awv3qm94psiwidagntawidi4 MSIGD2LKDGG9IJUWMCIGAGVPZ2H0PSIYODEIIIHHTBG5ZPSJODHRWOI8VD3D3LNCZLM9YZY8YMDALL3N2ZYI+PC9ZDMC+”>>>
ในการสาธิตที่แชร์โดย Amazon พระราชบัญญัติ Nova แสดงให้เห็นถึงความสามารถของเบราว์เซอร์-ตัวแทนโดยการโต้ตอบโดยตรงกับ Google Maps ตัวแทนให้เหตุผลผ่านงาน-ค้นหา”สถานี Caltrain ของ Redwood City”-และพิมพ์แบบสอบถามลงในแถบค้นหาโดยจำลองการกระทำที่เหมือนมนุษย์
แหล่งที่มา: Amazon
ทางด้านซ้ายของหน้าจอตัวอย่างโค้ดกำหนดคลาส Bikeroute โดยแนะนำว่าตัวแทนจะใช้เวลาและระยะทางของการขี่จักรยานเป็นข้อ จำกัด ในการกรองรายชื่ออพาร์ทเมนต์ สถานการณ์นี้แสดงให้เห็นว่าการกระทำของโนวาสามารถตีความเป้าหมายของผู้ใช้และนำทางอินเตอร์เฟสเว็บอย่างอิสระเพื่อให้งานหลายขั้นตอนเสร็จสมบูรณ์เช่นการวางแผนการค้นหาที่อยู่อาศัยที่มีศูนย์กลางการเดินทาง Lite และ Pro ก่อนหน้านี้ถูก จำกัด อยู่ที่ AWS Bedrock ตอนนี้รุ่นเหล่านี้สนับสนุนการแจ้งเตือนและการทดลองสาธารณะ-โดยไม่ต้องใช้การเข้าถึงคลาวด์หรือข้อมูลประจำตัวขององค์กร
[เนื้อหาที่ฝังตัว]
โนวารองรับ 200+ ภาษาและจัดการบริบทสูงสุด 300,000 โทเค็น สภาพแวดล้อมเช่นรัฐบาลการเงินและการดูแลสุขภาพ นักพัฒนายังสามารถเข้าถึงเครื่องมือสร้างภาพเช่น Nova Canvas และ Nova Reel ซึ่งสร้างภาพและวิดีโอและรวมถึงการตรวจสอบความปลอดภัยในตัวและเฟรมเวิร์กการระบุแหล่งที่มา
เครื่องมือเหล่านี้ช่วยให้นักพัฒนาสามารถติดตามเนื้อหาภาพได้อย่างไร ข้างหน้าอเมซอนกำลังเตรียมที่จะเปิดตัวรูปแบบการใช้เหตุผลที่มีตราสินค้าโนวาคาดว่าในช่วงกลางปี 2568 มีรายงานว่ารุ่นนี้จะรวมความสามารถในการสนทนาที่รวดเร็วเข้ากับการใช้เหตุผลที่ลึกซึ้งยิ่งขึ้นการลดการแบ่งแยกระหว่างการโต้ตอบแบบเรียลไทม์และการวิเคราะห์รูปแบบระยะยาว
Amazon กำลังวางตำแหน่งตัวเองอย่างชัดเจนเพื่อแข่งขันกับระบบการให้เหตุผลที่เป็นผู้ใหญ่เช่น CLAUDE 3.7 SONNET ใน Alexa+ Voice Assistant ใหม่ซึ่งให้บริการระบบอัตโนมัติที่ขับเคลื่อนด้วย AI และการประสานงานบริการที่ไร้รอยต่อ
การแข่งขันระดับโลกเน้นกลยุทธ์ตัวแทนที่แตกต่าง
ในขณะที่ Amazon มุ่งเน้นไปที่เครื่องมือ Zhipu AI ของจีนเพิ่งเปิดตัว Autoglm ซึ่งเป็นตัวแทนอิสระที่ขับเคลื่อนโดยรุ่น GLM-Z1-Air ที่มีน้ำหนักเบา
ออกแบบมาสำหรับสภาพแวดล้อมที่มีข้อ จำกัด Autoglm ทำงานในเบราว์เซอร์หรือผ่านแอพมือถือ Zhipu ยังวางแผนที่จะเปิดแหล่งที่มาของตัวแทนในเดือนเมษายนโดยเน้นการเข้าถึงสำหรับนักพัฒนาและสถาบันระดับโลกนอกพื้นที่ AI ตะวันตก
ก่อนหน้านี้ในเดือน Manus AI ได้พาดหัวข่าวสำหรับการเปิดตัวระบบอิสระที่สามารถดำเนินการได้โดยไม่ได้รับการอนุมัติจากผู้ใช้ สร้างขึ้นโดย Butterfly Effect (ฮ่องกง) ตัวแทนใช้การเรียนรู้การเสริมแรง, การผูกมัด LLM และชั้นควบคุมหลายลายเซ็นเพื่อดำเนินการเวิร์กโฟลว์และผู้รับเหมาจ้าง
หลังจากการเชิญเบต้า จำกัด ที่ถูกขายให้เต็มจำนวนเงินจำนวนหลายพันดอลลาร์ Grows
ซึ่งแตกต่างจาก บริษัท ที่มุ่งเน้นไปที่ตัวแทนส่วนหน้ากลยุทธ์ของ Amazon คือการสร้าง AI Stack ทุกชั้นตั้งแต่ซิลิคอนที่กำหนดเองไปจนถึงโมเดลพื้นฐานไปจนถึงเครื่องมือที่นักพัฒนา Nova Stack ของ บริษัท ได้รับการฝึกฝนเกี่ยวกับกลุ่มขนาดใหญ่ที่ขับเคลื่อนโดยชิป Trainium 2 และได้รับการสนับสนุนจากการลงทุนโครงสร้างพื้นฐานหลายพันล้าน ใน การสัมภาษณ์เมื่อเร็ว ๆ นี้กับเวลา , AWS CEO Matt เน้นการรวมตัวของ Amazon การปรับใช้ แต่ยังเพิ่มบาร์สำหรับการยอมรับนักพัฒนา ซึ่งแตกต่างจากตัวแทนปลั๊กแอนด์เพลย์เช่นผู้ประกอบการหรือ Autoglm พระราชบัญญัติ Nova ต้องการความพยายามมากขึ้นจากผู้ใช้ในการปรับแต่งปรับใช้และรักษาตัวแทนในระดับ
การแลกเปลี่ยนอาจ จำกัด การยึดเกาะของผู้ใช้ทั่วไป การควบคุมผู้ใช้ ด้วยวิธีการของนักพัฒนาซอฟต์แวร์ครั้งแรก บริษัท ไม่เพียงแค่เปิดใช้งานการยอมรับของ AI เท่านั้น-มันช่วยให้ผู้สร้างรุ่นใหม่ตัดสินใจว่าตัวแทนเหล่านั้นจะทำอย่างไรและพวกเขาจะทำอย่างไร