Google ได้สร้างกลยุทธ์ปัญญาประดิษฐ์ที่ทำให้ Gemini 2.5 Pro ที่ทรงพลังและโมเดลแฟลช 2.5 Flash ไปสู่ความพร้อมใช้งานทั่วไปสำหรับการใช้งานการผลิตในขณะเดียวกันก็ขยายพอร์ตโฟลิโอด้วยรุ่นใหม่ที่มีประสิทธิภาพที่มีประสิทธิภาพ บริษัท ได้จัดตั้งตระกูลผลิตภัณฑ์สามชั้นที่ชัดเจนการเคลื่อนไหวที่สำคัญที่ออกแบบมาเพื่อให้นักพัฒนามีชุดตัวเลือกที่คาดเดาได้และปรับแต่งได้ซึ่งสมดุลประสิทธิภาพความเร็วและค่าใช้จ่าย

การยกเครื่องเชิงกลยุทธ์ทำให้เกิดความชัดเจนต่อสิ่งที่ได้รับการพัฒนาอย่างรวดเร็วและทำให้เกิดความสับสน ใน โพสต์ในคำหลักบล็อกอย่างเป็นทางการของ Google “ Pareto Frontier ของต้นทุนและความเร็ว”

การสุกแก่นี้จะเน้นไปที่การลดความซับซ้อนที่สำคัญในการกำหนดราคาสำหรับ Gemini 2.5 Flash ซึ่งยกเลิกโครงสร้างตัวอย่างที่ซับซ้อนสำหรับอัตราเดียว src=”ข้อมูล: image/svg+xml; nitro-empty-id=mtyzodoxmjy4-1; base64, phn2zyb2awv3qm94psiwidagmti4mcaxnda4 IIB3AWR0AD0IMTI4MCIGAGVPZ2H0PSIXNDA4IIB4BWXUCZ0IAHR0CDOVL3D3DY53MY5VCMCVMJAWMC9ZDMCIPJWVC3ZNPG==”

แบบจำลองสำหรับทุกภารกิจ: โปรแฟลชและแฟลช-แลต

เอกสารทางการของ Google สำหรับนักพัฒนา ที่ด้านบน Gemini 2.5 Pro อยู่ในตำแหน่งสำหรับ’ความแม่นยำในการตอบสนองสูงสุดและประสิทธิภาพที่ล้ำสมัย’ทำให้เป็นเครื่องยนต์สำหรับการเข้ารหัสที่ซับซ้อนที่สุดการวิเคราะห์และงานตัวแทน เกณฑ์มาตรฐานภายในแสดงให้เห็นว่ามันเป็นผู้นำในโดเมนที่ยากเช่นคณิตศาสตร์และการแก้ไขรหัส

ครอบครองระดับกลางคือ Gemini 2.5 Flash ออกแบบมาเพื่อ’เวลาแฝงต่ำงานปริมาณสูงที่ต้องคิด ลำดับชั้นไม่ได้เป็นเส้นตรงอย่างเคร่งครัดเสมอไป ในความแตกต่างที่โดดเด่นจากการทดสอบของ Google เองโมเดลแฟลชที่เปิดใช้งานการคิดนั้นมีประสิทธิภาพสูงกว่ารุ่น Pro ที่ทรงพลังกว่าในเกณฑ์การดึงบริบทยาว ๆ โดยเฉพาะซึ่งแนะนำการเพิ่มประสิทธิภาพพิเศษภายในสถาปัตยกรรม

สมาชิกใหม่ล่าสุด Gemini 2.5 Flash-Lite ตอนนี้มีอยู่ในพรีวิวแล้วมันถูกอธิบายว่าเป็น’โมเดลที่ประหยัดต้นทุนมากที่สุดที่รองรับปริมาณงานสูง’สำหรับแอปพลิเคชันแบบเรียลไทม์เช่นการจำแนกข้อมูลและการสรุปในระดับ

การกำหนดราคาง่ายขึ้น ในระหว่างขั้นตอนการดูตัวอย่างซึ่งเริ่มขึ้นในเดือนเมษายนแบบจำลองนี้มีระบบการกำหนดราคาคู่ที่สับสนโดยพิจารณาจากคุณสมบัติการใช้เหตุผลหรือไม่ ตอนนี้ Google ได้กำจัดความซับซ้อนนั้นการตั้งค่าโทเค็นอินพุต 0.30 ดอลลาร์ต่อล้านและ $ 2.50 ต่อล้านโทเค็นเอาท์พุท

บริษัท อธิบายการปรับเปลี่ยนเป็นภาพสะท้อนที่เฉพาะเจาะจงของค่าใช้จ่ายที่ยอดเยี่ยมของโมเดล โครงสร้างการกำหนดราคาได้รับการชี้แจงเพิ่มเติมโดย Gemini API ‘Free Tier’ การให้เหตุผล AI ที่สามารถควบคุมได้

ศูนย์กลางของทั้ง 2.5 ตระกูลคือแนวคิดของ’การใช้เหตุผลแบบผสมผสาน’คุณสมบัติที่สามารถควบคุมได้ซึ่งช่วยให้โมเดลสามารถตรวจสอบเชิงตรรกะที่ลึกกว่าหลายขั้นตอนก่อนที่จะตอบสนอง นี่เป็นมากกว่าการสลับง่าย ๆ นักพัฒนาสามารถ ตั้งค่างบประมาณการคิด’ เพื่อควบคุมทรัพยากรการคำนวณ คุณลักษณะนี้ได้รับการแนะนำครั้งแรกด้วยการดูตัวอย่าง 2.5 แฟลชที่ขยายไปยัง Gemini 2.5 Pro ในเดือนพฤษภาคมเป็นส่วนสำคัญของสถาปัตยกรรมของครอบครัว ผลกระทบของมันเป็นสิ่งที่จับต้องได้: การเปิดใช้งาน’การคิด’บน Gemini 2.5 Flash-Lite ยกตัวอย่างเช่นเพิ่มคะแนนตามมาตรฐานคณิตศาสตร์ที่สำคัญจาก 49.8% เป็น 63.1% ทำให้นักพัฒนาซอฟต์แวร์เพิ่มความแม่นยำเมื่อจำเป็น

บรรยากาศรอบการเปิดตัวครั้งแรกของซีรีย์ Gemini 2.5 ในช่วงปลายเดือนมีนาคม Google ได้ผลักดันรุ่นทดลอง 2.5 Pro ให้กับผู้ใช้ฟรีทุกคนเพียงไม่กี่วันหลังจากการเปิดตัวพิเศษเพื่อจ่ายสมาชิก บัญชีโซเชียลมีเดียของ บริษัท ที่ประกาศในเวลานั้น“ ทีมกำลังวิ่ง TPU กำลังร้อนแรงและเราต้องการให้แบบจำลองที่ชาญฉลาดที่สุดของเราเข้ามาในมือของผู้คนมากขึ้นโดยเร็วที่สุด”

การปรับใช้อย่างรวดเร็วนั้นได้พบกับการวิจารณ์จากผู้เชี่ยวชาญด้านการปกครอง AI Kevin Bankston จากศูนย์ประชาธิปไตยและเทคโนโลยีอธิบายไว้ในเวลานั้นเป็นส่วนหนึ่งของ“ เรื่องราวที่น่าเป็นห่วงของการแข่งขันที่ด้านล่างของความปลอดภัยและความโปร่งใสของ AI เนื่องจาก บริษัท ต่างๆรีบเร่งไปตลาด”

การประกาศในวันนี้ ตามที่ระบุไว้ใน vertex ai notes release สถานะนี้หมายถึงโมเดลที่มีเสถียรภาพ การเปลี่ยนจากการวิ่งทดลองไปเป็นครอบครัวผลิตภัณฑ์ที่มีความมั่นคงชั้นและราคาคาดการณ์ได้แสดงให้เห็นว่า Google กำลังสร้างรากฐานที่ทนทานยิ่งขึ้นสำหรับความทะเยอทะยาน AI ที่กว้าง

Categories: IT Info