Google ได้สร้างกลยุทธ์ปัญญาประดิษฐ์ที่ทำให้ Gemini 2.5 Pro ที่ทรงพลังและโมเดลแฟลช 2.5 Flash ไปสู่ความพร้อมใช้งานทั่วไปสำหรับการใช้งานการผลิตในขณะเดียวกันก็ขยายพอร์ตโฟลิโอด้วยรุ่นใหม่ที่มีประสิทธิภาพที่มีประสิทธิภาพ บริษัท ได้จัดตั้งตระกูลผลิตภัณฑ์สามชั้นที่ชัดเจนการเคลื่อนไหวที่สำคัญที่ออกแบบมาเพื่อให้นักพัฒนามีชุดตัวเลือกที่คาดเดาได้และปรับแต่งได้ซึ่งสมดุลประสิทธิภาพความเร็วและค่าใช้จ่าย
การยกเครื่องเชิงกลยุทธ์ทำให้เกิดความชัดเจนต่อสิ่งที่ได้รับการพัฒนาอย่างรวดเร็วและทำให้เกิดความสับสน ใน โพสต์ในคำหลักบล็อกอย่างเป็นทางการของ Google “ Pareto Frontier ของต้นทุนและความเร็ว”
การสุกแก่นี้จะเน้นไปที่การลดความซับซ้อนที่สำคัญในการกำหนดราคาสำหรับ Gemini 2.5 Flash ซึ่งยกเลิกโครงสร้างตัวอย่างที่ซับซ้อนสำหรับอัตราเดียว src=”ข้อมูล: image/svg+xml; nitro-empty-id=mtyzodoxmjy4-1; base64, phn2zyb2awv3qm94psiwidagmti4mcaxnda4 IIB3AWR0AD0IMTI4MCIGAGVPZ2H0PSIXNDA4IIB4BWXUCZ0IAHR0CDOVL3D3DY53MY5VCMCVMJAWMC9ZDMCIPJWVC3ZNPG==”
แบบจำลองสำหรับทุกภารกิจ: โปรแฟลชและแฟลช-แลต
เอกสารทางการของ Google สำหรับนักพัฒนา ที่ด้านบน Gemini 2.5 Pro อยู่ในตำแหน่งสำหรับ’ความแม่นยำในการตอบสนองสูงสุดและประสิทธิภาพที่ล้ำสมัย’ทำให้เป็นเครื่องยนต์สำหรับการเข้ารหัสที่ซับซ้อนที่สุดการวิเคราะห์และงานตัวแทน เกณฑ์มาตรฐานภายในแสดงให้เห็นว่ามันเป็นผู้นำในโดเมนที่ยากเช่นคณิตศาสตร์และการแก้ไขรหัส
ครอบครองระดับกลางคือ Gemini 2.5 Flash ออกแบบมาเพื่อ’เวลาแฝงต่ำงานปริมาณสูงที่ต้องคิด ลำดับชั้นไม่ได้เป็นเส้นตรงอย่างเคร่งครัดเสมอไป ในความแตกต่างที่โดดเด่นจากการทดสอบของ Google เองโมเดลแฟลชที่เปิดใช้งานการคิดนั้นมีประสิทธิภาพสูงกว่ารุ่น Pro ที่ทรงพลังกว่าในเกณฑ์การดึงบริบทยาว ๆ โดยเฉพาะซึ่งแนะนำการเพิ่มประสิทธิภาพพิเศษภายในสถาปัตยกรรม
สมาชิกใหม่ล่าสุด Gemini 2.5 Flash-Lite ตอนนี้มีอยู่ในพรีวิวแล้วมันถูกอธิบายว่าเป็น’โมเดลที่ประหยัดต้นทุนมากที่สุดที่รองรับปริมาณงานสูง’สำหรับแอปพลิเคชันแบบเรียลไทม์เช่นการจำแนกข้อมูลและการสรุปในระดับ
การกำหนดราคาง่ายขึ้น ในระหว่างขั้นตอนการดูตัวอย่างซึ่งเริ่มขึ้นในเดือนเมษายนแบบจำลองนี้มีระบบการกำหนดราคาคู่ที่สับสนโดยพิจารณาจากคุณสมบัติการใช้เหตุผลหรือไม่ ตอนนี้ Google ได้กำจัดความซับซ้อนนั้นการตั้งค่าโทเค็นอินพุต 0.30 ดอลลาร์ต่อล้านและ $ 2.50 ต่อล้านโทเค็นเอาท์พุท
บริษัท อธิบายการปรับเปลี่ยนเป็นภาพสะท้อนที่เฉพาะเจาะจงของค่าใช้จ่ายที่ยอดเยี่ยมของโมเดล โครงสร้างการกำหนดราคาได้รับการชี้แจงเพิ่มเติมโดย Gemini API ‘Free Tier’ การให้เหตุผล AI ที่สามารถควบคุมได้
ศูนย์กลางของทั้ง 2.5 ตระกูลคือแนวคิดของ’การใช้เหตุผลแบบผสมผสาน’คุณสมบัติที่สามารถควบคุมได้ซึ่งช่วยให้โมเดลสามารถตรวจสอบเชิงตรรกะที่ลึกกว่าหลายขั้นตอนก่อนที่จะตอบสนอง นี่เป็นมากกว่าการสลับง่าย ๆ นักพัฒนาสามารถ ตั้งค่างบประมาณการคิด’ เพื่อควบคุมทรัพยากรการคำนวณ คุณลักษณะนี้ได้รับการแนะนำครั้งแรกด้วยการดูตัวอย่าง 2.5 แฟลชที่ขยายไปยัง Gemini 2.5 Pro ในเดือนพฤษภาคมเป็นส่วนสำคัญของสถาปัตยกรรมของครอบครัว ผลกระทบของมันเป็นสิ่งที่จับต้องได้: การเปิดใช้งาน’การคิด’บน Gemini 2.5 Flash-Lite ยกตัวอย่างเช่นเพิ่มคะแนนตามมาตรฐานคณิตศาสตร์ที่สำคัญจาก 49.8% เป็น 63.1% ทำให้นักพัฒนาซอฟต์แวร์เพิ่มความแม่นยำเมื่อจำเป็น