Google ได้เปิดตัว Gemini 1.5 Pro ภายในการสมัครสมาชิก Gemini Advanced แบบชำระเงิน ซึ่งนำความสามารถใหม่ๆ มากมายมาสู่แพลตฟอร์ม การอัปเดตระหว่าง Google I/O 2024 มีกรอบเวลาบริบทที่ยาวเริ่มต้นที่ 1 ล้านโทเค็น การสร้างโค้ดที่ได้รับการปรับปรุง การใช้เหตุผลเชิงตรรกะ การสนทนาแบบหลายรอบ และความเข้าใจด้านเสียงและรูปภาพที่ได้รับการปรับปรุง
Gemini Advanced ด้วย Gemini 1.5 Pro
Gemini Advanced สามารถรองรับเอกสารขนาดใหญ่หลายฉบับได้สูงสุดถึง 1,500 หน้า หรือสรุปอีเมลได้ 100 ฉบับ ผู้ใช้สามารถอัปโหลดไฟล์ผ่าน Google Drive หรือโดยตรงจากอุปกรณ์เพื่อรับข้อมูลเชิงลึกเกี่ยวกับเอกสารที่มีความหนาแน่นสูง Google เน้นย้ำว่าไฟล์ผู้ใช้ยังคงเป็นส่วนตัวและไม่ใช้เพื่อฝึกโมเดลของตน
ฟีเจอร์ที่กำลังจะมีขึ้นจะช่วยให้ผู้ใช้อัปโหลดและทำความเข้าใจสเปรดชีตและไฟล์ข้อมูลอื่นๆ ได้ ช่วยให้วิเคราะห์และแสดงภาพที่กำหนดเองได้ ฟีเจอร์นี้จะรองรับไฟล์ Google ชีต, CSV และ Excel และคาดว่าจะเปิดตัวในอีกไม่กี่สัปดาห์ข้างหน้า
[เนื้อหาที่ฝัง]
Gemini 1.5 Pro ยังปรับปรุงความเข้าใจเกี่ยวกับรูปภาพอีกด้วย ทำให้ผู้ใช้สามารถ เพื่อถ่ายรูปอาหารและรับสูตรอาหารหรือถ่ายรูปโจทย์คณิตศาสตร์เพื่อดูคำแนะนำทีละขั้นตอน นอกจากนี้ เร็วๆ นี้ จะรองรับเนื้อหาวิดีโอหรือโค้ดเบสความยาวหนึ่งชั่วโมงที่มีมากกว่า 30,000 บรรทัด
ส่วนขยาย Gemini
Google กำลังขยาย ส่วนขยาย Gemini เพื่อรวม Google Calendar, Tasks, Keep และยูทิลิตี้อื่นๆ เช่น แอป Clock ตัวอย่างเช่น ผู้ใช้สามารถถ่ายภาพตารางเวลาที่พิมพ์ไว้และให้ Gemini สร้างกิจกรรมในปฏิทิน
ส่วนขยาย YouTube Music ซึ่งช่วยให้ผู้ใช้สามารถค้นหาเพลงโดยกล่าวถึงท่อนโปรดหรือศิลปินเด่น ก็เปิดตัวในวันนี้เช่นกัน. ส่วนขยายใหม่เหล่านี้มารวมกับส่วนขยายที่มีอยู่สำหรับ Gmail, ไดรฟ์, เอกสาร, Google Flights, โรงแรม, แผนที่ และ YouTube และพร้อมให้บริการแก่ผู้ใช้ Gemini ทั้งแบบฟรีและมีค่าใช้จ่าย
Gems ของ Gemini แบบกำหนดเอง
ในอีกไม่กี่เดือนข้างหน้า ผู้ใช้ Gemini Advanced และลูกค้าธุรกิจจะสามารถสร้าง”Gems”หรือเวอร์ชันที่กำหนดเองของ Gemini ได้ ซึ่งสามารถรองรับบทบาทต่างๆ ได้ เช่น เพื่อนในยิม ผู้ช่วยเชฟ พันธมิตรการเขียนโค้ดหรือคู่มือการเขียนเชิงสร้างสรรค์ ผู้ใช้สามารถอธิบายฟังก์ชั่นและบุคลิกภาพของ Gem ที่ต้องการได้ และ Gemini จะสร้างมันขึ้นมาตามคำแนะนำเหล่านั้น
Gem ที่สร้างไว้ล่วงหน้า เช่น Learning Coach จะมีให้สำหรับผู้ใช้ Gemini ทุกคน เพิ่มความเก่งกาจของแพลตฟอร์ม
Immersive Planner สำหรับ Gemini Advanced
Gemini Advanced เร็วๆ นี้จะมี”นักวางแผนที่สมจริง”บนเว็บ ซึ่งสามารถสร้างแบบกำหนดเอง กำหนดการเดินทางตามเวลา เครื่องมือวางแผนนี้จะรวมข้อมูลเที่ยวบินจาก Gmail คำแนะนำในท้องถิ่นจาก Google Maps และกิจกรรมอื่น ๆ โดยนำเสนอใน UI แบบไดนามิกเพื่อให้แก้ไขได้ง่าย
การอัปเดตสำหรับนักพัฒนา: Gemini 1.5 Flash และ Gemma 2
Google ยังได้เปิดตัว Gemini 1.5 Flash ซึ่งเป็น AI ต่อเนื่องหลายรูปแบบที่รวดเร็วและหลากหลายที่สุด แบบอย่าง. ด้วยหน้าต่างบริบท 1 ล้านหน้าต่างเดียวกัน ได้รับการออกแบบมาเพื่อเวลาแฝงต่ำและกรณีการใช้งานที่คุ้มต้นทุน เช่น การสรุป แอปพลิเคชันแชท และการดึงข้อมูล Flash ใช้งานร่วมกับรุ่นอื่นๆ เช่น Gemini Nano, Pro และ Ultra และใช้งานได้ผ่าน Gemini API ใน Google AI Studio
Google ยังแสดงตัวอย่างหน้าต่างบริบท 2 ล้านหน้าต่างสำหรับ Gemini 1.5 Pro และได้เพิ่มฟีเจอร์ต่างๆ เช่น การเรียกฟังก์ชันแบบขนาน และการแยกเฟรมวิดีโอเนทิฟ ความสามารถในการแคชบริบทจะพร้อมใช้งานเร็วๆ นี้ ซึ่งเหมาะสำหรับสถานการณ์ต่างๆ เช่น การระดมความคิดเกี่ยวกับเนื้อหาหรือการวิเคราะห์เอกสารที่ซับซ้อน
นอกจากนี้ Google ยังล้อเลียน Gemma 2 ซึ่งเป็นโมเดลพารามิเตอร์ 27B ที่มีประสิทธิภาพเหนือกว่าโมเดลขนาดใหญ่และทำงานบน TPUv5e เดียว และ PliGemma ซึ่งเป็นโมเดลภาษาการมองเห็น (VLM) ที่มีความอเนกประสงค์และมีน้ำหนักเบา บริษัทยังได้ประกาศ TPU รุ่นที่ 6 “Trillium” ซึ่ง มอบประสิทธิภาพการประมวลผลสูงสุดต่อชิปเพิ่มขึ้นอย่างมากเมื่อเทียบกับ TPU v5e
การสมัครสมาชิกและความพร้อมใช้งาน
การสมัครสมาชิก Gemini Advanced ซึ่งมีค่าใช้จ่าย $20 ต่อเดือนด้วย ขณะนี้ทดลองใช้งานฟรี 2 เดือนได้ในกว่า 35 ภาษาและ 150 ประเทศ Google วางแผนที่จะมอบโทเค็น 2 ล้านโทเค็นให้กับ Gemini Advanced ในปลายปีนี้ ซึ่งจะช่วยเพิ่มความสามารถในการจัดการไฟล์ขนาดใหญ่และงานที่ซับซ้อนมากขึ้น