ที่การประชุมนักพัฒนาซอฟต์แวร์ Google I/O 2024 Google ได้ประกาศการรวมโมเดล Gemini Nano AI เข้ากับ ไคลเอนต์เดสก์ท็อป Chrome เริ่มต้นด้วย Chrome 126 การเคลื่อนไหวนี้มีจุดมุ่งหมายเพื่อให้นักพัฒนาสามารถใช้โมเดลบนอุปกรณ์เพื่อขับเคลื่อนคุณสมบัติ AI ของตนเอง Google วางแผนที่จะใช้ประโยชน์จากความสามารถนี้สำหรับฟีเจอร์ต่างๆ เช่น เครื่องมือ”ช่วยฉันเขียน”ใน Gmail ซึ่งเป็นส่วนหนึ่งของ Workspace Lab
Gemini Nano ของ Google เป็นส่วนหนึ่งของระบบนิเวศ Gemini ที่พัฒนาโดย Google DeepMind12 ซึ่งเป็น AI โมเดลที่ได้รับการปรับให้เหมาะสมเพื่อให้ตอบสนองอย่างรวดเร็วบนอุปกรณ์ โดยมีหรือไม่มีเครือข่ายข้อมูล และออกแบบมาเพื่อดำเนินงานต่างๆ เช่น การทำความเข้าใจรูปภาพ การถอดเสียงพูด และการสรุปข้อความ
การเพิ่มประสิทธิภาพ Chrome ด้วยความสามารถ AI
strong>
ความก้าวหน้าล่าสุดของ Google ใน WebGPU และ WebAssembly (WASM) ใน Chrome ทำให้สามารถเรียกใช้โมเดล AI เหล่านี้ได้อย่างมีประสิทธิภาพบนฮาร์ดแวร์หลากหลายประเภท Jon Dahlke ผู้อำนวยการฝ่ายจัดการผลิตภัณฑ์ของ Chrome สำหรับ Chrome กล่าวว่า บริษัทกำลังหารือกับผู้จำหน่ายเบราว์เซอร์รายอื่นเพื่อใช้คุณลักษณะที่คล้ายกัน
“เราได้เริ่มมีส่วนร่วมกับเบราว์เซอร์อื่น ๆ และจะเปิดโปรแกรมตัวอย่างล่วงหน้าสำหรับนักพัฒนา” Dahlke กล่าว “ด้วย WebGPU, WASM และ Gemini ที่สร้างไว้ใน Chrome เราเชื่อว่าเว็บพร้อมสำหรับ AI”
Google ตั้งเป้าที่จะเปิดใช้งาน API ระดับสูงจำนวนมากใน Chrome เพื่อแปล คำอธิบายภาพ และถอดเสียงข้อความ โดยใช้โมเดล Gemini “เพื่อนำเสนอฟีเจอร์นี้ เราได้ปรับแต่ง Gemini เวอร์ชันที่มีประสิทธิภาพสูงสุดและ Chrome ที่ปรับให้เหมาะสมที่สุด” Dahlke กล่าวระหว่างการปราศรัยของนักพัฒนา “วิสัยทัศน์ของเราคือการมอบโมเดล AI ที่ทรงพลังที่สุดใน Chrome ให้กับคุณเพื่อเข้าถึงผู้ใช้หลายพันล้านคนโดยไม่ต้องกังวลกับวิศวกรรมที่ฉับไว การปรับแต่ง ความจุ และต้นทุน”
[เนื้อหาที่ฝัง]
เครื่องมือสำหรับนักพัฒนาซอฟต์แวร์และคุณสมบัติใหม่
Gemini Nano ซึ่งเป็นรุ่นภาษาขนาดใหญ่น้ำหนักเบาที่เปิดตัวใน Pixel 8 Pro และ Pixel 8 รุ่นต่อมา ได้รับการปรับแต่งและเพิ่มประสิทธิภาพอย่างละเอียด สำหรับ Chrome การผสานรวมนี้ช่วยให้ผู้ใช้สามารถสร้างบทวิจารณ์ผลิตภัณฑ์ โพสต์บนโซเชียลมีเดีย และเนื้อหาอื่น ๆ ได้โดยตรงภายในเบราว์เซอร์ นอกจากนี้ Chrome ขณะนี้ DevTools Console ใช้โมเดล Gemini Nano ในตัวเพื่ออธิบายข้อผิดพลาดและมอบโซลูชันการแก้ไขข้อบกพร่อง
เปรียบเทียบกับ Microsoft Edge
การเคลื่อนไหวของ Google สะท้อนให้เห็นถึงการผสานรวมผู้ช่วย AI ของ Microsoft อย่าง Copilot เข้ากับเบราว์เซอร์ Edge เมื่อปีที่แล้ว อย่างไรก็ตาม Copilot ใน Edge ทำงานบนเซิร์ฟเวอร์บนคลาวด์ ซึ่งต่างจาก Gemini Nano ใน Chrome ที่ทำงานบนอุปกรณ์นั้น การบูรณาการ Gemini Nano เข้ากับ Chrome ถือเป็นก้าวสำคัญในการทำให้นักพัฒนาและผู้ใช้ปลายทางสามารถเข้าถึงความสามารถ AI ได้มากขึ้น ด้วยการฝัง AI ลงในเบราว์เซอร์โดยตรง Google มีเป้าหมายที่จะปรับปรุงกระบวนการพัฒนาและปรับปรุงประสบการณ์ผู้ใช้ในแอปพลิเคชันต่างๆ