OpenAI ได้อัปเดตโมเดล GPT-4O ปรับปรุงความสามารถในการจัดการกับการสืบค้นที่เกี่ยวข้องกับต้นกำเนิดตีความข้อมูลภาพและรวมความรู้ล่าสุดไว้ในการตอบสนอง
การอัปเดตล่าสุดขยายข้อมูลการฝึกอบรมของโมเดลตั้งแต่เดือนพฤศจิกายน 2566 ถึงมิถุนายน 2567 ทำให้สามารถประมวลผลหัวข้อปัจจุบันที่กว้างขึ้นด้วยความแม่นยำมากขึ้น นอกเหนือจากความก้าวหน้าทางเทคนิคเหล่านี้ OpenAI ได้ปรับรูปแบบการสนทนาของโมเดลโดยการเพิ่มการใช้อิโมจิในการโต้ตอบแบบไม่เป็นทางการ
ที่เกี่ยวข้อง: นักวิจัยด้านความปลอดภัย Openai Steven Adler เตือน’น่ากลัว’ความเสี่ยงในการพัฒนา AI อย่างรวดเร็ว
ตาม OpenAI โมเดลที่ได้รับการกลั่นจะให้“ ข้อมูลเชิงลึกที่สมบูรณ์ยิ่งขึ้นและคำแนะนำที่แม่นยำยิ่งขึ้น” เมื่อประเมินเนื้อหาภาพทำให้มีประสิทธิภาพมากขึ้นสำหรับผู้ใช้ที่ทำงานกับไดอะแกรมที่ซับซ้อนแผนผังเทคนิคและการสร้างภาพข้อมูล
การปรับปรุงยังช่วยเพิ่มความน่าเชื่อถือของ GPT-4O ในสาขา STEM ซึ่งเป็นพื้นที่ที่แบบจำลอง AI เผชิญกับความท้าทายในอดีตโดยเฉพาะอย่างยิ่งกับการแก้ปัญหาที่ซับซ้อน การใช้เหตุผลเชิงแนวคิดที่ดีขึ้นและความสามารถทางเทคนิค สำหรับผลลัพธ์ทางเว็บ
การปรับปรุงในความรู้ต้นกำเนิดและการให้เหตุผลเชิงตรรกะ
GPT-4O ให้การตอบสนองที่แม่นยำยิ่งขึ้นสำหรับการสอบถามทางเทคนิคในวิชาคณิตศาสตร์ฟิสิกส์วิศวกรรม และการเข้ารหัส การอัปเดตช่วยเพิ่มความสามารถของโมเดลในการประมวลผลตรรกะที่มีโครงสร้างและการคำนวณเชิงตัวเลขซึ่งเป็นพื้นที่ที่การทำซ้ำก่อนหน้านี้บางครั้งสร้างผลลัพธ์ที่ไม่ถูกต้อง
Openai เน้นการปรับปรุงเหล่านี้ในการประกาศโดยระบุว่า“ GPT-4O ตอนนี้ดีกว่าในเรื่องคณิตศาสตร์วิทยาศาสตร์และปัญหาที่เกี่ยวข้องกับการเข้ารหัสโดยได้รับผลประโยชน์จากนักวิชาการเช่น GPQA และคณิตศาสตร์ คะแนนที่ดีขึ้นของ MMLU ซึ่งเป็นมาตรฐานที่ครอบคลุมของความเข้าใจภาษาความกว้างความรู้และการให้เหตุผล-สะท้อนความสามารถในการแก้ไขปัญหาที่ซับซ้อนมากขึ้นในโดเมน”
การอัพเกรดเหล่านี้เป็นประโยชน์ต่อนักพัฒนานักวิจัยและนักเรียนที่พึ่งพา การแก้ปัญหา AI-ASSISTED โดยเฉพาะอย่างยิ่งในพื้นที่ที่ต้องการความแม่นยำเช่นแคลคูลัสขั้นสูงอัลกอริทึมการเรียนรู้ของเครื่องและการจำลองทางวิทยาศาสตร์ เป็นศูนย์กลางของฟิลด์เช่นการพัฒนาซอฟต์แวร์และฟิสิกส์เชิงทฤษฎี
ความสามารถในการใช้เหตุผลที่ได้รับการปรับปรุงให้สอดคล้องกับการทำงานอย่างต่อเนื่องของ OpenAI เกี่ยวกับวิธีการที่ใช้ความคิดซึ่งทำให้ระบบ AI สามารถทำลายปัญหาที่ซับซ้อนลงในขั้นตอนที่มีขนาดเล็กลง/p>
ในขณะที่ OpenAI ไม่ได้ระบุอย่างชัดเจนว่า GPT-4O รวมความก้าวหน้าใหม่ในการใช้เหตุผลที่มีโครงสร้างประสิทธิภาพที่ดีขึ้นของโมเดลใน GPQA และ MMLU แนะนำการปรับแต่งในการประมวลผลงานเชิงตรรกะหลายขั้นตอน การวิเคราะห์ภาพที่แม่นยำยิ่งขึ้นและความเข้าใจหลายรูปแบบ
การอัปเดตยังช่วยเพิ่มความสามารถของ GPT-4O ในการประมวลผลภาพทำให้เป็นเครื่องมือที่มีความสามารถมากขึ้นสำหรับการวิเคราะห์ความสัมพันธ์เชิงพื้นที่ตีความไดอะแกรมทางเทคนิคและการจัดหา ข้อมูลเชิงลึกที่ทราบถึงบริบทตามอินพุตภาพ
Openai รายงานว่าตอนนี้ GPT-4O อยู่ในอันดับที่สูงกว่าในการประเมินผลการประเมินแบบหลายรูปแบบเช่น Mathvista และ MMMU ซึ่งบ่งบอกถึงประสิทธิภาพที่แข็งแกร่งในการรวมการให้เหตุผลตามข้อความและการมองเห็น
OpenAI อธิบายการปรับปรุงเหล่านี้ การสังเกตว่า“ โมเดลที่ได้รับการปรับปรุงมีความเชี่ยวชาญมากขึ้นในการตีความความสัมพันธ์เชิงพื้นที่ในการอัปโหลดรูปภาพรวมถึงการวิเคราะห์ไดอะแกรมที่ซับซ้อนการทำความเข้าใจแผนภูมิและกราฟและการเชื่อมต่ออินพุตภาพกับเนื้อหาที่เป็นลายลักษณ์อักษร”
ความสามารถในการบริบทและ วิเคราะห์ข้อมูลภาพได้อย่างมีประสิทธิภาพมากขึ้นทำให้ GPT-4O มีประโยชน์สำหรับการใช้งานในด้านวิศวกรรมสถาปัตยกรรมและวิทยาศาสตร์ข้อมูลซึ่งแบบจำลอง AI จะต้องประมวลผลและตีความไดอะแกรมหรือแผนผังที่มีความแม่นยำสูง
สำหรับผู้ใช้ที่ทำงานกับภาพวาดทางเทคนิคโดยละเอียด พิมพ์เขียวหรือแผนการทางคณิตศาสตร์การปรับปรุงเหล่านี้หมายถึง ChatGPT สามารถนำเสนอข้อมูลเชิงลึกที่มีรายละเอียดเพิ่มเติมเกี่ยวกับเลย์เอาต์เชิงพื้นที่และความสัมพันธ์เชิงตัวเลขภายในข้อมูลภาพ ของภาพเช่นการวิจัยทางวิทยาศาสตร์การทำแผนที่เชิงพื้นที่และการถ่ายภาพทางการแพทย์
การปรับการสนทนาและการใช้อีโมจิที่เพิ่มขึ้น
นอกเหนือจากการอัพเกรดทางเทคนิค OpenAI ได้ปรับการปรับ รูปแบบการสนทนาของ GPT-4O โดยรวมการใช้อิโมจิเข้ากับการตอบสนองมากขึ้น บริษัท ระบุว่ารูปแบบนี้จะรวมอิโมจิในการโต้ตอบแบบไดนามิกแบบไดนามิกโดยเฉพาะอย่างยิ่งเมื่อผู้ใช้ใช้พวกเขาในข้อความของพวกเขาแล้ว
Openai ยอมรับการปรับตัวในการประกาศอธิบายว่า“ GPT-4O ตอนนี้มีความกระตือรือร้นมากขึ้นในการใช้อิโมจิ (อาจเป็นโดยเฉพาะอย่างยิ่งถ้าคุณใช้อิโมจิในการสนทนา✨)-แจ้งให้เราทราบว่าคุณอะไร คิดว่า”
บริษัท ได้สนับสนุนให้ผู้ใช้ให้ข้อเสนอแนะว่าการใช้อีโมจิเพิ่มขึ้นช่วยเพิ่มประสบการณ์การใช้งานของผู้ใช้หรือควรปรับในการอัปเดตในอนาคต
ในขณะที่การเปลี่ยนแปลงที่เกี่ยวข้องกับอิโมจิ ไม่ส่งผลกระทบต่อความสามารถในการใช้เหตุผลของโมเดลมันส่งสัญญาณแนวโน้มที่กว้างขึ้นต่อการทำให้การโต้ตอบของ AI เป็นธรรมชาติและเหมือนมนุษย์มากขึ้น ตัวเลือกการปรับแต่งสำหรับเสียงสนทนาในการทำซ้ำในอนาคต
ภูมิทัศน์การแข่งขัน: Deepseek, O3-Mini และรัฐบาล AI
การอัพเกรด GPT-4O ล่าสุดมาถึง เวลาที่ Openai เผชิญกับการแข่งขันที่เพิ่มขึ้นจากนักพัฒนา AI คู่แข่งโดยเฉพาะอย่างยิ่งในด้านประสิทธิภาพและประสิทธิภาพการใช้เหตุผล
Deepseek ซึ่งเป็น บริษัท AI ที่อยู่ในประเทศจีนเพิ่งเปิดตัวโมเดล R1 ซึ่งแสดงให้เห็นถึงผลลัพธ์ที่แข็งแกร่งในการวัดมาตรฐานในขณะที่ดำเนินงานในส่วนของทรัพยากรการคำนวณที่ใช้โดยโมเดลของ OpenAI
วิธีการที่ขับเคลื่อนด้วยประสิทธิภาพของ Deepseek ได้กระตุ้นให้เกิดการตอบสนองจากผู้นำอุตสาหกรรมรวมถึง Sam Altman CEO Openai ผู้ยอมรับการแข่งขันโดยระบุว่า“ เราจะส่งมอบแบบจำลองที่ดีกว่ามาก P>
ที่เกี่ยวข้อง: การตรวจสอบ AI-Deepseek ล้มเหลว 83% ของการทดสอบความแม่นยำเนื่องจากข้อมูลที่ผิดและการเซ็นเซอร์
นอกเหนือจากการปรับแต่ง GPT-4O ด้วยการอัปเดตล่าสุด การเตรียมการเปิดตัว O3-MINI ซึ่งเป็นแบบจำลองที่เน้นการใช้เหตุผลสำหรับความเร็วและประสิทธิภาพ
นอกเหนือจาก AI ผู้บริโภคที่หันหน้าเข้าหา OpenAI กำลังขยายการเข้าถึงภาครัฐด้วย Chatgpt Gov ซึ่งเป็นรุ่นของรุ่นที่ออกแบบมาเพื่อการใช้งานโดยหน่วยงานรัฐบาลกลางของสหรัฐอเมริกา 5 (IL5) มาตรฐานความปลอดภัยเพื่อให้มั่นใจว่าปฏิบัติตามกฎระเบียบของรัฐบาลกลาง
รูปแบบกำลังอยู่ในระหว่างกระบวนการรับรอง FedRamp ซึ่งเป็นข้อกำหนดที่สำคัญสำหรับผู้ให้บริการคลาวด์ที่ทำงานร่วมกับหน่วยงานภาครัฐของสหรัฐอเมริกา
Kevin Weil หัวหน้าเจ้าหน้าที่ผลิตภัณฑ์ของ Openai เน้นถึงผลกระทบที่อาจเกิดขึ้นจาก ChatGPT Gov ในเวิร์กโฟลว์ของภาครัฐโดยระบุว่า“ เราเห็นศักยภาพมหาศาลสำหรับเครื่องมือเหล่านี้เพื่อสนับสนุนภาครัฐในการจัดการกับความท้าทายที่ซับซ้อน”
Openai รายงานว่าพนักงานของรัฐบาลมากกว่า 90,000 คนได้ใช้เครื่องมือ AI แล้วด้วย โปรแกรมนำร่องก่อนหน้านี้แสดงให้เห็นถึงการเพิ่มผลผลิตที่วัดได้ > ด้วยคลื่นลูกต่อไปของความก้าวหน้าของ AI บนขอบฟ้า OpenAI มีแนวโน้มที่จะมุ่งเน้นไปที่การปรับขนาดโมเดลในขณะที่มั่นใจว่าความน่าเชื่อถือในแอปพลิเคชันในโลกแห่งความเป็นจริง ตลาดที่มีกลยุทธ์การเพิ่มประสิทธิภาพที่แตกต่างกัน