Grok 4 ครองวันที่ 1 ของ AI Chess Arena ของ Google, Claude Opus 4 ล้มเหลวอย่างน่าสังเวชกับ Gemini 2.5 Pro, Deepseek แตกโดย O4-Mini

ในวันที่ 5 สิงหาคมโมเดล AI อันดับต้น ๆ จาก XAI, Google และ OpenAI ได้จัดแสดงทักษะเชิงกลยุทธ์ในการแข่งขันหมากรุกใหม่ จัดขึ้นในสนามกีฬาเกม Kaggle ใหม่ของ Google เหตุการณ์ทดสอบความสามารถในการใช้เหตุผลของ AIS ที่มีวัตถุประสงค์ทั่วไป ในวันแรก Grok 4, Gemini 2.5 Pro, O4-Mini และ O3 ล้วนขั้นสูงด้วยการกวาด 4-0

ทัวร์นาเมนต์ที่ออกแบบโดย DeepMind มีจุดมุ่งหมายเพื่อดูว่า AIS เหล่านี้จัดการกลยุทธ์ที่ซับซ้อนและเรียลไทม์ได้อย่างไร การย้ายครั้งนี้ส่งสัญญาณการเปลี่ยนแปลงจากมาตรฐานคงที่ไปสู่สภาพแวดล้อมแบบไดนามิกและการแข่งขัน มันเป็นวิธีใหม่ในการวัดความสามารถในการแก้ปัญหาของรุ่นภาษาขนาดใหญ่ชั้นนำของโลก

พื้นใหม่ที่พิสูจน์ได้สำหรับการให้เหตุผล AI

ชุมชนวิทยาศาสตร์ข้อมูลของ Google Kaggle เปิดตัว

ในขณะที่เครื่องยนต์พิเศษเช่น

Grok 4 ครองวันที่ 1 ของ AI Chess Arena ของ Google, Claude Opus 4 ล้มเหลวอย่างน่าสังเวชกับ Gemini 2.5 Pro, Deepseek แตกโดย O4-Mini

Published by All Things Windows on August 6, 2025

พื้นใหม่ที่พิสูจน์ได้สำหรับการให้เหตุผล AI

IT Info

Google เปิดตัว’Guided Learning’ในราศีเมถุนให้กับนักเรียนติวเตอร์แข่งขันกับโหมดการศึกษา Chatgpt

IT Info

วิธีรีเซ็ตการตั้งค่าไฟร์วอลล์เริ่มต้นใน Windows 11

IT Info

Microsoft รวมเกม Copilot AI เข้ากับ Windows Game Bar โดยตรงสำหรับคนในพีซี

Grok 4 ครองวันที่ 1 ของ AI Chess Arena ของ Google, Claude Opus 4 ล้มเหลวอย่างน่าสังเวชกับ Gemini 2.5 Pro, Deepseek แตกโดย O4-Mini

Published by All Things Windows on August 6, 2025

พื้นใหม่ที่พิสูจน์ได้สำหรับการให้เหตุผล AI

Related Posts

IT Info

Google เปิดตัว’Guided Learning’ในราศีเมถุนให้กับนักเรียนติวเตอร์แข่งขันกับโหมดการศึกษา Chatgpt

IT Info

วิธีรีเซ็ตการตั้งค่าไฟร์วอลล์เริ่มต้นใน Windows 11

IT Info

Microsoft รวมเกม Copilot AI เข้ากับ Windows Game Bar โดยตรงสำหรับคนในพีซี