แชมป์หมากรุกระดับโลกของ Magnus Carlsen ได้อย่างง่ายดายเหนือ Chatgpt เมื่อวันที่ 10 กรกฎาคมแสดงให้เห็นถึงสถานะที่ขัดแย้งของอุตสาหกรรม AI ในขณะที่คาร์ลเซ่นรื้อถอน chatbot ยอดนิยมอย่างเป็นระบบ AI Labs ถูกล็อคในการต่อสู้ที่ดุเดือดเพื่ออำนาจสูงสุดโดยโน้มน้าวความสำเร็จเหนือมนุษย์

ในช่วงกลางเดือนกรกฎาคมทั้ง Google และ Openai อ้างว่าแบบจำลองของพวกเขาได้รับเหตุผลขั้นสูง กระนั้นความคืบหน้านี้เกิดจากการโต้เถียงเช่นเดียวกับแบบจำลองเช่นการวิจารณ์ของ Grok 4 ของ Xai ที่ได้รับการ overfitted สำหรับการเปรียบเทียบความเอนเอียงและความไม่ปลอดภัย

ความแตกต่างระหว่างชัยชนะพิเศษและข้อบกพร่องในโลกแห่งความเป็นจริงตอกย้ำความวุ่นวาย src=”https://winbuzzer.com/wp-content/uploads/2025/07/chess.jpg”>

การเช็คเอาต์ของปรมาจารย์ทำให้เวที

ในวันที่ 10 กรกฎาคม ในโพสต์เกี่ยวกับ X เขาแบ่งปันภาพหน้าจอของการชนะอย่างเด็ดขาดของเขากับ Chatgpt โดยพูดง่ายๆว่า“ บางครั้งฉันก็เบื่อขณะเดินทาง” การแข่งขันทำหน้าที่เป็นการสาธิตสาธารณะที่ทรงพลังของจิตใจมนุษย์ที่ยอดเยี่ยมรื้อถอน Ai.

คาร์ลเซ่นไม่ได้เป็นเพียงแค่ปรมาจารย์เท่านั้น เขาได้รับการพิจารณาอย่างกว้างขวางว่าเป็นผู้เล่นหมากรุกที่ดีที่สุดในประวัติศาสตร์ นอร์เวย์ได้รับรางวัล World Chess Championship ห้าครั้งล่าสุดในปี 2021 และถือ การจัดอันดับ FIDE สูงสุดของโลกที่ 2839 แม้จะมีการปกครองของเขาเขายังไม่ได้เข้าร่วมการแข่งขันชิงแชมป์ดั้งเดิมตั้งแต่ชัยชนะครั้งสุดท้ายของเขาโดยอ้างว่าขาดแรงจูงใจซึ่งเน้นย้ำตำแหน่งที่เป็นเอกลักษณ์ของเขาในการเล่นกีฬา พื้นหลังนี้ทำให้เขาเป็นเกณฑ์มาตรฐานของมนุษย์ที่ดีที่สุดในการเล่นหมากรุกทำให้เขาได้รับชัยชนะเหนือ AI ชั้นนำที่สำคัญโดยเฉพาะ

ชัยชนะไม่ได้เป็นเพียงชัยชนะ มันเป็นการรื้อถอนที่ไร้ที่ติ Carlsen ตรวจสอบ AI ในการเคลื่อนไหวเพียง 53 ครั้งโดยไม่สูญเสียชิ้นเดียว ตามภาพหน้าจอที่ใช้ร่วมกันกล่าวว่า CHATGPT สูญเสียการจำนำทั้งหมดก่อนที่มันจะถูกบังคับให้ลาออกจากการแข่งขันแสดงให้เห็นถึงความได้เปรียบเชิงกลยุทธ์ที่มีระเบียบและท่วมท้นของปรมาจารย์

การแลกเปลี่ยนหลังเกมพิสูจน์แล้วว่าเปิดเผยมากกว่าการแข่งขัน หลังจาก AI ชมเชยเขาพูดว่า“ นั่นเป็นวิธีการสะอาดและคมชัดเล่นได้ดี!” คาร์ลเซ่นเสนอบทวิจารณ์ของเขาเองโดยสังเกตว่า AI“ เล่นได้ดีในการเปิด” แต่“ ล้มเหลวในการติดตามมันอย่างถูกต้อง” target=”_ blank”> เวลา .

บางครั้งฉันเบื่อขณะเดินทาง pic.twitter.com/mmkeecg0xn href=”https://twitter.com/magnuscarlsen/status/1943473946063474990?ref_src=twsrc%5Etfw”target=”blank”> 11 กรกฎาคม 2025 การแสดงของคาร์ลเซ่นและประเมินความแข็งแกร่งแบบคลาสสิกของเขาให้อยู่ที่ประมาณ 1800-2000 โดยสุจริต การประเมินนี้เป็นไปอย่างไม่น่าเชื่อเนื่องจากคะแนนสุจริตของคาร์ลเซ่นคือ 2839 ทำให้เขาเป็นผู้เล่นอันดับต้น ๆ ที่ไม่มีข้อโต้แย้งในโลก

ข้อผิดพลาดที่เห็นได้ชัดนี้เน้นถึงข้อ จำกัด ที่สำคัญของแบบจำลองภาษาขนาดใหญ่ปัจจุบัน ในขณะที่ความสามารถในการดำเนินงานที่ซับซ้อนและสร้างข้อความที่สุภาพและสอดคล้องกัน AI แสดงให้เห็นถึงการไร้ความสามารถอย่างลึกซึ้งในการเข้าใจบริบทที่แท้จริง มันล้มเหลวในการรับรู้ว่ามันกำลังเล่นกับผู้เล่นที่ยิ่งใหญ่ที่สุดในประวัติศาสตร์สมัยใหม่

การจับกุมแบบไม่เป็นทางการของ AI ที่ได้รับความนิยมของคาร์ลเซ่นนั้นเป็นเกณฑ์มาตรฐานที่น่าสนใจและเป็นจริงที่ตรงกันข้ามกับการทดสอบที่เป็นนามธรรมของอุตสาหกรรม มันเป็นเวทีสำหรับการแข่งขัน AI Arms Race และเฟรมความตึงเครียดพื้นฐานของยุคปัจจุบัน: ระบบเหล่านี้มีเหตุผลอย่างแท้จริงหรือพวกเขาเป็นเพียงความก้าวหน้า แต่ยังเปราะบางรูปแบบการจับคู่หรือไม่

การแข่งขันสำหรับการแข่งขันระดับกลาง คณิตศาสตร์ ในการแสดงพลังการใช้เหตุผลที่น่าทึ่งทั้ง Openai และ Google Deepmind ประกาศว่าแบบจำลองของพวกเขาได้พิชิตโอลิมปิกคณิตศาสตร์ระหว่างประเทศ (IMO)

การพัฒนานี้แสดงให้เห็นถึงความก้าวหน้าที่ยิ่งใหญ่ แบบจำลองที่ดำเนินการ end-to-end ในภาษาธรรมชาติปัญหาการประมวลผลและการสร้างหลักฐานโดยไม่ต้องมีการแทรกแซงของมนุษย์หรือภาษาที่เป็นทางการเฉพาะที่จำเป็นในความพยายามก่อนหน้านี้

Openai ยิงนัดแรกเมื่อวันที่ 19 กรกฎาคม “ ฉันตื่นเต้นที่จะแบ่งปันว่าการใช้เหตุผลครั้งล่าสุดของเรา LLM ได้ประสบความสำเร็จอย่างยิ่งใหญ่ใน AI …” เขาโพสต์บน X โดยวางกรอบเป็นเหตุการณ์สำคัญสำหรับ AI ที่มีอเนกประสงค์ทั่วไป

เพียงสองวันต่อมา Google Deepmind ได้ประกาศตัวเอง ราศีเมถุน AI ซึ่งได้รับการปรับปรุงด้วยเทคโนโลยี“ Deep Think” ซึ่งได้รับเหรียญทองซึ่งได้รับการรับรองอย่างเป็นทางการโดยผู้ประสานงาน IMO ประธานาธิบดี IMO ศาสตราจารย์ดร. เกรกอร์โดลินาร์ยืนยันความสำเร็จโดยระบุว่า“ เราสามารถยืนยันได้ว่า Google Deepmind ได้มาถึงเหตุการณ์สำคัญที่ได้รับการออกแบบมามาก…การแก้ปัญหาของพวกเขานั้นน่าประหลาดใจในหลาย ๆ ด้าน”

นักวิจัยจากค่ายทั้งสอง Sebastien Bubeck ของ Openai ประหลาดใจที่“ เครื่องทำนายคำต่อไป” สามารถผลิต“ พิสูจน์ความคิดสร้างสรรค์อย่างแท้จริง” สิ่งนี้ชี้ให้เห็นว่าเทคโนโลยีพื้นฐานมีความยืดหยุ่นและทรงพลังมากขึ้น

เมื่อการเปรียบเทียบแตก: การเปิดตัวที่มีปัญหาของ Grok 4

ในขณะที่ Google และ Openai เฉลิมฉลองความกล้าหาญทางคณิตศาสตร์ของ Elon Musk บริษัท เปิดตัว GROK 4 รุ่นเมื่อวันที่ 10 กรกฎาคมซึ่งมีคะแนนทำลายสถิติในการทดสอบทางวิชาการ

ชัยชนะนั้นมีอายุสั้น การวิเคราะห์อิสระแนะนำอย่างรวดเร็วว่าแบบจำลองคือ“ overfitted”-ปรับแต่งการทดสอบ ACE ด้วยค่าใช้จ่ายของการใช้งานในโลกแห่งความเป็นจริง แพลตฟอร์มการตั้งค่าของผู้ใช้ yupp.ai เริ่มแรกจัดอันดับ GROK 4 A Dismal 66th Jimmy Lin ผู้ร่วมก่อตั้งของมันกล่าวอย่างตรงไปตรงมา“ Grok 4 นั้นแย่กว่ารุ่นชั้นนำอื่น ๆ: Openai O3, Claude Opus 4 และ Gemini 2.5 Pro. Grok 4 ชอบแม้แต่ Grok 3″

การเปิดตัวแบบจำลอง มันเป็นไปตามคำขอโทษอย่างเป็นทางการสำหรับ”antisemitic meltdown”น่ากลัว”ของบรรพบุรุษซึ่ง บริษัท กล่าวโทษ”ข้อผิดพลาดทางเทคนิค”

นักวิจัยจากนั้นค้นพบว่า Grok 4 ได้รับการออกแบบมาเพื่อปรึกษามุมมองส่วนตัวของ Elon Musk เพื่อให้เรื่องแย่ลงนักวิจัยด้านความปลอดภัยที่ NeuralTrust ประสบความสำเร็จในการสร้างโมเดลภายใน 48 ชั่วโมง

อนาคตที่มีสเตคสูง: จากความระหองระแหงขององค์กรไปจนถึง AI รุ่นต่อไป

ภูมิทัศน์ที่ซับซ้อนของนวัตกรรมและความล้มเหลว การแข่งขันที่ดุเดือดคือการบังคับให้ บริษัท ต่างๆมีความสมดุลในการพัฒนาอย่างรวดเร็วด้วยความกังวลด้านความปลอดภัยที่สำคัญ

มานุษยวิทยาได้นำท่าทางสาธารณะมาใช้อย่างระมัดระวังมากขึ้น มันใช้โปรโตคอลความปลอดภัย ASL-3 ที่เข้มงวดสำหรับโมเดล Claude 4 ที่ทรงพลังหลังจากการทดสอบภายในเผยให้เห็นถึงความเสี่ยงด้านความปลอดภัยทางชีวภาพที่อาจเกิดขึ้น หัวหน้านักวิทยาศาสตร์จาเร็ดแคปแลนยอมรับถึงอันตรายโดยระบุว่า“ คุณสามารถลองสังเคราะห์บางอย่างเช่น Covid หรือไข้หวัดใหญ่ที่อันตรายกว่าและโดยทั่วไปการสร้างแบบจำลองของเราแสดงให้เห็นว่าสิ่งนี้อาจเป็นไปได้”

ในขณะเดียวกันความร่วมมือที่สำคัญระหว่าง Microsoft และ Openai ความขัดแย้งสาธารณะเกี่ยวกับกลยุทธ์ทางธุรกิจและคำจำกัดความของ AGI ได้ทดสอบพันธมิตร Microsoft CEO Satya Nadella ได้ยกเลิกความคิดของ Openai เพียงฝ่ายเดียวประกาศ AGI ว่า“ เรากำลังเรียกร้องตัวเองด้วยความสำเร็จครั้งสำคัญของ Agi นั่นเป็นเพียงการแฮ็คเกณฑ์มาตรฐานที่ไร้สาระ”

ความเสียดทานที่เกิดขึ้นจริง ละครการทำงานร่วมกันทางเทคโนโลยีของพวกเขายังคงดำเนินต่อไป Microsoft กำลังเตรียมโหมด“ อัจฉริยะ” ใหม่สำหรับ Copilot ซึ่งได้รับการออกแบบมาโดยเฉพาะเพื่อรวมรุ่น GPT-5 ที่กำลังจะมาถึงของ OpenAI การย้ายครั้งนี้เป็นสัญญาณว่าในตอนนี้ความต้องการร่วมกันสำหรับนวัตกรรมมีค่ามากกว่าการแข่งขันขององค์กร

Categories: IT Info