AlphaEvolve AI ของ Google DeepMind กำลังเร่งการวิจัยทางคณิตศาสตร์ในระดับที่ไม่เคยมีมาก่อน ตามรายงานฉบับใหม่ที่เผยแพร่ในสัปดาห์นี้โดยผู้ทำงานร่วมกัน รวมถึงนักคณิตศาสตร์ชื่อดัง Terence เทา.
การวิจัยแสดงให้เห็นว่าตัวแทน AI จัดการกับปัญหาที่ท้าทาย 67 ข้อได้อย่างไร ค้นพบวิธีแก้ปัญหายอดนิยมอีกครั้ง และค้นหาโครงสร้างใหม่สำหรับความท้าทายที่มีมายาวนานหลายประการ
งานนี้แสดงให้เห็นถึงวิธีการใหม่อันทรงพลังสำหรับการทำงานร่วมกันระหว่างมนุษย์กับ AI ในทางคณิตศาสตร์ล้วนๆ ใช้ความสามารถของ AI ในการค้นหาพื้นที่ปัญหาอันกว้างใหญ่เพื่อสร้างข้อมูลเชิงลึกที่เสริมสัญชาตญาณของมนุษย์ ซึ่งอาจเร่งเส้นทางไปสู่การแก้ปัญหาการคาดเดาที่ยากลำบากอันโด่งดัง
กลไกวิวัฒนาการสำหรับการค้นพบทางคณิตศาสตร์
การทำงานที่แตกต่างจากวัตถุประสงค์ทั่วไป แชทบอทที่มักจะต่อสู้กับความเข้มงวดทางตรรกะ AlphaEvolve ใช้เฟรมเวิร์กวิวัฒนาการที่มีโครงสร้าง
มันทำหน้าที่เป็น”เอเจนต์การเขียนโค้ดวิวัฒนาการทั่วไป”โดยใช้โมเดลภาษาขนาดใหญ่ เช่น Gemini เพื่อเสนอ ทดสอบ และปรับแต่งโซลูชันอัลกอริทึมซ้ำๆ งานนี้ต่อยอดมาจากการเปิดตัวเครื่องมือนี้ครั้งแรกของ DeepMind ในเดือนพฤษภาคม 2025
ตามรายงานการวิจัย “…AlphaEvolve เป็นเครื่องมือใหม่ที่ทรงพลังสำหรับการค้นพบทางคณิตศาสตร์ ซึ่งสามารถสำรวจพื้นที่การค้นหาอันกว้างใหญ่เพื่อแก้ปัญหาการเพิ่มประสิทธิภาพที่ซับซ้อนในวงกว้าง”
ในบล็อกที่มีรายละเอียด โพสต์ Tao อธิบายว่าวิธีการหลักของ AI เกี่ยวข้องกับการพัฒนาโค้ด Python ที่ค้นหาวิธีแก้ปัญหา แทนที่จะสร้างวัตถุทางคณิตศาสตร์โดยตรง
“โหมดการค้นหา”นี้ช่วยให้การเรียก LLM ที่ช้าเพียงครั้งเดียวเรียกใช้การคำนวณจำนวนมากและราคาถูก เนื่องจากการวิเคราะห์พฤติกรรมการค้นหาที่สร้างขึ้นจะสำรวจความเป็นไปได้นับล้านด้วยตัวมันเอง”โหมดเครื่องมือทั่วไป”ที่ตัดกันจะมอบหมายให้ AI ค้นหาสูตรที่เหมาะกับตัวเลขที่กำหนด โดยมีเป้าหมายเพื่อการนำไปประยุกต์ใช้ที่กว้างขึ้น
การเริ่มต้นในบรรทัดใหม่ของการสอบถามนั้นมีประสิทธิภาพอย่างน่าทึ่งด้วยกระบวนการนี้ นักวิจัยเน้นย้ำว่าสำหรับปัญหาต่างๆ ที่พวกเขาสำรวจ “…โดยเฉลี่ยแล้ว เวลาเตรียมการตามปกติสำหรับการตั้งค่าปัญหาโดยใช้ AlphaEvolve ใช้เวลาเพียงสองสามชั่วโมงเท่านั้น”
การตั้งค่าที่รวดเร็วดังกล่าวช่วยให้นักคณิตศาสตร์สามารถตรวจสอบปัญหาประเภทต่างๆ ได้อย่างเป็นระบบ ซึ่งมิฉะนั้นอาจต้องใช้การคำนวณที่กว้างขวางและออกแบบตามความต้องการ
ตั้งแต่การย้ายโซฟาไปจนถึงชุด Kakeya: AI จัดการกับปัญหาแบบเปิด
ในขณะที่ ระบบประสบความสำเร็จในการค้นพบแนวทางแก้ไขที่ทราบแล้วสำหรับปัญหาส่วนใหญ่ใน 67 ปัญหา โดยการสนับสนุนที่สำคัญที่สุดมาจากการค้นหาแนวทางใหม่
การวิจัยเน้นย้ำถึงการก่อสร้างใหม่ที่มีแนวโน้มสำหรับชุด Nikodym ซึ่งเป็นแรงบันดาลใจให้กับรายงานที่กำลังจะมีขึ้นโดย Tao นอกจากนี้ AlphaEvolve ยังค้นพบโครงสร้างใหม่ที่มีการปรับปรุงลำดับที่ต่ำกว่าสำหรับปัญหา Kakeya ฟิลด์ที่มีขอบเขตจำกัดในมิติ 3, 4 และ 5
นอกเหนือจากพื้นที่ที่เป็นนามธรรมสูงเหล่านี้แล้ว เอเจนต์ยังแสดงให้เห็นถึงความเก่งกาจของมันในปริศนาเรขาคณิตที่จับต้องได้มากขึ้น ประสบความสำเร็จในการค้นพบ “โซฟา Gerver” ที่ดีที่สุดอีกครั้งสำหรับปัญหา “โซฟาขนย้าย” แบบคลาสสิก และ“โซฟา Romik” สำหรับ รูปแบบการตีสองหน้า
สำหรับเวอร์ชัน 3 มิติที่ซับซ้อนยิ่งขึ้นของปัญหา AlphaEvolve ได้สร้างโครงสร้างใหม่ที่มีปริมาณการตรวจสอบอย่างเข้มงวดอย่างน้อย 1.81 ซึ่งนักวิจัยเชื่อว่าเหนือกว่าตัวเลือกที่รู้จักก่อนหน้านี้
ความสำเร็จเหล่านี้แสดงให้เห็นถึงขั้นตอนการทำงานอันทรงพลังที่รวมระบบ AI พิเศษหลายระบบเข้าด้วยกัน ในขั้นแรก AlphaEvolve พบโครงสร้างที่มีแนวโน้ม ซึ่งตัวแทนอย่าง Deep Think ซึ่งเป็นเทคโนโลยีเดียวกับที่ได้รับรางวัลเหรียญทอง IMO ของ DeepMind สามารถวิเคราะห์เพื่อพิสูจน์ความถูกต้องได้
ไปป์ไลน์ทั้งหมดนี้สามารถสิ้นสุดในการตรวจสอบอย่างเป็นทางการ ด้วยเครื่องมืออย่าง AlphaProof การแปลการพิสูจน์ภาษาธรรมชาติเป็นรูปแบบที่ตรวจสอบได้ด้วยเครื่องจักร เช่น Lean
อย่างไรก็ตาม กระบวนการนี้ต้องใช้ความเชี่ยวชาญของมนุษย์ที่สำคัญเพื่อนำทาง AI และตรวจสอบความถูกต้องของผลลัพธ์ โพสต์ในบล็อกของ Tao เน้นย้ำว่าเครื่องมือนี้ไม่ใช่นักคณิตศาสตร์ที่เป็นอิสระและมีแนวโน้มที่จะค้นหาวิธีแก้ปัญหาที่ชาญฉลาด “…ต้องใช้ความพยายามของมนุษย์เพียงเล็กน้อยในการออกแบบเครื่องมือตรวจสอบที่ไม่สามารถหาประโยชน์ได้” เขาเขียน
การตรวจสอบสุขภาพรูปแบบใหม่: AI ในฐานะพันธมิตรการวิจัย
ท้ายที่สุดแล้ว นักวิจัยวางตำแหน่ง AlphaEvolve ไม่ใช่เพื่อทดแทนนักคณิตศาสตร์ของมนุษย์ แต่เป็นพันธมิตรการวิจัยรูปแบบใหม่ที่ทรงพลัง ความสามารถในการทดสอบแนวคิดอย่างรวดเร็วทำให้เป็นเครื่องมือที่เหมาะสำหรับการสำรวจเบื้องต้น
ดังที่ Tao ตั้งข้อสังเกตว่า”ฉันจินตนาการได้ว่าเครื่องมือดังกล่าวเป็น”การตรวจสอบสติ”ที่มีประโยชน์เมื่อเสนอการคาดเดาใหม่”การค้นหาตัวอย่างแย้งที่”ชัดเจน”อย่างเป็นระบบจะช่วยตรวจสอบหรือตั้งข้อสงสัยเกี่ยวกับแนวคิดใหม่ๆ ก่อนที่จะลงทุนลงแรงของมนุษย์อย่างมีนัยสำคัญ
แม้แต่ความล้มเหลวของระบบก็ยังให้ข้อมูลที่มีคุณค่า เอกสารดังกล่าวตั้งข้อสังเกตว่าจากปัญหาทั้ง 67 ข้อ “…เราไม่ได้หักล้างการคาดเดาแบบเปิดที่สำคัญใดๆ แน่นอน คำอธิบายที่เป็นไปได้อย่างชัดเจนประการหนึ่งสำหรับเรื่องนี้ก็คือการคาดเดาเหล่านี้เป็นจริง”
แนวทางที่เข้มงวดและอิงหลักฐานเชิงประจักษ์นี้แตกต่างอย่างมากกับวงจร AI ที่เกินจริง ซึ่งเพิ่งได้รับการยกตัวอย่างจากการกล่าวอ้างที่ถูกเพิกถอนของ OpenAI ในการแก้ปัญหาที่สำคัญๆ ของErdős
การกระทำผิดในที่สาธารณะทำให้เกิดการวิพากษ์วิจารณ์อย่างรุนแรงจากคู่แข่ง โดยที่ Demis Hassabis ซีอีโอของ Google DeepMind เรียกเหตุการณ์นี้ว่า”น่าอาย”
เฟรมเวิร์กของ DeepMind ได้รับการออกแบบเพื่อหลีกเลี่ยงข้อผิดพลาดดังกล่าวโดยอาศัยความร่วมมือจากผู้เชี่ยวชาญในโดเมน การทำงานร่วมกับ AlphaEvolve เป็นไปตามชุดความก้าวหน้าที่ถูกต้องตามกฎหมายในการใช้ AI กับคณิตศาสตร์ ซึ่งรวมถึงระบบ AlphaGeometry2 ที่มีประสิทธิภาพเหนือกว่าผู้เชี่ยวชาญที่เป็นมนุษย์ในด้านปัญหาเรขาคณิตของโอลิมปิก
ด้วยการมุ่งเน้นไปที่การเพิ่มสัญชาตญาณของมนุษย์มากกว่าการอ้างว่าสามารถแก้ปัญหาได้โดยอัตโนมัติ AlphaEvolve ได้สร้างแผนภูมิเส้นทางที่ยั่งยืนและน่าเชื่อถือมากขึ้นสำหรับบทบาทของ AI ในการค้นพบทางวิทยาศาสตร์