AlphaEvolve AI dari Google DeepMind mempercepat penelitian matematika pada skala yang belum pernah terjadi sebelumnya, menurut makalah baru yang diterbitkan minggu ini oleh kolaborator termasuk ahli matematika terkenal Terence Tao.

Penelitian ini menunjukkan bagaimana agen AI mengatasi 67 masalah yang menantang, menemukan kembali solusi terbaik, dan menemukan konstruksi baru untuk beberapa tantangan yang sudah lama ada.

Pekerjaan ini menunjukkan metode baru yang ampuh untuk kolaborasi manusia-AI dalam matematika murni. Teknologi ini menggunakan kemampuan AI untuk mencari ruang masalah yang luas guna menghasilkan wawasan yang melengkapi intuisi manusia, sehingga berpotensi mempercepat penyelesaian dugaan-dugaan yang sangat sulit.

Mesin Evolusioner untuk Penemuan Matematika

Beroperasi secara berbeda dari chatbot tujuan umum yang sering kali kesulitan dengan logika ketelitian, AlphaEvolve menggunakan kerangka kerja evolusi terstruktur.

Ini berfungsi sebagai “agen pengkodean evolusioner generik,” yang menggunakan model bahasa besar seperti Gemini untuk mengusulkan, menguji, dan menyempurnakan solusi algoritmik secara berulang. Pekerjaan ini merupakan kelanjutan dari peluncuran awal alat ini oleh DeepMind pada bulan Mei 2025.

Menurut makalah penelitian, “…AlphaEvolve adalah alat baru yang canggih untuk penemuan matematika, yang mampu menjelajahi ruang pencarian yang luas untuk memecahkan masalah pengoptimalan yang kompleks dalam skala besar.”

Secara mendetail postingan blognya, Tao menjelaskan bahwa metode inti AI melibatkan pengembangan kode Python yang mencari solusi, bukan membuat objek matematika secara langsung.

“Mode pencarian”ini memungkinkan satu panggilan LLM yang lambat untuk memicu komputasi yang besar dan murah seiring heuristik pencarian yang dihasilkan mengeksplorasi jutaan kemungkinan dengan sendirinya. “Mode generalisasi”yang kontras menugaskan AI untuk menemukan rumus yang dapat digunakan untuk angka berapa pun, yang bertujuan untuk penerapan yang lebih luas.

Memulai jalur penyelidikan baru sangatlah efisien dengan proses ini. Para peneliti menyoroti bahwa untuk banyak masalah yang mereka eksplorasi, “…rata-rata waktu persiapan yang biasa untuk menyiapkan sebuah soal menggunakan AlphaEvolve hanya memakan waktu hingga beberapa jam.”

Penyiapan cepat seperti itu memungkinkan ahli matematika untuk secara sistematis menyelidiki sejumlah besar soal yang seharusnya membutuhkan kerja komputasi yang ekstensif dan khusus.

Dari Memindahkan Sofa ke Perangkat Kakeya: AI Mengatasi Masalah Terbuka

Sementara sistem berhasil menemukan kembali solusi yang diketahui untuk sebagian besar dari 67 masalah, kontribusi paling signifikan datang dari penemuan pendekatan baru.

Penelitian ini menyoroti konstruksi baru yang menjanjikan untuk himpunan Nikodym, yang telah menginspirasi makalah Tao yang akan datang. Selain itu, AlphaEvolve menemukan konstruksi baru dengan perbaikan tingkat rendah untuk masalah Kakeya bidang terbatas dalam dimensi 3, 4, dan 5.

Di luar area yang sangat abstrak ini, agen juga menunjukkan keserbagunaannya pada teka-teki geometris yang lebih nyata. Ini berhasil menemukan kembali “sofa Gerver”yang optimal untuk masalah klasik”sofa bergerak” dan “Romik sofa” untuk varian ambidextrousnya.

Untuk masalah versi 3D yang lebih kompleks, AlphaEvolve menghasilkan konstruksi baru dengan volume yang diverifikasi secara ketat setidaknya 1,81, yang diyakini para peneliti melampaui kandidat yang diketahui sebelumnya.

Keberhasilan ini menunjukkan alur kerja yang kuat yang menggabungkan beberapa sistem AI khusus. AlphaEvolve pertama-tama menemukan konstruksi yang menjanjikan, yang kemudian dapat dianalisis oleh agen seperti Deep Think, teknologi yang sama di balik kemenangan medali emas IMO DeepMind untuk mendapatkan bukti kebenarannya.

Keseluruhan pipeline ini dapat berujung pada verifikasi formal, dengan alat seperti AlphaProof menerjemahkan bukti bahasa alami ke dalam format yang dapat diperiksa mesin seperti Lean.

Namun, prosesnya memerlukan keahlian manusia yang signifikan untuk memandu AI dan memvalidasi keluarannya. Postingan blog Tao menekankan bahwa alat tersebut bukanlah ahli matematika yang otonom dan cenderung menemukan solusi cerdas. “…perlu banyak upaya manusia untuk merancang verifier yang tidak dapat dieksploitasi,” tulisnya.

Pemeriksaan Kewarasan Jenis Baru: AI sebagai Mitra Penelitian

Pada akhirnya, para peneliti memposisikan AlphaEvolve bukan sebagai pengganti ahli matematika manusia, namun sebagai mitra penelitian baru yang kuat. Kemampuannya untuk menguji ide dengan cepat menjadikannya alat yang ideal untuk eksplorasi awal.

Seperti yang dikatakan Tao, “Saya dapat membayangkan alat seperti itu menjadi “pemeriksaan kewarasan” yang berguna ketika mengajukan dugaan baru.”Mencari contoh tandingan yang “jelas” secara sistematis membantu memvalidasi atau meragukan ide-ide baru sebelum upaya manusia yang signifikan dilakukan.

Bahkan kegagalan sistem pun memberikan informasi yang berharga. Makalah ini mencatat bahwa dari 67 permasalahan yang ada,”…kami tidak menyangkal dugaan terbuka yang besar. Tentu saja, satu penjelasan yang mungkin untuk hal ini adalah bahwa dugaan tersebut memang benar.”

Pendekatan yang ketat dan berbasis bukti ini sangat kontras dengan siklus AI yang baru-baru ini dicontohkan oleh pencabutan klaim OpenAI dalam memecahkan masalah besar Erdős.

Kesalahan langkah publik tersebut menuai kritik tajam dari para pesaing, termasuk CEO Google DeepMind Demis Hassabis menyebut insiden tersebut “memalukan.”

Didasarkan pada kolaborasi dengan para pakar domain, kerangka kerja DeepMind tampaknya dirancang untuk menghindari jebakan semacam itu. Pekerjaan dengan AlphaEvolve mengikuti serangkaian terobosan sah dalam penerapan AI pada matematika, termasuk sistem AlphaGeometry2 yang mengungguli pakar manusia dalam masalah geometri Olimpiade.

Dengan berfokus pada peningkatan intuisi manusia daripada mengklaim dapat memecahkan masalah secara mandiri, AlphaEvolve memetakan jalur yang lebih berkelanjutan dan kredibel untuk peran AI dalam penemuan ilmiah.

Categories: IT Info