著名な数学者テレンスを含む共同研究者によって今週発表された新しい論文によると、Google DeepMindのAlphaEvolve AIは前例のない規模で数学研究を加速させているという。タオ。

この研究は、AI エージェントが 67 の困難な問題にどのように取り組み、最も重要な解決策を再発見し、いくつかの長年の課題に対する新しい構造を見つけたかを示しています。

この研究は、純粋な数学における人間と AI のコラボレーションのための強力な新しい方法を実証しています。広大な問題空間を検索する AI の機能を利用して、人間の直観を補う洞察を生成し、難解で有名な推測を解く道をスピードアップできる可能性があります。

数学的発見のための進化的エンジン

従来とは異なる動作AlphaEvolve は論理的厳密さに苦戦することが多い汎用チャットボットですが、構造化された進化的フレームワークを使用します。

これは「汎用進化的コーディング エージェント」として機能し、Gemini のような大規模な言語モデルを採用して、アルゴリズム ソリューションを提案、テスト、反復的に改良します。この研究は、DeepMind が 2025 年 5 月に初めて発表したツールに基づいて構築されています。

研究論文によると、「…AlphaEvolve は、広大な検索スペースを探索して複雑な最適化問題を大規模に解決できる、数学的発見のための強力な新しいツールです。」

ブログ投稿でタオ氏は、AI の中核的なメソッドには、数学的オブジェクトを直接作成するのではなく、解を検索する Python コードの進化が含まれると説明しました。

この「検索モード」により、生成された検索ヒューリスティックが独自に数百万の可能性を探索するため、単一の低速 LLM 呼び出しで大規模で低コストの計算をトリガーできます。対照的な「ジェネラライザー モード」は、より広い適用性を目指して、任意の数値に有効な数式を見つけるというタスクを AI に課します。

このプロセスを使用すると、新しい分野の調査を開始することが非常に効率的になります。研究者らは、調査した問題の多くについて「…AlphaEvolve を使用した問題のセットアップの通常の準備時間は、平均して最大で数時間しかかからなかった」ことを強調しています。

このような迅速なセットアップにより、数学者は、そうでなければ大規模な特注の計算作業が必要となる大規模なクラスの問題を体系的に調査できるようになります。

ソファからカケヤ セットへの移動まで: AI が未解決の問題に取り組む

このシステムは、67 の問題のほとんどについて既知の解決策を再発見することに成功しましたが、その最も重要な貢献は、新しいアプローチを発見したことによるものでした。

この研究は、ニコディム セットの新しい有望な構築を強調しており、これはすでにタオによる今後の論文に影響を与えています。さらに、AlphaEvolve は、次元 3、4、および 5 の有限体 Kakeya 問題を低次で改善した新しい構造を発見しました。

これらの高度に抽象的な領域を超えて、このエージェントは、より具体的な幾何学パズルでもその多用途性を実証しました。 古典的な「動くソファ」問題に対して最適な「Gerver ソファ」と、その問題に対して「Romik ソファ」を再発見することに成功しました。

この問題のより複雑な 3D バージョンについて、AlphaEvolve は、厳密に検証された少なくとも 1.81 のボリュームを持つ新しい構造を生成しました。研究者らは、これが以前に知られていた候補を上回ると考えています。

これらの成功は、複数の特化された AI システムを組み合わせた強力なワークフローを示しています。 AlphaEvolve は、まず有望な構造を見つけます。DeepMind の IMO 金メダル獲得を支えた同じテクノロジーである Deep Think のようなエージェントが、その構造を分析して、その正しさの証明を導き出すことができます。

このパイプライン全体は、AlphaProof のような自然言語の証明を Lean のような機械チェック可能な形式に変換するツールを使用して、正式な検証で最高潮に達します。

ただし、このプロセスには、AI を誘導し、その出力を検証するためにかなりの人間の専門知識が必要です。 Tao 氏のブログ投稿では、このツールは自律的な数学者ではなく、巧妙な回避策を見つける傾向があることを強調しています。 「…悪用不可能な検証器を設計するには、少なからぬ人間の努力が必要です」と彼は書いています。

新しい種類の健全性チェック: 研究パートナーとしての AI

最終的に研究者らは、AlphaEvolve を人間の数学者の代替としてではなく、強力な新しい種類の研究パートナーとして位置づけています。アイデアを迅速にテストできるため、最初の探索には理想的なツールです。

タオ氏が言うように、「このようなツールは、新しい推測を提案するときに役立つ「健全性チェック」であると想像できます。」 「明白な」反例を体系的に検索すると、多大な人的労力を費やす前に、新しいアイデアを検証したり疑問を投げかけたりするのに役立ちます。

システムの障害であっても、貴重な情報が得られます。この論文は、67 の問題にわたって、「…私たちはいかなる主要な未解決の推測も反証しなかった。もちろん、これに対する明白な説明の 1 つは、これらの推測が実際に真実であるということである。」

この厳格で証拠に基づいたアプローチは、最近、主要なエルデシュの問題を解決するという OpenAI の撤回された主張によって例証されている AI の誇大広告サイクルとははっきりと対照的です。

この公の間違いは、国民からの鋭い批判を引き起こしました。 Google DeepMind の CEO、デミス・ハサビス氏はこの事件を「恥ずかしい」と述べています。

DeepMind のフレームワークは、ドメインの専門家との協力のもと、そのような落とし穴を回避するように設計されているようです。 AlphaEvolve との取り組みは、オリンピックの幾何学問題で人間の専門家を上回った AlphaGeometry2 システムなど、AI を数学に適用する一連の正当なブレークスルーをたどるものです。

AlphaEvolve は、問題を自律的に解決すると主張するのではなく、人間の直観を増強することに重点を置くことで、科学的発見における AI の役割について、より持続可能で信頼できる道筋を示します。

Categories: IT Info