Mô hình Alphageometry2 của Google DeepMind đã vượt trội so với các huy chương vàng của con người trong Các vấn đề được trình bày trong 25 năm qua. Google đã mở rộng các khả năng của mình để xử lý một loạt các vấn đề hình học rộng hơn, bao gồm các vấn đề liên quan đến chuyển động đối tượng và phương trình tuyến tính liên quan đến các góc, tỷ lệ và khoảng cách.//x.com/lmthang/status/1816506897790652465″> đã đạt được mức huy chương bạc trong việc giải quyết các vấn đề Olympiad toán học quốc tế. hình ảnh/gif; base64, r0lgodlhaqabaaaaach5baekaaealaaaaabaaaaaictaeauw==”>

Thành tích mới định vị hệ thống AI như một sự quan trọng trong việc lý luận tính toán, cho thấy khả năng của Deep

Người tiền nhiệm của nó, Alphageometry, đã đạt được tỷ lệ thành công chỉ 54%, đánh dấu hệ thống mới là một bước tiến đáng kể. , trong đó biến đổi dự đoán cấu trúc protein và Alphago , đã thành thạo trò chơi bảng cổ của Go.

Vui mừng chia sẻ chi tiết về Alphageometry2 (AG2), một phần của hệ thống đạt tiêu chuẩn huy chương bạc tại IMO 2024 vào tháng 7 năm ngoái! AG2 hiện đã vượt qua các huy chương vàng trung bình trong việc giải quyết các vấn đề hình học Olympic, đạt được tỷ lệ giải quyết 84% cho tất cả các vấn đề hình học IMO, https://t. Co/javtpndbmu pic.twitter.com/exhstdevtp

-Thang luong (@lmthang) , Thể hiện khả năng thích ứng của các mô hình của DeepMind trong việc giải quyết một loạt các thách thức khác nhau.

Alphageometry2 không chỉ vượt trội so với nhiều chuyên gia của con người mà còn giới thiệu các kỹ thuật có thể ảnh hưởng đến nghiên cứu và ứng dụng AI rộng hơn, bao gồm các lĩnh vực như kỹ thuật và vật lý.

Thành công của nó dựa trên những đổi mới như nhóm kiến ​​thức được chia sẻ của cây tìm kiếm (trượt tuyết nhất) và động cơ tượng trưng được tối ưu hóa, cho phép AI giải quyết các vấn đề ở tốc độ chưa từng có. Trong AG1, chúng tôi sử dụng tìm kiếm chùm tia đơn giản để khám phá bằng chứng. Trong AG2, chúng tôi thiết kế một thuật toán tìm kiếm mới, được gọi là nhóm kiến ​​thức được chia sẻ của các cây tìm kiếm (Skest), để cho phép nhiều tìm kiếm chùm tia chạy song song và giúp đỡ lẫn nhau. Đây là một trong những lý do tại sao chúng ta có thể giải quyết IMO pic.twitter.com/Z1078G083W

-Thang luong (@lmthang) ngày 8 tháng 2/strong>

Trọng tâm của Alphageometry2 là kiến ​​trúc lai của nó, kết hợp một phiên bản được xử lý hoàn hảo của mô hình ngôn ngữ Song Tử của DeepMind với một động cơ lý luận tượng trưng được gọi là DDAR (lý luận số học cơ sở dữ liệu suy diễn).

Sự hợp tác này cho phép AI diễn giải và chính thức hóa các vấn đề hình học phức tạp, tạo ra các giải pháp tiềm năng và xác nhận các giải pháp này thông qua các bằng chứng logic nghiêm ngặt.

Theo một

Các tối ưu hóa này mở rộng phạm vi các vấn đề AlphageOmetry2 có thể xử lý, bao gồm các vấn đề loại locus phức tạp trong đó các đối tượng di chuyển trong khi duy trì các mối quan hệ cụ thể với các yếu tố hình học khác. Hình học

Hiệu suất của Alphageometry2 đặt nó lên trên huy chương vàng IMO trung bình, người thường giải quyết 40 trên 50 vấn đề trong bộ điểm chuẩn IMO-AG-50.

Hệ thống đã giải quyết 42 vấn đề, đánh dấu một lợi thế nhẹ nhưng có ý nghĩa đối với các chuyên gia của con người. Thành tích này đặc biệt nổi bật với khó khăn của các vấn đề IMO, đòi hỏi bằng chứng nghiêm ngặt cho các tuyên bố về các mối quan hệ hình học trên mặt phẳng.

Một trong những khía cạnh đáng chú ý nhất của chữ cái Như những người liên quan đến loci. A> yêu cầu hiểu cách các điểm hoặc đối tượng di chuyển trong khi bảo tồn một số điều kiện nhất định, một nhiệm vụ kết hợp lý luận trừu tượng với sự nghiêm ngặt toán học.

Bằng cách giải quyết thành công các thách thức này, AlphageOmetry2 đã mở rộng phạm vi bảo hiểm vấn đề của mình từ 66% lên 88% các vấn đề về hình học IMO. hay Cạnh tranh năm, yêu cầu chứng minh tổng của ∠kil và ∠xpy bằng 180 °. , tạo ra nhiều cặp hình tam giác tương tự như Abe ~ ybi và Ale ~ IPC cần để chứng minh kết luận. T là rất lâu trước khi các máy tính đạt được điểm đầy đủ trên IMO.”* ( Nature Những tiến bộ như vậy cho thấy rằng các hệ thống AI như Alphageometry2 không chỉ phù hợp với hiệu suất của con người mà có khả năng xác định lại những gì có thể đạt được trong giải quyết vấn đề toán học. là sự phụ thuộc của nó vào dữ liệu đào tạo tổng hợp. DeepMind đã tạo ra hơn 300 triệu định lý tổng hợp và bằng chứng, bao gồm một loạt các phức tạp, để đào tạo mô hình ngôn ngữ dựa trên Gemini.

Cách tiếp cận này cho phép AI phát triển sự hiểu biết sâu sắc về các nguyên tắc hình học và giải quyết các vấn đề vượt ra ngoài các bộ dữ liệu do con người lưu trữ. Các bộ dữ liệu tổng hợp này không chỉ tăng cường khả năng giải quyết vấn đề mà còn chứng minh khả năng mở rộng của nghiên cứu AI của DeepMind. Bằng cách xác minh tính nhất quán logic của các đề xuất mô hình ngôn ngữ, DDAR đảm bảo rằng mỗi bước trong quá trình giải quyết vấn đề tuân thủ các quy tắc toán học nghiêm ngặt.

Sự kết hợp giữa khả năng thích ứng thần kinh và độ chính xác logic này đặt Alphageometry2 ngoài các mô hình ngôn ngữ lớn truyền thống hơn.

Mặc dù hiệu suất đáng chú ý của nó, hệ thống vẫn có những hạn chế. Nó đấu tranh với các vấn đề liên quan đến bất bình đẳng, phương trình phi tuyến tính và số điểm khác nhau mà các khu vực đòi hỏi khả năng lý luận thậm chí còn tiên tiến hơn. Theo nghiên cứu của DeepMind, cho đến khi tốc độ mô hình được cải thiện và ảo giác được giải quyết hoàn toàn, các công cụ như động cơ tượng trưng sẽ vẫn cần thiết cho các ứng dụng toán học.”>

Thành công của Alphageometry2 cho thấy tiềm năng của các hệ thống AI lai trong việc giải quyết các vấn đề chuyên môn cao. Vật lý, trong đó các mô hình phức tạp thường dựa vào các tính toán hình học phức tạp. P> Những tiến bộ của AI rộng hơn của DeepMind cung cấp bối cảnh có giá trị để hiểu tầm quan trọng của Alphageometry2. Alphago đã chứng minh tiềm năng của AI để thành thạo lý luận chiến lược, trong khi các mô hình ngôn ngữ lớn như Gemini đã đưa ra những cách sáng tạo để giải quyết các vấn đề trừu tượng. > Sự phát triển của Alphageometry2 đã thống trị các cuộc tranh luận trong cộng đồng nghiên cứu AI về vai trò của các hệ thống lai trong việc giải quyết các vấn đề phức tạp. Trong khi các mô hình ngôn ngữ lớn như các mô hình GPT của Gemini hoặc Openai, vượt trội khi tạo ra văn bản giống con người, nhưng chúng thường chùn bước khi phải đối mặt với các nhiệm vụ đòi hỏi phải có lý luận chính thức hoặc tính nhất quán logic.

Alphageometry2 thu hẹp khoảng cách này bằng cách tích hợp lý luận tượng trưng, ​​cung cấp một kế hoạch chi tiết tiềm năng cho thế hệ tiếp theo của các hệ thống AI.

Tuy nhiên, các thách thức vẫn còn. Sự phụ thuộc vào các động cơ tượng trưng giới thiệu chi phí tính toán và hệ thống không có khả năng xử lý một số loại vấn đề nhất định làm nổi bật sự cần thiết phải đổi mới. Khi các nhà nghiên cứu tinh chỉnh mô hình, việc tích hợp các phương pháp lý luận nâng cao và thuật toán nhanh hơn sẽ là chìa khóa để khắc phục những hạn chế này. 3, thể hiện sự cống hiến của công ty để mở rộng ranh giới của những gì AI có thể đạt được.