Wyścig o supremację sztucznej inteligencji osiągnął nowy szczyt, ponieważ zarówno Google Deepmind, jak i Openai twierdzą, że ich modele mogą pokonać międzynarodową olimpiadę matematyczną (IMO), jedno z najtrudniejszych wyzwań intelektualnych ludzkości.

Google ogłosiło w poniedziałek, że jej Gemini Deep Think Ai zasłużył na oficjalnie certyfikowaną złotą medalę na 2025 r. Wiadomości wylądowały zaledwie kilka dni po tym, jak rywal Openai ujawnił, że swój własny model nieoficjalnie osiągnął ten sam wynik najwyższego poziomu.

Ten przełomowy sygnalizuje dramatyczny skok w rozumowaniu AI. Dowodzi to, że modele ogólne, mogą teraz rozwiązywać złożone problemy matematyczne na elitarnym poziomie ludzkim, eskalując rywalizację między dwoma liderami AI.

a Mold Mandalu z Mold Mandalu with a constriciticipent. Twist

Zaawansowany model Gemini Google Deepmind, wzmocniony technologią „Deep Think”, doskonale rozwiązał pięć z sześciu wyjątkowo trudnych problemów. Zdobył 35 z możliwych 42 punktów, wyniku dobrze w złoty medal na tegoroczny konkurs .

To było pierwsze czas, a wyniki ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai ai zostały oficjalnie i certyfikowane przez IMO. Prezydent IMO prof. Dr Gregor Dolinar potwierdził osiągnięcie, stwierdzając: „Możemy potwierdzić, że Google Deepmind osiągnął bardzo pożądany kamień milowy, zarabiając 35 z możliwych 42 punktów-ocena złotego medalu. Ich roztwory były z wieloma względami pod wieloma względami”. Jednak oficjalne oświadczenie IMO wyjaśniło to tylko zatwierdził rozwiązania, a nie system ai . Bezpośrednia odpowiedź na Openai. Zaledwie dwa dni wcześniej Openai zapobiegawczo ogłosił, że swój własny model eksperymentalny uzyskał 35 punktów na te same problemy, ruch, który przyciągnął uwagę obserwatorów branży.

z srebrnego do złota: skok w AI rozumowania

Osiągnięcia to w ubiegłym roku. W 2024 r. Jego systemy osiągnęły standard srebrnego-medal, ale wymagało znaczącej interwencji człowieka i wyspecjalizowanych narzędzi .

innowacja kluczowa jest to, że modelu jest modelem do opecjacji końcowej do ustalenia do ustalenia końcowego. język. Przetworzył oficjalne opisy problemów i wygenerował bezpośrednio rygorystyczne dowody matematyczne, wszystkie w ramach ścisłego 4,5-godzinnego limitu czasu konkurencji.

Ten skok do przodu usuwa potrzebę tłumaczenia problemów na formalne języki, takie jak Lean, uciążliwy proces, który wcześniej ograniczył szybkość i autonomię systemu. Prezentuje bardziej elastyczną i potężną formę rozumowania AI.

wyścig o zbudowanie prawdziwego matematyka AI

Obie firmy opracowują swoje osiągnięcia jako zwycięstwo AI ogólnego zarybiania. Noam Brown, badacz Openai, podkreślił: „To nie jest model specyficzny dla IMO. Jest to rozumowanie LLM, które zawiera nowe eksperymentalne techniki ogólnego zastosowania”, sentyment powtórzony przez jego kolegów. Sugeruje to, że modele podstawowe są zasadniczo zdolne, a nie tylko wąskich specjalistów matematycznych.

System Google opiera się na nowej architekturze głębokiej myśli. Ten tryb obejmuje równoległe myślenie, umożliwiając modelowi eksplorację i łączenie wielu potencjalnych ścieżek rozwiązań jednocześnie, zamiast realizować pojedynczy, liniowy łańcuch myśli.

Przeniesienie Openai na zgłaszanie wyników podkreśla intensywną presję na wykazanie przywództwa, szczególnie w okresie wewnętrznych wyzwań korporacyjnych. Dla Openai, osiągnięcie tego, co dyrektor generalny Sam Altman nazwał „marzeniem”, „Kiedy zaczęliśmy Openai, był to sen, ale nie taki, który wydawał się dla nas bardzo realistyczny,„ służy jako potężny obalenie narracji o traconej przewagie.

Co to znaczy dla przyszłości AI i nauki

te uzależnione uwzględnienie rozumowania, które nadal są w eksperymencie. Badacz Openai Alexander Wei zauważył, że osiągnięcie stanowi „wieloletnie wielkie wyzwanie w sztucznej inteligencji”, dodając „Jestem podekscytowany, że mogę podzielić się, że nasze najnowsze @openai eksperymentalne rozumowanie LLM osiągnęło wieloletnie wyzwanie w AI: Złoty Medal na poziomie najbardziej prestiżowego konkursu matematycznego na świecie…” Obie firmy planowało dostęp do zaufania testerów. Naukowiec w Google Deepmind wyraził pewność co do kolejnych kroków, mówiąc: „Jesteśmy bardzo pewni, że możemy wkrótce wprowadzić [model] w ręce naszych zaufanych testerów, zwłaszcza matematyków”. Celem jest umieszczenie tych narzędzi w ręce matematyków, aby pomóc im rozwiązać jeszcze trudniejsze problemy.

Podczas gdy bezpośredni nacisk kładziony jest na matematykę, implikacje są znacznie szersze. AI, która może uzasadnić ten poziom kreatywności i rygorów, może przyspieszyć odkrycia w nauce, inżynierii i badaniach, zbliżając nas o krok do ostatecznego celu Agi.

Categories: IT Info