W ubiegły weekend badacze z OpenAI wywołali ostry sprzeciw w mediach społecznościowych po przedwczesnym świętowaniu ważnego przełomu matematycznego w zakresie GPT-5. W serii usuniętych już postów na X kilku badaczy stwierdziło, że zaawansowany model rozwiązał słynne trudne problemy Erdő.

Jednak zwycięskie okrążenie zostało skrócone, gdy matematycy publicznie poprawili rekord. Wyjaśnili, że w ramach GPT-5 nie opracowano nowatorskich rozwiązań, lecz zamiast tego odnaleziono istniejące artykuły akademickie, o których badacze nie mieli pojęcia. Żenująca zmiana spotkała się z ostrą krytyką ze strony rywali z branży.

Sprawa ta podkreśla ogromną presję w sektorze sztucznej inteligencji, aby zaprezentować przełomowy postęp. Służy także jako mocne przestroga przed niekontrolowanym szumem w dziedzinie, w której w grę wchodzą miliardy dolarów.

Fałszywy przełom spotyka się z szybką korektą

Ekscytacja zaczęła się 18 października, kiedy wiceprezes OpenAI Kevin Weil i inni opublikowali na X, że GPT-5 rozwiązało 10 „wcześniej nierozwiązanych” problemów postawionych przez znanego matematyka Paula Erdősa.

Byłoby to oznaczało monumentalny skok w zakresie zdolności rozumowania generatywnej sztucznej inteligencji.

Paul Erdős (1913–1996) był węgierskim matematykiem, uznawanym za jedną z najbardziej płodnych i wpływowych postaci matematycznych XX wieku. Opublikował ponad 1500 artykułów naukowych z różnych dziedzin, takich jak teoria liczb, kombinatoryka, teoria grafów, teoria prawdopodobieństwa i teoria mnogości, często we współpracy z ponad 500 współautorami. 

Roszczenia zostały wyjaśnione niemal natychmiast. Matematyk Thomas Bloom, który prowadzi witrynę internetową Erdos Problems, publicznie zaprzeczył tej zapowiedzi, nazywając ją „dramatyczną błędną interpretacją”. Wyjaśnił, że problemy zostały wymienione na jego stronie jako „otwarte”, ponieważ on osobiście nie był świadomy istniejących rozwiązań.

Bloom wyjaśnił, że prawdziwym osiągnięciem GPT-5 było przeprowadzenie wyrafinowanego przeszukiwania literatury. Zauważył: „GPT-5 znalazł odniesienia, które rozwiązały te problemy, o których osobiście nie wiedziałem”. Model pełnił rolę asystenta badawczego, a nie przełomowego matematyka. Początkowe, sensacyjne twierdzenia zostały szybko usunięte lub zmienione.

Witam, jako właściciel/opiekun https://t.co/69gOJM7Ci7, jest to dramatyczne wprowadzenie w błąd. GPT-5 znalazł odniesienia, które rozwiązały te problemy, o których osobiście nie wiedziałem.

Stan „otwarty” oznacza tylko, że osobiście nie znam artykułu, który go rozwiązuje.

— Thomas Bloom (@thomasfbloom) 17 października 2025 r.

Rywale rzucają się na „żenującą” publiczną pomyłkę

To publiczne błędne zachowanie zapewniło wystarczającą amunicję konkurentom OpenAI. Szybkie i publiczne nagany ze strony rywali nie są zaskakujące w obliczu niezwykle konkurencyjnego krajobrazu sztucznej inteligencji.

Google, Meta i OpenAI toczą bitwę o talenty, klientów korporacyjnych i opinię publiczną.

Dyrektor generalny Google DeepMind, Demis Hassabis, bez ogródek ocenił X, stwierdzając po prostu: „to jest żenujące”.

to jest żenujące

— Demis Hassabis (@demishassabis) 18 października 2025

Jego firma niedawno porównała OpenAI z własnym, uzasadnionym osiągnięciem matematycznym.

Główny specjalista ds. sztucznej inteligencji w firmie Meta, Yann LeCun, był jeszcze bardziej stanowczy w swojej krytyce. Zasugerował, że OpenAI padło ofiarą własnego marketingu, żartując, że firma „została podniesiona przez własne karty GPTard”. Incydent dostarcza narracji o organizacji znajdującej się pod presją i podatnej na nieostrożność.

W odpowiedzi w odpowiedzi na tę reakcję badacze OpenAI, w tym Sebastien Bubeck, usunęli lub wycofali swoje początkowe, uroczyste posty.

Usunąłem post, nie chciałem oczywiście nikogo wprowadzić w błąd, myślałem, że sformułowanie jest jasne, przepraszam za to. Znaleziono jedynie rozwiązania w literaturze i to bardzo przyspiesza proces, ponieważ wiem, jak trudno jest przeszukiwać literaturę.

— Sebastien Bubeck (@SebastienBubeck) 18 października 2025

Podczas gdy Bubeck bronił modelu, mówiąc: „Wiem, jak trudno jest przeszukać literatury”, szkoda została wyrządzona. Ton triumfalny został zastąpiony defensywnym.

Szum a rzeczywistość: prawdziwa rola sztucznej inteligencji w matematyce

Ten odcinek jest podręcznikowym przykładem cyklu szumu dotyczącego sztucznej inteligencji, w którym obietnice technologii mogą przewyższyć jej obecne możliwości.

Analitycy od dawna ostrzegają, że dziedzina generatywnej sztucznej inteligencji zbliżamy się do „doliny rozczarowania” , gdy wzniosłe obietnice spotykają się z ograniczeniami świata rzeczywistego.

To ciśnienie nie dzieje się w próżni. Od miesięcy OpenAI przeżywa okres wewnętrznych zawirowań, podczas których firma ma trudności z utrzymaniem publicznej narracji o niezachwianym przywództwie. Aby utrzymać swoją pozycję, firma musi kreować wizerunek nieustannych innowacji.

Jak na ironię ten błąd kontrastuje z prawdziwym, niedawnym sukcesem OpenAI w matematyce. W lipcu firma ogłosiła, że ​​model eksperymentalny zdobył złoty medal na Międzynarodowej Olimpiadzie Matematycznej, co wymagało kreatywnych i rygorystycznych dowodów.

To osiągnięcie pokazało prawdziwy postęp w rozumowaniu sztucznej inteligencji, co sprawia, że ​​późniejszy niewymuszony błąd w problemach Erdősa jest jeszcze bardziej zagadkowy. Wygląda na to, że presja ogłoszenia kolejnej ważnej rzeczy doprowadziła do niepowodzenia podstawowej weryfikacji.

Pomimo żenującej przesady, wydarzenie to rzeczywiście podkreśliło praktyczną użyteczność GPT-5. Jak zauważył znany matematyk Terence Tao, najbardziej bezpośrednim potencjałem sztucznej inteligencji nie jest rozwiązywanie najtrudniejszych otwartych problemów.

Zamiast tego wierzy, że „generatywna sztuczna inteligencja może pomóc w «uprzemysłowieniu» matematyki i przyspieszyć postęp w tej dziedzinie”. Skutecznie odnajdując mało znane dokumenty, GPT-5 doskonale to udowodnił.

Zobacz Mastodon

To wydarzenie ostatecznie służy jako krytyczne przypomnienie dla całej branży. W miarę jak modele sztucznej inteligencji stają się coraz potężniejsze, potrzeba rygorystycznej walidacji naukowej staje się ważniejsza niż kiedykolwiek. W wyścigu o wysoką stawkę do AGI prawidłowe ustalenie faktów jest tak samo istotne, jak budowanie samej technologii.

Categories: IT Info