Ang lahi para sa supremacy ng AI ay umabot sa isang bagong rurok, dahil ang parehong Google DeepMind at OpenAi ngayon ay inaangkin na ang kanilang mga modelo ay maaaring lupigin ang internasyonal na matematika na Olympiad (IMO), isa sa pinakamahirap na mga hamon sa intelektwal na sangkatauhan. href=”https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-fficially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/”target=”_ blangko”Ang balita ay nakarating lamang sa mga araw matapos na isiwalat ng karibal na si Openai ang sariling modelo ay hindi opisyal na nakamit ang parehong top-tier score. Pinapatunayan nito na ang mga modelo ng pangkalahatang layunin ay maaari na ngayong malutas Twist
Nakakuha ito ng 35 sa isang posibleng 42 puntos, isang marka na rin sa loob ng gintong medalya para sa kumpetisyon ng taong ito . Kinumpirma ni Imo President Prof. Dr. Gregor Dolinar ang nakamit, na nagsasabi,”Maaari naming kumpirmahin na ang Google Deepmind ay umabot sa higit na nais na milestone, na kumita ng 35 mula sa isang posibleng 42 puntos-isang marka ng gintong medalya. Ang kanilang mga solusyon ay nakakagulat sa maraming aspeto.”Gayunpaman, ang opisyal na pahayag ng IMO ay nilinaw lamang ito napatunayan ang mga solusyon, hindi ang sistema ng AI mismo . Isang direktang tugon sa openai. Dalawang araw lamang ang nakaraan, inanunsyo ng Openai na preemptively ang sarili nitong eksperimentong modelo ay umiskor din ng 35 puntos sa parehong mga problema, isang hakbang na nakakuha ng pansin ng mga tagamasid sa industriya. Noong 2024, ang mga system nito ay umabot sa isang pamantayan ng pilak-medalidad ngunit Kinakailangan ang makabuluhang interbensyon ng tao at dalubhasang mga tool . natural na wika. Pinoproseso nito ang opisyal na paglalarawan ng problema at nabuo ang mahigpit na mga patunay na matematika nang direkta, lahat sa loob ng mahigpit na 4.5-oras na limitasyon ng oras ng kumpetisyon. Ipinapakita nito ang isang mas nababaluktot at malakas na anyo ng pangangatuwiran ng AI. Binigyang diin ni Openai na si Noam Brown,”Hindi ito isang modelo na tiyak sa IMO. Ito ay isang pangangatuwiran na LLM na nagsasama ng mga bagong diskarte sa pangkalahatang layunin,”isang sentimento na binigkas ng kanyang mga kasamahan. Ipinapahiwatig nito ang mga pinagbabatayan na mga modelo ay malawak na may kakayahang, hindi lamang makitid na mga espesyalista sa matematika. Ang mode na ito ay nagsasama ng kahanay na pag-iisip, na nagpapahintulot sa modelo na galugarin at pagsamahin ang maraming mga potensyal na landas ng solusyon nang sabay-sabay, sa halip na ituloy ang isang solong, linear chain ng pag-iisip. Para sa OpenAi, ang pagkamit ng kung ano ang tinawag ng CEO na si Sam Altman na isang”panaginip,””Noong una nating sinimulan ang OpenAi, ito ay isang panaginip ngunit hindi isa na nadama na napaka-makatotohanang sa amin. Nabanggit ng Openai Researcher na si Alexander Wei na ang tagumpay ay kumakatawan sa isang”matagal na hamon sa AI,”pagdaragdag ng”Natutuwa akong ibahagi na ang aming pinakabagong @opena na pang-eksperimentong pangangatuwiran na LLM ay nakamit ang isang matagal na hamon sa AI: Ang Gold Medal-Level Performance sa Pinaka-World’s Most Prestigious Math Competition… Ang parehong mga kumpanya ay nagplano na magbigay ng pag-access sa mga pinagkakatiwalaang mga tester bago ang mas malawak na paglaya. Ang DeepMind, ay nagpahayag ng tiwala tungkol sa mga susunod na hakbang, na nagsasabing,”Kami ay tiwala na maaari naming dalhin ang [modelo] sa mga kamay ng aming mga pinagkakatiwalaang mga tester sa lalong madaling panahon, lalo na ang mga matematiko.”Ang layunin ay upang ilagay ang mga tool na ito sa mga kamay ng mga matematika upang matulungan silang malutas kahit na mas mahirap na mga problema.
Habang ang agarang pokus ay nasa matematika, ang mga implikasyon ay mas malawak. Ang isang AI na maaaring mangatuwiran sa antas na ito ng pagkamalikhain at mahigpit ay maaaring mapabilis ang mga pagtuklas sa buong agham, engineering, at pananaliksik, na nagdadala sa amin ng isang hakbang na mas malapit sa pangwakas na layunin ng AGI.