Az AI feletti verseny új csúcsot ért el, mivel mind a Google DeepMind, mind az Openai azt állítják, hogy modelljeik meghódíthatják a nemzetközi matematikai olimpiát (IMO), az emberiség egyik legnehezebb szellemi kihívása. href=”https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think–chialieves-gold-medal-standard-at-the-International-Mathematical-olympiad/”Target=”_ blank”> A 2025 versenyen a 2025 versenyen. A hír néhány nappal azután, hogy az Openai rivális kiderült, hogy a saját modellje nem hivatalosan elérte ugyanazt a legfelső szintű pontszámot. Bizonyítja, hogy az általános célú modellek most elit emberi szinten oldhatják meg a komplex matematikai problémákat, eszkalálódva a két AI vezető közötti rivalizálással. Twist
A Google DeepMind Advanced Gemini modellje, amely továbbfejlesztette a „Deep Think” technológiát, tökéletesen megoldotta a hat kivételesen nehéz problémát. A lehetséges 42 pontból 35-et szerzett, ami jó pontszámot mutat a aranyérmes küszöböt az idei versenyre. Az IMO elnöke professzor, Dr. Gregor Dolinar megerősítette az eredményt, kijelentve: „Megerősíthetjük, hogy a Google DeepMind elérte a nagyon vonzó mérföldkövet, és a lehetséges 42 pontból 35-et szerzett-ez egy aranyérmes pontszám. Megoldásaik sok szempontból meglepőek voltak.”Az IMO hivatalos nyilatkozata azonban csak a Google-t érvényesítette, nem pedig az AI rendszert, nem pedig az AI rendszert, nem pedig az AI rendszert jelentette. Közvetlen válasz az Openai-ra. Alig két nappal korábban az Openai megelőzően bejelentette, hogy saját kísérleti modellje 35 pontot szerzett ugyanazon problémákon, ez a lépés, amely felhívta az iparági figyelők figyelmét. 2024-ben rendszerei ezüstérmes szabványt értek el, de Jelentős emberi beavatkozási és speciális eszközöket igényelnek. nyelv. Feldolgozta a hivatalos problémás leírásokat és közvetlenül szigorú matematikai bizonyítékokat generált, mindegyik a szigorú 4,5 órás verseny határidőn belül. Bemutatja az AI érvelés rugalmasabb és erőteljesebb formáját. Az Openai kutatója, Noam Brown hangsúlyozta: „Ez nem egy IMO-specifikus modell. Ez egy indokló LLM, amely magában foglalja az új kísérleti általános célú technikákat”, és ezt kollégái visszhangzik. Ez azt sugallja, hogy a mögöttes modellek széles körben képesek, nem csak szűk matematikai szakemberek. Ez az üzemmód magában foglalja a párhuzamos gondolkodást, lehetővé téve a modellnek, hogy egyszerre felfedezze és kombinálja a több lehetséges megoldási útvonalat, ahelyett, hogy egyetlen, lineáris gondolati láncot folytatna. Az Openai számára, hogy elérje azt, amit Sam Altman vezérigazgató „álomnak” nevez, „Amikor először indítottuk az Openai-t, ez egy álom volt, de nem olyan, amely nagyon valósághűnek érezte magát”, erőteljes megcáfolásként szolgál az élét elveszítő társaság narratíváinak. Az Openai kutatója, Alexander Wei megjegyezte, hogy az eredmény egy „régóta nagy kihívás az AI-ben”, hozzátéve: „Nagyon örülök, hogy megoszthatom a legújabb @openai kísérleti érvelésünket, az LLM-et hosszú távú nagy kihívást ért el az AI-ben: aranyérmes szintű előadás a világ legrosszabb matematikai versenyén.”Mindkét társaság azt tervezi, hogy megbízható tesztelők számára hozzáférést biztosít a bizalommal rendelkező tesztelőkhöz. A Google Deepmind tudósának bizalmát fejezte ki a következő lépésekről, mondván:”Nagyon bízunk benne, hogy hamarosan a modellt a megbízható tesztelők, különösen a matematikusok kezébe hozhatjuk.”A cél az, hogy ezeket az eszközöket a matematikusok kezébe tegyék, hogy segítsék őket még nehezebb problémák megoldásában. Az AI, amely a kreativitás és a szigor ilyen szintjével érhető el, felgyorsíthatja a felfedezéseket a tudomány, a mérnöki munka és a kutatás területén, egy lépéssel közelebb hozva az Agi végső céljához.