Vuosien ajan tekoälyn tutkimusta on hallinnut miljardeja, jotka kaatavat miljardeja massiivisiin AI-malleihin, olettaen, että pelkkä laskennallinen voima pitää ne eteenpäin. Mutta uusi Stanfordin yliopiston ja Washingtonin yliopiston projekti on haastava, usko. ja Deepseek.
Toisin kuin omistusoikeudet, jotka vaativat laajaa infrastruktuuria ja kuukausia, S1 hienosäätää alle 30 minuutissa käyttämällä vain 16 NVIDIA H100 GPU: ta, tutkijoiden mukaan.
liittyvä: halaaminen ottaa avoimen tutkimuksen avoimella tutkimuksella /p>
sen koodi, metodologia ja tietojoukko on asetettu saataville avoimen lähdekoodin github-arkisto , tekee siitä, että kenelle tahansa on tarkoitus tarkistaa, toistaa tai parantaa. Projekti herättää kriittisen kysymyksen AI-teollisuudelle: Onko monen miljardin dollarin budjetti, joka on edelleen tarpeen kilpailla korkeimmalla tasolla?/strong>
AI-jättiläiset, kuten Openai, Google ja Microsoft, ovat panostaneet voimakkaasti kyvystään kuluttaa kilpailijoita AI-mallikoulutuksessa ja infrastruktuurissa.
Openai’s O1-malli ja Googlen Gemini 2.0 Flash on suunniteltu tämän edun mielessä. S1: n kehitys todistaa kuitenkin, että korkean tason päättelyominaisuudet voidaan toistaa murto-osalla kustannuksista.
S1 Suurempi AI-järjestelmä Matematiikan ja päättelykysymykset. Kuten S1-tutkimuspaperi , “Rakennamme S1K: n, joka koostuu 1000 huolellisesti kuratoidusta kysymyksestä pariksi pariksi pariksi. Jäljet ja vastaukset, jotka on tislattu Gemini-ajattelukokeesta.”
Aiheeseen liittyvä: Google julkaisee Gemini 2.0 Pro Experimental and New 2.0 Flash-Lite AI-mallit
, kun taas Google tarjoaa Ilmainen sovellusliittymä pääsy tähän malliin, sen palvelusehdot kieltävät sen tulosten käyttämisen kilpailevien AI-mallien kehittämiseen. Mallit
Huolimatta siitä, että se on koulutettu suhteellisen pienellä tietojoukolla, S1 saavuttaa suorituskykytasot, jotka ovat verrattavissa Openain ja DeepSekin malleihin.
AIME24-vertailuarvossa, joka mittaa AI-matematiikan ongelmaa-Ratkaisukyky, S1 saavutti 56,7%: n tarkkuuspistemäärän, ylittäen Openain O1-esto, joka sai 44,6%. , malli osoittaa joitain rajoituksia laajemmassa tieteellisessä tiedossa. GPQA-Diamond-vertailuarvossa, joka sisältää edistynyttä fysiikkaa, biologiaa ja kemian ongelmia, S1 teki 59,6%, joka jää Openain ja Googlen malleihin.://winbuzzer.com/wp-content/uploads/2025/02/s1-32b-benchmarks-aime-2024-math-500-gpqa-diamond-urical.jpg”> S1-mallin suorituskyvyn vertailuarvot verrattuna johtaviin AI-malleihin Google ja Openai
Silti alle 30 minuutissa koulutetulle mallille pienellä laskemalla nämä tulokset haastavat oletuksen, että suuremmat tietojoukot ja pidemmät harjoitussyklit ovat aina välttämättömiä.
odottamaton temppu, että Parantaa AI-päättelyä
Tutkimus paljasti myös odottamattoman havainnon, joka paransi S1: n tarkkuutta. Itse mallin muokkaamisen sijasta he kokeilivat kehojen rakenteita.
Tutkimuksessa todetaan: “Kehitämme budjetin pakottamista testiajan laskennan hallitsemiseksi lopettamalla mallin ajatteluprosessin voimakkaasti tai pidentämällä sitä liittämällä’Odota’useita kertoja mallin sukupolvelle, kun se yrittää loppua. Tämä voi johtaa mallin tarkistamaan vastauksensa kaksinkertaisesti korjaamaan virheelliset päättelyvaiheet.”
yksinkertaisesti lisäämällä sana“ odota”kehotetun S1: hen viettämään enemmän aikaa vastauksen vastaamiseen ennen vastauksen viimeistelyä. Tämä lähestymistapa vastaa viimeaikainen testiajan skaalaustutkimus , jossa mallit parantavat tarkkuutta jakamalla jakamalla Lisää laskentaa monimutkaisiin tehtäviin sen sijaan, että reagoivat heti.
Voisiko OpenAi ja Google aloittaa AI-malliensa lukitsemisen? S1: n kaltaiset mallit esittävät haasteen yrityksille, jotka ovat investoineet voimakkaasti yksinoikeisiin AI-järjestelmiin.
Openai ja Google ovat väittäneet, että luotettavien ja turvallisten AI-mallien rakentaminen vaatii merkittäviä laskentaresursseja, perustelemalla niiden premium-palvelut ja rajoittavat pääsypolitiikat perustelemalla. >
Openai on jo osoittanut merkkejä tekniikan pääsyn kiristämisestä. Yhtiö rajoittaa tällä hetkellä syvän tutkimusominaisuutensa maksettuihin chatgpt pro-käyttäjiin rajoittaen ulkoisten AI-kehittäjien kykyä tutkia menetelmiä. Sillä välin Google asettaa tiukat nopeusrajat Gemini 2.0-sovellusliittymään ja kieltää nimenomaisesti koulutuksen kilpailevia AI-malleja sen tuotoksia käyttämällä.
S1: n kaltaisten hankkeiden kanssa, kuten S1 tai lailliset rajoitukset niiden AI-luomaiden tulosten estämiseksi muiden järjestelmien kouluttamiseen. Näiden sääntöjen täytäntöönpano avoimen lähdekoodin AI-tutkimusympäristöissä on kuitenkin erittäin vaikeaa.
AI: Avoimen tutkimuksen tai yritysten hallinnan tulevaisuus? AI-tutkimus etenee edelleen, avoimen lähdekoodin innovaatioiden ja omistusoikeuden AI-kehityksen välinen taistelu on tulossa voimakkaammaksi. Tislattujen AI-mallien, kuten S1 ja Sky-T1 menestys. eivät ole enää yksinoikeudella teknisten jättiläisten kanssa. Mutta riippumattomat tutkijat vastustavat sitä, että avoimen lähdekoodin mallit parantavat avoimuutta, jolloin asiantuntijat voivat tarkistaa ja hienosäätää AI-järjestelmiä ilman yritysvaikutuksia.
hallitukset ja sääntelyviranomaiset tarkkailevat tiiviisti näitä kehitystä. AI-päätöksenteko on toistaiseksi keskittynyt suurten mallejen hallintaan, mutta edullisten AI-replikaatiotekniikoiden syntyminen voisi siirtää keskustelun kohti tietojen käyttörajoituksia ja eettisiä näkökohtia.
S1: n vapauttaminen merkitsee muutosta, joka voisi muuttaa AI-teollisuutta. Jos tehokas päättely AI voidaan toistaa alle 50 dollaria, pienemmillä AI-tutkimusryhmillä ja startup-yrityksillä voi pian olla kyky kilpailla miljardin dollarin AI-yritysten kanssa. voi testata, muokata ja laajentaa sen ominaisuuksia. Kuitenkin, jos Openai, Google ja muut AI-laboratoriot näkevät tämän uhkana, ne voivat kuitenkin ajaa tiukempia API-käyttöoikeusvalvontaa, lisensointirajoituksia tai jopa oikeustoimia AI-tislausmenetelmiä vastaan.
Tulevaisuus määritetään Yritysten kontrolloidut, omistusmallit tai avaako AI-tutkimus jatkaa etenemistä, mikä tekee korkean tason AI-päättelystä kaikkien saataville? Kerro meille kommenteissa mitä mieltä olet.
hallitukset ja sääntelyviranomaiset tarkkailevat tiiviisti näitä kehitystä. AI-päätöksenteko on toistaiseksi keskittynyt suurten mallejen hallintaan, mutta edullisten AI-replikaatiotekniikoiden syntyminen voisi siirtää keskustelun kohti tietojen käyttörajoituksia ja eettisiä näkökohtia.
S1: n vapauttaminen merkitsee muutosta, joka voisi muuttaa AI-teollisuutta. Jos tehokas päättely AI voidaan toistaa alle 50 dollaria, pienemmillä AI-tutkimusryhmillä ja startup-yrityksillä voi pian olla kyky kilpailla miljardin dollarin AI-yritysten kanssa. voi testata, muokata ja laajentaa sen ominaisuuksia. Kuitenkin, jos Openai, Google ja muut AI-laboratoriot näkevät tämän uhkana, ne voivat kuitenkin ajaa tiukempia API-käyttöoikeusvalvontaa, lisensointirajoituksia tai jopa oikeustoimia AI-tislausmenetelmiä vastaan.
Tulevaisuus määritetään Yritysten kontrolloidut, omistusmallit tai avaako AI-tutkimus jatkaa etenemistä, mikä tekee korkean tason AI-päättelystä kaikkien saataville? Kerro meille kommenteissa mitä mieltä olet.