metaalustat viivästyvät merkittävästi lippulaiva LAMA 4 Behemoth AI-mallia. Yhtiö työntää debyyttinsä alkukesästä syksyyn 2025 tai uudemmaksi, Wall Street Journal ilmoitettu . Tämä takaisku johtuu taisteluista suuren kielen mallin ominaisuuksien parantamiseksi. Sisäiset pelot siitä, että sen suorituskyky ei täytä julkisia lausuntoja Uutiset saivat Meta: n osakekannan jopa 3,2%. 

Tämä viive on kriittinen. Se merkitsee AI: n etenemisen mahdollista hidastumista ja herättää kysymyksiä Metan suunnasta valtavista menoista huolimatta. Yhtiö suunnittelee jopa 72 miljardia dollaria investointeja tänä vuonna, pääosin AI: lle. Wall Street Journal-lehden mukaan sisäinen turhautuminen on asennettu. Vanhemmat johtajat syyttävät Llaama 4-mallien tiimiä edistymisen puutteesta behemothissa.

He harkitsevat myös AI-tuoteryhmän “merkittäviä hallintomuutoksia”. Meta: n toimitusjohtaja Mark Zuckerberg ei ole julkisesti asettanut behemothille aikajanaa. Yhtiö voisi kuitenkin silti valita aikaisemman, rajoitetun julkaisun. Meta-tiedottaja kieltäytyi kommentoimasta Wall Street Journal-lehteä viivästyksestä. Tämä olisi linjassa Metan ensimmäisen AI-kehittäjäkonferenssin kanssa, ennen kuin sisäinen tavoite siirtyi kesäkuuhun. Nyt sen tulevaisuus on vähemmän selkeä. Wall Street Journalin lähteet osoittavat, että metainsinöörit ja tutkijat ovat huolissaan. He pelkäävät, että Behemothin suorituskyky ei vastaa yrityksen aiempia väitteitä sen ominaisuuksista.

Tätä huolta vahvistaa aikaisemmat kysymykset. Tiedot aiemmin ilmoitetut ongelmat viimeaikaisten Llaam-mallien kanssa. Meta tunnusti myös erityisesti optimoidun LLAMA-mallin lähettämisen huhtikuussa olevalle tulostaululle, ei julkisesti saatavilla olevalle versiolle. Laama 4 on ollut Sekalaisten laaturaporttien ja tuloksien vastaanottaminen kilpailevista vertailuarvoista, jotka aiheuttavat epäilyksiä . Meta: n Ahmad al-Dahle, jonka mukaan muuttujan laatu tarve”vakauttaa toteutukset”, kuten hän totesi x. Kuulemme jo paljon hienoja tuloksia, jotka ihmiset saavat näiden mallien kanssa.

, joka sanoi, kuulemme myös joitain raportteja sekalaisesta laadusta eri palveluissa. Koska pudotimme mallit heti, kun ne olivat…

-Ahmad al-Dahle (@ahmad_al_dahle)

Behemothin ja muiden LLAMA-mallien kehitys on myös nähnyt merkittäviä tiimin muutoksia, joista yksitoista 14 alkuperäisestä LLAMA Paper-tutkijaa oli poistunut metasta. Eri joukkue käsittelee nyt seuraavia Llaama-versioita.

Nykyisistä haasteista huolimatta Meta’s AI-blogi korosti 5. huhtikuuta Behemothin varhaisen lupauksen, kun se oli”edelleen koulutusta”. Yhtiö totesi opettajamallinsa, Llaama 4 Behemothin, “Overstermit GPT-4,5, Claude Sonnet 3.7 ja Gemini 2.0 Pro STEM-keskittyvissä vertailuarvoissa, kuten Math-500 ja GPQA Diamond.”Viesti mainitsi myös aikomuksen jakaa enemmän teknisiä yksityiskohtia myöhemmin.

AI-teollisuus on laajempi viivästykset

Meta-tilanne Behemothin kanssa ei ole ainutlaatuinen. Se heijastaa laajempaa viivästys-ja uudelleenkalibrointitapaa AI-sektorilla. Openain ennakoitu GPT-5, joka alun perin odotettiin vuoden 2010 puolivälissä, kohtasivat kehityssuuntauksia ja ilmeisesti julkaisuun GPT-4.5: ksi, kun OpenAI käytti GPT-5-nimeä tulevalle ajattelumallille nyt. Openain toimitusjohtaja Sam Altman selvitti myöhemmin helmikuussa, että malli, jolla oli suuria läpimurtoja, oli vielä kuukausia. Samoin Antropisin suurempi Claude 3.5 OPUS-malli on edelleen julkistamaton, vaikka yritys totesi aiemmin olevan “tulossa pian”. New Yorkin yliopiston tietotekniikan keskuksen apulaisprofessori Ravid Shwartz-Ziv kertoi Wall Street Journalille, että nyt”edistyminen on melko pieni kaikissa laboratorioissa, kaikissa malleissa”. Gene Munster of Deepwater Asset Management, kommentoi behemothin viivettä CNBC-televisio , karakterisoi sen meta:”Se on musta silmä, mutta ei muuta heidän mahdollisuuksiaan.”AI-kilpailun taloudelliset paineet korostettiin raporteilla, joiden mukaan Meta oli hakenut ulkoista rahoitusta LLAMA-kehitykselle Amazonin ja Microsoftin kaltaisilta kilpailijoilta, joka on “Llaama-konsortiona”. Aktiiviset oikeusjutut, kuten yksi koomikko Sarah Silverman, väittää, että yritys koulutti LLAMA-malleja merirosvojen kirjojen massiivisiin tietojoukkoihin. Tuomioistuimen asiakirjat lainasivat jopa nimeämätöntä metainsinööriä, joka ilmaisee levottomuutta ja totesi, että “[Meta-omistamasta] yrityskannettavasta tietokoneesta ei tunne oikein.”

nämä kysymykset yhdessä Meta: n kilpailustrategioiden rinnalla, kuten sen siirtyminen Applen järjestelmän laajuiseen Apple Intelligence-ominaisuuksiin sovelluksissa, kuvaavat haasteellista terrainia.

Categories: IT Info