edes metaalustat eivät ole immuuneja AI-kilpailun hämmästyttäville kustannuksille. Yhtiö vietti viime vuoden osia lähestyessään kilpailijoita, mukaan lukien Microsoft, Amazon ja muut, etsimällä taloudellista apua lippulaiva LLAMA LAGE-mallien kouluttamiseen, toteaa, että keskusteluista . Makeutusaineena Meta ilmeisesti keskusteli potentiaalisten finanssituureille sananvapauden antamisen LLAMA: n tulevaisuuden ominaisuuksien kehittämisessä. Silti yritys paljastaa intensiivisen taloudellisen taakan, joka liittyy johtavien AI-järjestelmien rakentamiseen, painostamaan jopa yrityksiä, joilla on Meta’s Deep Pockets ja merkitsee korkeat panokset generatiivisessa ai. Meta: n uusimmat mallit

Meta: n rahoituskumppaneiden Search for Funding Partners antaa äskettäisen Llaama 4-ilmoituksensa uudessa valossa. Tämä julkaisu esitteli Llaama 4 Scout (109b: n kokonaisparametrit, 17b aktiivinen), jonka tavoitteena oli yhden GPU: n käyttöön poikkeuksellisen suurella 10 miljoonalla token-kontekstiikkunalla-pystyy käsittelemään noin 7,5 miljoonaa sanaa kerralla. Molemmat käyttävät asiantuntijoiden seoksen (MOE) arkkitehtuuria, tekniikkaa, jossa käytetään erikoistuneita alaverkkoja (‘asiantuntijoita’), joissa vain tarvittavat toimenpiteet aktivoidaan, pyrkivät toiminnan aikana parempaan tehokkuuteen verrattuna tiheisiin malleihin, joissa kaikkia parametreja käytetään aina.

Näiden perustana on vielä vapautettu Llaama 4 behemoth, 2 biljoonan parametrimalli, jota käytetään sisäisesti tislaamiseen (pienempien mallien opettaminen), joka vaati koulutusta jopa 32 000 GPU: lla. Metaan käytettyjä tekniikoita, kuten FP8-tarkkuus-alhaisemman tarkkuuden numeromuoto, joka nopeuttaa laskelmia-ja uusia arkkitehtonisia komponentteja, kuten lomitettuja kiertopaikan upotuksia (IROPE) käsittelemään pitkiä sekvenssejä tehokkaasti. Laskennallinen voima-ja tekniikkapyrkimys selittää suoraan yhteisten sijoitusten potentiaalista tarvetta. Vaikka MOE tarjoaa potentiaalista päätelmän tehokkuutta, etukäteen koulutuskustannukset ovat edelleen merkittävä tekijä.

kehitysesteet ja tietokysymykset

RAW-laskennat, meta omistautuneet resurssit LLAMA 4: n virittämiseen tietyille tuotoksille ja turvallisuudelle. Yhtiö totesi julkisesti tavoitteensa vastaamisen LLMS: ssä havaitut poliittiset puolueellisuudet huomauttaen: “On hyvin tiedossa, että kaikilla johtavilla LLM: llä on ollut puolueellisuutta koskevia ongelmia-erityisesti ne ovat historiallisesti nojautuneet vasemmalle, kun se tulee keskusteltuihin poliittisiin ja sosiaalisiin aiheisiin. Tämä johtuu Internetissä käytettävissä olevista koulutustiedoista.”Turvallisuustyökalujen, kuten Llaama Guard ja Goat Red Teaming System-käyttöönotto-menetelmä vastustajien testaamiseksi haavoittuvuuksien löytämiseksi. Nämä hienosäätö-ja turvallisuuskerrokset lisäävät kehityskustannuksia. Aktiiviset oikeusjutut, mukaan lukien yksi koomikko Sarah Silverman, väittävät, että yritys koulutti LLAMA-malleja laittomien kirjojen massiivisiin tietojoukkoihin, jotka on saatu Libgenin kaltaisista kirjastoista BitTorrent-tiedostojen jakamisen kautta. Tuomioistuimen asiakirjat paljastivat sisäisen pelon, kun yksi insinööri lainasi sanoneen: “[Metaomistaman] yritys kannettavan tietokoneen torjunta ei tunne oikeutta.”

maaliskuun lopulla 2025 esitettyjä väitteitä, että meta on saattanut käyttää uudelleen noin 30% näistä tiedoista, potentiaalisesti heikentävän”oikeudenmukaisen käyttöä”ja kasvattamista koskevaa tietoa. Tällaiset kiistat voisivat edustaa merkittävää, jos vähemmän näkyviä AI-kehityskustannusten kuljettajaa. Mallit integroitiin Meta AI-ominaisuuksiin WhatsAppissa, Instagramissa ja Facebookissa pian julkaisun jälkeen. Ne asetettiin myös ladattaviin ja Cloud Partnersin kautta-mukaan lukien Amazon Sagemaker JumpStart ja Microsoftin Databricks -Vaikka etenkin mukautetun kaupallisen lisenssin alla, ei tyypillinen avoimen lähdekoodin. Tämä hallittu julkaisustrategia pitää metaan mukana LLAMA: n käyttöönotossa, tasapainottamalla avoimuutta kaupallisilla etuilla.

META: n keskittyminen edelleen omaan AI: iin oli sen siirto, joka ilmoitettiin estämään Applen järjestelmän laajuiset Apple Intelligence-ominaisuudet Metan iOS-sovelluksissa. Tämä estää iPhonen käyttäjiä käyttämästä Applen AI-kirjoitustyökaluja tai Genmojia Facebookin tai Instagramin sisällä, työntämällä heitä kohti Meta-Lama-pohjaisia ​​vaihtoehtoja sen sijaan.

Tämä kilpailukykyinen liike tapahtui huolimatta aikaisemmasta, epäonnistuneesta neuvottelusta vuoden 2010 puolivälissä mahdollisista AI-kumppanuuksista Meta: n ja Applen välillä, ilmoitetun päättyvän yksityisyyden erimielisyyksiin. Meta-lähestymistapa eroaa myös Applen yksityisyyttä keskittyneemmästä, usein laitteessa, erottelusta, jota korostetaan Meta: n julkisella keskustelulla Llam 4: n poliittisten taipumisten virittämisestä ja sen samanaikaisesta, kiistanalaisesta kolmannen osapuolen tosiasioiden tarkistamisesta Yhdysvalloissa. href=”https://www.llama.com/events/llamacon/signup/”Target=”_ tyhjä”> Llamacon-tapahtuma

Categories: IT Info