A
még a meta platformok sem immunis az AI verseny megdöbbentő költségeivel. A társaság az elmúlt év egyes részeit a versenytársakhoz fordult, köztük a Microsoft, az Amazon és mások, és pénzügyi segítséget keresett a zászlóshajó láma nagy nyelvi modelljeinek kiképzéséhez-mondta négy személy, aki a Href=”https://www.theinformation.com/articles/meta-kk-Askazon-mezon-microsoft-funp-fund-láma”Target=”Target=”Target=”_ Artices/articles”Információk . Édesítőszerként a Meta nyilvánvalóan megvitatta, hogy a potenciális pénzügyi támogatóknak elmondják a Llama jövőbeli szolgáltatásfejlesztését. Ennek ellenére a kísérlet feltárja a vezető AI rendszerek építésével járó intenzív pénzügyi terhet, még a Meta mély zsebével rendelkező vállalatokra is nyomást gyakorolva, és jelzi a magas téteket a generatív AI-ben. 4-A Meta legújabb modelljei
A Meta finanszírozási partnereinek keresése új fényben adja meg a legutóbbi Llama 4 bejelentését. Ez a kiadás bevezette a Llama 4 Scout-ot (109b teljes paraméterek, 17B Active), amelynek célja az egy-GPU használatra, kivételesen nagy 10 millió token kontextus ablakkal-képesek egyszerre nagyjából 7,5 millió szót feldolgozni. Mindkettő a szakértők keverékét (MOE) architektúrát alkalmazza, egy olyan technikát, amely speciális alhálózatokat használ („szakértők”), ahol csak a szükséges feladatokat aktiválják, a művelet során nagyobb hatékonyságra irányulva, összehasonlítva a sűrű modellekkel, ahol az összes paramétert mindig használják.
alátámasztva, hogy ez a még nem átadott láma 4 behemoth, egy 2 trillió paraméter modell, amelyet belsőleg használnak desztillációhoz (kisebb modellek tanítása), amely akár 32 000 GPU-nál is képzést igényelt. Meta alkalmazott technikákat, például az FP8 pontosságát-egy alacsonyabb pontosságú számú formátum, amely felgyorsítja a számításokat-és az új építészeti alkatrészek, például az átlapolt forgó pozicionális beágyazások (IROPE) a hosszú szekvenciák hatékony kezelésére. Óriási számítási energia-és mérnöki erőfeszítések, közvetlenül magyarázva a megosztott beruházások potenciális igényét. Míg a MOE potenciális következtetési hatékonyságot kínál, az előzetes képzési költség továbbra is jelentős tényező. A társaság nyilvánosan kijelentette, hogy célja az LLMS észlelt politikai elfogultságának ellensúlyozása, megjegyezve: „Közismert, hogy minden vezető LLM-nek vannak problémái az elfogultsággal-különösképpen, történelmileg balra támaszkodtak, amikor a vitatott politikai és társadalmi témákra vonatkozik… ez az interneten rendelkezésre álló képzési adatok típusai.”Biztonsági eszközök, például a láma őrének és a kecskés vörös-ügyvezető rendszerének telepítése-a versenytársakkal kapcsolatos tesztelés módszere a sebezhetőség megtalálására. Ezek a finomhangoló és biztonsági rétegek további fejlesztési költségeket adnak. Az aktív perek, köztük egy olyan komikus, Sarah Silverman bevonása, azt állítják, hogy a cég láma modelleket képzett a kalóz könyvek hatalmas adatkészletein, amelyek olyan könyvtárakból származnak, mint például a Libgen a BitTorrent fájlmegosztáson keresztül. A bírósági dokumentumok állítólag a belső aggodalmat fedezték fel, amikor az egyik mérnök azt mondta: „A [meta tulajdonban lévő] vállalati laptopból származó torrentálás nem érzi jól magát.”
Az állítások 2025. március végén jelentkeztek, hogy a meta a Meta-t is újból felszámította az adatok 30%-át, a potenciálisan gyengítő „tisztességes felhasználási érveket”, és növekvő potenciális jogsértéssel vagy a jövőbeni forrás alternatíva. Az ilyen viták jelentős, ha kevésbé láthatóak az általános AI fejlesztési költségekhez. A modelleket röviddel a bevezetés után integrálták a Meta AI szolgáltatásokba a Whatsapp, az Instagram és a Facebook között. Ezenkívül letölthető és felhőpartnerekkel is elérhetővé tették őket-beleértve az Amazon Sagemaker Jumpstart-ot és a Microsoft az azítyure-ai curece és ai cure. Databricks -bár különösen egy egyedi kereskedelmi engedély alapján, nem tipikus nyílt forrású. Ez az ellenőrzött kiadási stratégia a Meta-t részt vesz a láma telepítésében, kiegyensúlyozva a nyitottságot a kereskedelmi érdekekkel. Ez megakadályozza, hogy az iPhone felhasználók az Apple AI íróeszközöket vagy a Genmoji-t használják a Facebook-on vagy az Instagram-on, és inkább a Meta láma-alapú alternatívái felé tolják őket. A Meta megközelítése különbözik az Apple magánéletére összpontosító, gyakran az eszközön, amelyen a Llama 4 politikai hajlandósága és az egyidejű, ellentmondásos, a harmadik féltől származó tényellenőrzés a Meta nyilvános megbeszélése, amelyet a Llama 4 politikai hajlandósága hangsúlyoz. href=”https://www.llama.com/events/lllamacon/signup/”Target=”_ üres”> llamacon esemény Április 29-én ütemezve, potenciálisan frissítéseket kínálva a hatalmas behemoth modellről vagy a következő Llama 4-V látásmodellről.