Echipa AI Meta este sub presiune intensă în urma lansării modelului R1 Deepseek, care a contestat industria AI cu eficiența și performanța sa fără precedent.
Postări anonime pe platforma de rețea profesională Blind dezvăluie tulburări în rândurile meta, inginerii descriind un efort frenetic de a înțelege și de a reproduce succesul lui Deepseek în timp ce se confruntă cu ineficiențe interne și greșeli de conducere.
Blind este o platformă anonimă de rețea profesională în care angajații pot împărtăși informații, discuta probleme la locul de muncă și rețea cu colegii din aceleași industrii sau diferite. Are un sistem de verificare în vigoare pentru a se asigura că utilizatorii sunt angajați reali ai companiilor pentru care pretind că lucrează.
înrudit: Cât de profundă r1 depășește chatgpt O1 sub sancțiuni, redefinirea eficienței AI folosind doar 2.048 gpus
orb este în primul rând popular în rând dar, de asemenea, se adresează angajaților din diverse sectoare.
un angajat meta anonim, POSTING Sub numele„ NGI “, a rezumat starea de spirit în cadrul Diviziei Genai din Meta:
„ A început cu Deepseek V3 [un model Deepseek lansat în decembrie 2024], care a redat Llama 4 deja în urmă în valori de referință. Nici măcar nu exagerez. Managementul este îngrijorat de justificarea costurilor masive ale Genai Org. Cum s-ar confrunta cu conducerea atunci când fiecare „lider” al Genai Org face mai mult decât ceea ce a costat să antreneze Deepseek V3 în întregime și avem zeci de astfel de „lideri”.
Comentariile angajatului evidențiază nemulțumirea internă a abordării Meta a dezvoltării AI, pe care mulți o descriu ca fiind excesiv de birocratică, intensivă în resurse și conduse de valori superficiale, mai degrabă decât de o inovație semnificativă. a expus aceste neajunsuri și a forțat o socoteală pentru unul dintre cei mai mari jucători ai industriei AI.
înrudit: llama ai sub foc-ceea ce meta nu vă spune despre „open source” Modelele
Deepseek R1 trimite unde de șoc, deși SUA Tech Sector
Modelul R1 Deepseek, lansat la 10 ianuarie 2025, a susținut peisajul AI global prin demonstrarea faptului Modelele de înaltă performanță pot fi dezvoltate la o fracțiune din costurile asociate de obicei cu astfel de proiecte.
Utilizarea GPU-urilor NVIDIA H800-jetoane de calitate-scăzută restricționate de controalele de export din SUA-ingineri de renunțare la antrenamentul a instruit modelul pentru sub 6 milioane de dolari, potrivit unei lucrări de cercetare lansate în decembrie 2024.
Acestea GPU-urile, a fost accelerat în mod intenționat pentru a se conforma sancțiunilor din SUA, a prezentat provocări unice, dar tehnicile de optimizare ale Deepseek au permis echipei să obțină performanțe comparabile cu modelele de lider din industrie.
reperele R1 includ un scor de 97,3% la Math-500 și un scor de 79,8% pe AIME 2024, plasându-l printre cele mai capabile sisteme AI din lume.
Eficiența Deepseek R1, care, de asemenea, parțial depășește modelul O1 al Openai, nu numai că a zguduit încrederea în giganții tehnologici din SUA, cum ar fi Meta, dar a declanșat și reacții semnificative ale pieței.
stocul NVIDIA a scăzut cu peste 13% în tranzacționarea premarket-ului în urma lansării modelului, iar Futuresul NASDAQ 100 a scăzut cu mai mult de 5%. Între timp, Deepseek a urcat pe primul loc pe Apple App Store din Apple, depășind chatgpt-ul lui Openai în descărcări.
Meta Engineers se bazează pe Instruirea scumpă a AI de calcul
în Meta, în meta, Inginerii au criticat încrederea companiei pe puterea de calcul brută, mai degrabă decât să urmărească inovația bazată pe eficiență.
Un angajat a remarcat asupra orbului: o mare parte din conducere nu are nici o idee (chiar și multă inginerie) despre tehnologia de bază și continuă să vândă „mai mult GPU=câștig” către conducere. Frustrarea cu cultura „alungarea impactului”, care o descrie ca o cursă pentru promoții, mai degrabă decât un angajament față de progrese semnificative.
Eforturile AI Meta s-au confruntat, de asemenea, cu controlul pentru lipsa lor de agilitate în comparație cu concurenții. Modelul R1 Deepseek nu este doar rentabil, ci și open-source, permițând dezvoltatorilor din întreaga lume să examineze și să se bazeze pe arhitectura sa.
Discuțiile oarbe dezvăluie, de asemenea, preocupări mai largi ale industriei. Angajații Google au recunoscut impactul perturbator al Deepseek, cu unul remarcând: „Este într-adevăr nebun ce face Deepseek. Nu este doar meta, ci luminează un incendiu în cadrul OpenAI, Google și Anthropic’s Ass. Ceea ce este un lucru bun, vedem în timp real cât de eficientă este o concurență deschisă pentru inovație.
Această transparență a atras laude din partea liderilor industriei, inclusiv a propriului om de știință șef AI, Yann LeCun, care a scris pe LinkedIn: „Deepseek a profitat de cercetări deschise și open source (de exemplu, Pytorch și Llama de la Meta). , Meta s-a concentrat pe investiții la infrastructură pe scară largă. CEO-ul Mark Zuckerberg a anunțat recent planurile de a implementa peste 1,3 milioane de GPU-uri în 2025 și de a investi 60-65 miliarde de dolari în dezvoltarea AI.
„Acesta este un efort masiv, iar în următorii ani, va conduce produsele și afacerile noastre de bază, va debloca inovația istorică și va extinde conducerea tehnologiei americane”, a spus Zuckerberg într-o declarație publică la începutul acestui an. Cu toate acestea, aceste planuri apar acum din ce în ce mai mult cu abordarea slabă, eficientă, demonstrată de Deepseek.
ascensiunea Deepseek a domnit, de asemenea, dezbateri asupra restricțiilor de export din SUA asupra tehnologiilor legate de AI în China Administrația Biden a implementat măsuri pentru a limita accesul Chinei la cipuri avansate, inclusiv GPU-urile H100 NVIDIA. Sancțiunile au avut efect deplin și concentrându-se pe eficiență, Deepseek a transformat constrângerile în avantaje. Aveți un decalaj de o singură dată în structura modelului și dinamica de instruire. Din acest motiv, trebuie să consumăm de patru ori mai multă putere de calcul pentru a obține același efect. Ceea ce trebuie să facem este să restrângem continuu aceste lacune”.
Pe măsură ce industria AI se confruntă cu implicațiile succesului Deepseek, Meta se confruntă cu o nevoie urgentă de adaptare. O schimbare către strategii mai eficiente, bazate pe inovație.