L’équipe IA de Meta est soumise à une pression intense suite à la sortie du modèle R1 de DeepSeek, qui a mis au défi l’industrie de l’IA avec son efficacité et ses performances sans précédent.
Des publications anonymes sur la plateforme de réseautage professionnel Blind révèlent des troubles dans les rangs de Meta, avec des ingénieurs décrivant un effort frénétique pour comprendre et reproduire le succès de DeepSeek tout en étant aux prises avec des inefficacités internes et des faux pas de leadership.
Blind est une plateforme de réseautage professionnel anonyme où les employés peuvent partager des informations, discuter de problèmes liés au lieu de travail et réseauter avec des pairs du même secteur ou de différents secteurs. Il dispose d’un système de vérification pour garantir que les utilisateurs sont de véritables employés des entreprises pour lesquelles ils prétendent travailler, et il est principalement populaire parmi les professionnels du secteur technologique.
Connexe : Comment DeepSeek R1 surpasse ChatGPT o1 sous sanctions, redéfinissant l’efficacité de l’IA en utilisant seulement 2 048 GPU
Un employé anonyme de Meta, publication sous le nom « ngi », résume l’ambiance au sein de la division GenAI de Meta :
« Tout a commencé avec DeepSeek V3 [un modèle DeepSeek sorti en décembre 2024], qui a rendu Llama 4 déjà en retard dans les benchmarks. Pour ajouter à l’insulte, c’était « une entreprise chinoise inconnue avec un budget de formation de 5,5 millions d’ingénieurs ». nous déplaçons frénétiquement pour disséquer DeepSeek et en copier tout ce que nous pouvons.
Je n’exagère même pas. La direction s’inquiète de justifier le coût massif de l’organisation GenAI. Comment feraient-ils face aux dirigeants alors que chaque « leader » de l’organisation GenAI gagne plus que ce qu’il a coûté pour former entièrement DeepSeek V3, et que nous avons des dizaines de ces « leaders ». DeepSeek R1 a rendu les choses encore plus effrayantes. Je ne peux pas révéler d’informations confidentielles, mais elles seront bientôt publiques de toute façon.
Cela aurait dû être une petite organisation axée sur l’ingénierie, mais comme un groupe de personnes voulait se joindre à la course à l’impact et gonfler artificiellement les embauches dans le secteur, org, tout le monde y perd.”
Les commentaires des employés soulignent le mécontentement interne à l’égard de l’approche de Meta en matière de développement de l’IA, que beaucoup décrivent comme trop bureaucratique, gourmande en ressources et motivée par des mesures superficielles plutôt que par une innovation significative.
La sortie de DeepSeek R1 a révélé ces lacunes et forcé l’un des plus grands acteurs de l’industrie de l’IA à rendre des comptes.
Connexe : LLaMA AI Under Fire – Ce que Meta ne vous dit pas sur les modèles « Open Source »
DeepSeek R1 envoie des ondes de choc dans le secteur technologique américain
DeepSeek Le modèle R1, publié le 10 janvier 2025, a bouleversé le paysage mondial de l’IA en démontrant que des modèles hautes performances peuvent être développés pour une fraction du coût généralement associé à de tels projets.
En utilisant des GPU Nvidia H800 (des puces de qualité inférieure limitées par les contrôles à l’exportation américains), les ingénieurs de DeepSeek ont formé le modèle pour moins de 6 millions de dollars, selon un document de recherche publié en décembre 2024.
Ces Les GPU, intentionnellement limités pour se conformer aux sanctions américaines, présentaient des défis uniques, mais les techniques d’optimisation de DeepSeek ont permis à l’équipe d’atteindre des performances comparables à celles des modèles leaders du secteur.
Les benchmarks de R1 incluent un score de 97,3 % sur MATH-500 et un score de 79,8 % sur AIME 2024, ce qui le place parmi les systèmes d’IA les plus performants au monde.
L’efficacité de DeepSeek R1, qui surpasse également partiellement le modèle o1 d’OpenAI, a non seulement ébranlé la confiance dans les géants américains de la technologie comme Meta, mais a également déclenché d’importantes réactions du marché.
L’action Nvidia a chuté de plus de 13 % lors des échanges avant commercialisation après la publication du modèle, et les contrats à terme sur le Nasdaq 100 ont chuté de plus de 5 %. Pendant ce temps, DeepSeek s’est hissé à la première place sur l’App Store américain d’Apple, dépassant ChatGPT d’OpenAI en termes de téléchargements.
Les ingénieurs Meta remettent en question la dépendance à l’égard d’une formation coûteuse en IA informatique
Au sein de Meta, les ingénieurs ont critiqué la dépendance de l’entreprise à la puissance de calcul brute plutôt que de rechercher une innovation axée sur l’efficacité.
Un employé a fait remarquer sur Blind : Une grande partie des dirigeants n’ont littéralement aucune idée (même beaucoup d’ingénierie) de la technologie sous-jacente et ils continuent de vendre”plus de GPU=gagner”à la direction.”Un autre a partagé frustration face à la culture de la « chasse à l’impact », la décrivant comme une course aux promotions plutôt que comme un engagement en faveur de progrès significatifs.
Les efforts de Meta en matière d’IA ont également été examinés de près en raison de leur manque d’agilité par rapport à leurs concurrents. Le modèle R1 de DeepSeek est non seulement rentable, mais également open source, permettant aux développeurs du monde entier d’examiner et de développer son architecture.
Les discussions à l’aveugle révèlent également des préoccupations plus larges de l’industrie. Les employés de Google ont reconnu l’impact perturbateur de DeepSeek, l’un d’eux notant: « Ce que fait DeepSeek est vraiment fou. Il n’y a pas que Meta, ils allument également le feu sous OpenAI, Google et Anthropic. Ce qui est une bonne chose, nous constatons en temps réel à quel point une concurrence ouverte est efficace pour l’innovation. »
Ce sentiment reflète la reconnaissance croissante du fait que les stratégies traditionnelles gourmandes en ressources ne peuvent plus garantir la domination dans le développement de l’IA.
Cette transparence a suscité les éloges des leaders de l’industrie, notamment Yann LeCun, scientifique en chef de l’IA chez Meta, qui a écrit sur LinkedIn :”DeepSeek a profité de la recherche ouverte et de l’open source (par exemple, PyTorch et Llama de Meta). Ils ont trouvé de nouvelles idées et les ont construites en s’appuyant sur le travail d’autres personnes.”
Mark Zuckerberg double ses investissements dans les infrastructures d’IA
Dans À l’opposé, Meta s’est concentré sur les investissements dans les infrastructures à grande échelle. Le PDG Mark Zuckerberg a récemment annoncé son intention de déployer plus de 1,3 million de GPU en 2025 et d’investir entre 60 et 65 milliards de dollars dans le développement de l’IA.
“Il s’agit d’un effort massif qui, dans les années à venir, stimulera nos produits et nos activités de base, débloquera des innovations historiques et étendra le leadership technologique américain”, a déclaré Zuckerberg dans une déclaration publique plus tôt cette année. Cependant, ces projets semblent désormais de plus en plus en contradiction avec l’approche allégée et axée sur l’efficacité démontrée par DeepSeek.
La montée en puissance de DeepSeek a également relancé les débats sur les restrictions américaines à l’exportation de technologies liées à l’IA vers la Chine. En 2021, l’administration Biden a mis en œuvre des mesures pour limiter l’accès de la Chine aux puces avancées, y compris les GPU H100 de Nvidia.
Cependant, la capacité de DeepSeek à obtenir des résultats de classe mondiale avec un matériel restreint souligne les limites de ces politiques en matière de stockage. GPU H800 avant que les sanctions n’entrent pleinement en vigueur et en se concentrant sur l’efficacité, DeepSeek a transformé les contraintes en avantages
Le fondateur Liang Wenfeng, un ancien hedger. gestionnaire de fonds, a décrit la stratégie de l’entreprise: « Nous estimons que les meilleurs modèles nationaux et étrangers peuvent présenter un écart d’un facteur dans la structure du modèle et la dynamique de formation. Pour cette raison, nous devons consommer quatre fois plus de puissance de calcul pour obtenir le même effet. Ce que nous devons faire, c’est réduire continuellement ces écarts”.
Alors que l’industrie de l’IA est aux prises avec les implications du succès de DeepSeek, Meta est confrontée à un besoin urgent de s’adapter. Les employés de l’entreprise ont clairement exprimé leurs frustrations, appelant à une évolution vers des stratégies plus efficaces et axées sur l’innovation. Pour l’instant, le modèle R1 de DeepSeek constitue une puissante démonstration d’ingénierie ingénieuse, remodelant la dynamique concurrentielle du développement mondial de l’IA.