/h3>
Het R1-model van DeepSeek is een mijlpaal in AI-innovatie en klimt snel naar de eerste plaats in de Amerikaanse App Store van Apple, slechts enkele dagen na de release. De app biedt transparantie in zijn redeneerprocessen en wordt geprezen om zijn vermogen om complexe vragen efficiënt op te lossen. Gebruikersrecensies benadrukken de toegankelijkheid en betrouwbaarheid ervan, in contrast met de resource-intensieve benaderingen van Amerikaanse tegenhangers.
Het model werd getraind met behulp van 2.048 Nvidia H800 GPU’s voor een totaalbedrag van minder dan $6 miljoen, volgens een rapport uit december 2024 onderzoeksartikel uitgegeven door DeepSeek. Deze GPU’s, opzettelijk ontworpen met beperkte mogelijkheden om te voldoen aan de Amerikaanse exportbeperkingen, vormden unieke uitdagingen.
Toch hebben de technici van DeepSeek nieuwe optimalisatietechnieken ontwikkeld om de computer-en geheugenvereisten te minimaliseren, waardoor prestatiebenchmarks van 97,3% op MATH-500 en 79,8% op AIME 2024 werden behaald.
Oprichter Liang Wenfeng, een voormalig hedgefondsmanager beschreef de strategie van het bedrijf als volgt: “Wij schatten dat de beste binnenlandse en buitenlandse modellen een kloof van één factor kunnen hebben in de modelstructuur en de trainingsdynamiek. Om deze reden moeten we vier keer meer rekenkracht verbruiken om hetzelfde effect te bereiken. Wat we moeten doen is deze gaten voortdurend verkleinen”[36Kr].
Rimpeleffecten op de mondiale markten
De vrijgave van R1 veroorzaakte een scherpe uitverkoop in mondiale technologieaandelen Nvidia, waarvan de GPU’s algemeen worden beschouwd als essentieel voor de ontwikkeling van AI, zagen hun waardering met miljarden dalen href=”https://www.cnbc.com/quotes/ASML?qsearchterm=ASML%20Holding”>ASML Holding NV leed ook een daling van 11%, terwijl Nasdaq 100-futures handelsvolumes registreerden die vier keer zo hoog waren als het daggemiddelde Beleggers herbekijken begin maandag de financiële fundamenten van de AI-sector, die het afgelopen jaar voor een aanzienlijke groei van de technologieaandelen heeft gezorgd.
De gevolgen reiken verder dan de VS, met Chinese AI-gerelateerde aandelen zoals Merit Interactive Co. stijgt met maar liefst 20% als reactie op het succes van DeepSeek. De Hang Seng Tech Index steeg vóór het nieuwe maanjaar en weerspiegelt optimisme over de groeiende aanwezigheid van China op het gebied van AI-innovatie.
De geopolitieke dimensie: sancties en innovatie
De opkomst van DeepSeek is een directe reactie op de Amerikaanse exportcontroles die bedoeld zijn om de toegang van China tot geavanceerde technologieën te beperken. Sinds 2021 hebben deze beperkingen tot doel de ontwikkeling van concurrerende AI-systemen in China te voorkomen door de toegang tot de allernieuwste hardware te beperken.
Het vindingrijke gebruik van H800 GPU’s door DeepSeek heeft echter aangetoond dat innovatie zelfs onder strikte voorwaarden kan gedijen beperkingen.
Liangs strategie om beperkte GPU’s aan te leggen voordat de sancties volledig van kracht werden, was cruciaal. Door zich te concentreren op efficiëntie in plaats van op brute rekenkracht, lieten de ingenieurs van DeepSeek zien hoe beperkingen creatieve probleemoplossing kunnen stimuleren.
Yann LeCun, Chief AI Scientist van Meta, prees het open-source ethos achter de ontwikkeling van R1 en zei: “DeepSeek heeft geprofiteerd van open onderzoek en open source (bijvoorbeeld PyTorch en Llama van Meta). Ze kwamen met nieuwe ideeën en bouwden deze voort op het werk van anderen.”
Implicaties voor Amerikaanse technologiegiganten
Het succes van het R1-model van DeepSeek vormt ongemakkelijke vragen voor Amerikaanse technologieleiders als Meta en Microsoft, die miljarden hebben geïnvesteerd in de AI-infrastructuur, Mark Zuckerberg, schetste onlangs de ambitieuze plannen van het bedrijf om meer dan 1,3 miljoen GPU’s in te zetten 2025, waarin staat: “We zijn van plan dit jaar $60-65 miljard te investeren in investeringen en tegelijkertijd onze AI-teams aanzienlijk te laten groeien, en we hebben het kapitaal om de komende jaren te blijven investeren.”
Een nieuw tijdperk voor AI-innovatie
De toewijding van DeepSeek aan open-source samenwerking heeft het bedrijf onderscheiden van industriële reuzen. Door de architectuur en trainingsmethoden van R1 te publiceren, heeft het bedrijf ontwikkelaars over de hele wereld in staat gesteld zijn werk te repliceren of te verbeteren.
Deze transparantie staat in contrast met het propriëtaire karakter van platforms zoals OpenAI’s ChatGPT, wat een potentiële verschuiving naar meer toegankelijke AI-innovatie benadrukt.
De prestaties van DeepSeek herinneren ons eraan dat technologisch leiderschap niet alleen wordt gedefinieerd door financiële middelen. Of dit nu het einde markeert van de zeepbel op de Amerikaanse tech-aandelenmarkt of een nieuw hoofdstuk in de mondiale AI-concurrentie markeert, één ding is duidelijk: de spelregels zijn aan het veranderen.