DeepSeek R1-0528: Det tyske firmaet slipper versjon av DeepSeek's AI-modell som kjører dobbelt så raskt

Tysk IT-firma TNG Technology Consulting har gitt ut en ny open source AI-modell som angivelig er dobbelt så raskt som DeepSeek R1-0528-varianten fra mai den er basert på. Utgitt denne uken på hugging face plattform , dypesex-t-tål-en-en-kropp-en-kroker-en-kodus. Teknikk.

Denne metoden slår sammen komponenter fra tre forskjellige overordnet modeller, inkludert de originale DeepSeek R1-og V3-modellene. Resultatet er en modell som beholder resonnement på høyt nivå mens de genererer svar med 60% færre symboler, drastisk kutte inferenskostnader og responstider for utviklere.

AI-utviklersamfunnet har svart med entusiasme. På X, Hugging Face Senior Leader Vaibhav Srivastav skrev: “Damn! DeepSeek R1T2-200% raskere enn R1-0528 & 20% raskere enn R1,”

montering-av-ekspert: En ny tilnærming til modellskaping

TNGs “Assembly-of-Experts” (AOE)-metode representerer en betydelig avgang fra konvensjonell modellskaping. I stedet for å finjustere eller omskolere, bygger AOE en ny modell ved selektivt å slå sammen vektspensorene fra flere pre-trente foreldre, en prosess detaljert i en nylige forskningspapiret

Denne tilnærmingen er forskjellig fra blandingen av ekseks (MOE) arkitektur som brukes i foreldremodellene. Mens MOE er en runtime-arkitektur som aktiverer en brøkdel av modellens”eksperter”for en gitt oppgave, er AOE en konstruksjonsteknikk som baker den kombinerte ekspertisen til en enkelt, mer effektiv sluttmodell.

Benchmarks: Balancing Raw Intelligence med ekstrem

Den praktiske fordelen av denne teknikken med ekstrem. I følge benchmarks publisert av TNG, oppnår R1T2 Chimera mellom 90% og 92% av resonnementets ytelse til den mektigste forelderen, R1-0528, på krevende tester som AIME og GPQA.

Disse benchmarkene er designet for å teste sofistikerte, multirende resonnement på at det går langt utover enkel kunnskap. Modellens viktigste fordel er imidlertid konsisthet. Det genererer riktige svar ved å bruke omtrent 40% av symbolene som kreves av R1-0528, en 60% reduksjon i utgangslengde.

Dette oversettes direkte til raskere responstid og lavere beregningskostnader, noe som gjør det over dobbelt så raskt i praktiske termer. Denne effektiviteten var et kjennetegn for sin V3-forelder. Etter utgivelsen av mars sa utvikleren Awni Hannun om det forbedrede mars 2025 varianten av v3 “det er det meste som noensinne Modell Modell Modell On Noe Ever Modell On Noing Noe Ever Modell On Noe Ever Modell of My) href=”https://twitter.com/awnihannun/status/1904177084609827054″Target=”_ Blank”> Kjører den på sin bærbare datamaskin . R1T2 Chimera podet vellykket denne effektiviteten på en sterkere resonnementskjerne.

En innovasjon midt i geopolitisk og bedriftsmavvind

Utgivelsen av denne svært effektive modellen kommer på en turbulent tid for sin opprinnelige skaper, Deepseek AI. Det kinesiske firmaets momentum har stoppet, med sin forventede R2-modell nå på ubestemt tid forsinket. Dette skyldes både intern ytelse misnøye og virkningen av amerikansk eksportkontroll på viktige AI-brikker.

Samtidig vender DeepSeek overfor montering av regulatorisk trykk i Vesten. I Tyskland har Berlins databeskyttelsesmyndighet bedt Apple og Google fjerne DeepSeek-appen fra butikker, og merket den”ulovlig innhold”på grunn av ulovlig dataoverføringsrisiko til Kina.

Dette følger en forbannende aprilrapport fra US House Select Committee on the CCP. Komiteens styreleder John Moolenaar uttalte:”Denne rapporten gjør det klart: DeepSeek er ikke bare en annen AI-app-det er et våpen i det kinesiske kommunistpartiets arsenal…”, som påstår at appen er et verktøy for spionasje og datahøsting. Disse eksterne pressene skaper et sammensatt bakteppe for enhver teknologi avledet fra DeepSeeks arbeid.

Enterprise-distribusjon: Tilgjengelighet, lisensiering og begrensninger

For enterprise tekniske ledere, R1T2 Chimera presenterer et omleggende alternativ. MIT-lisensen gir maksimal fleksibilitet for privat hosting, tilpasning og distribusjon i kommersielle applikasjoner uten lisensavgift. Den betydelige reduksjonen i inferenskostnader gjør det ideelt for miljøer med høy gjennomstrømning eller sanntid.

Kostnadsbesparelsen er spesielt relevante for applikasjoner som sanntids kundesupport chatbots, storskala dokumentoppsummering eller intern kunnskapsbase-spørsmål, der både hastighet og budsjett er kritisk. Den plasserer modellen i en ønskelig kvadrant på ytelses-versus-kostnadskurven.

Imidlertid bemerker TNG noen nåværende begrensninger. Modellen er ennå ikke anbefalt for brukssaker som krever funksjonsanrop eller verktøybruk, noe som betyr at den ikke kan interagere pålitelig med eksterne API-er. Dette begrenser bruken i komplekse, automatiserte arbeidsflyter, selv om fremtidige oppdateringer kan adressere dette gapet.

Videre råder selskapet europeiske brukere til å vurdere deres samsvar med EU AI Act, som har utenomjordisk rekkevidde. Til tross for disse advarslene, markerer frigjøringen av R1T2 Chimera med TNG et bemerkelsesverdig trinn i modulær AI-utvikling, og tilbyr et glimt inn i en fremtid der modeller er samlet, ikke bare trent.

DeepSeek R1-0528: Det tyske firmaet slipper versjon av DeepSeek’s AI-modell som kjører dobbelt så raskt

Published by All Things Windows on July 5, 2025

montering-av-ekspert: En ny tilnærming til modellskaping

Benchmarks: Balancing Raw Intelligence med ekstrem

En innovasjon midt i geopolitisk og bedriftsmavvind

Enterprise-distribusjon: Tilgjengelighet, lisensiering og begrensninger

IT Info

Hvordan defragmenter en harddisk i Windows 11 og 10

IT Info

Fairphone 6 tjener perfekt 10/10 reparasjonsbarhet, lander i oss med en fangst

IT Info

Xbox Manager råder permittert Microsoft-ansatte for å få hjelp fra AI, og vakte forargelse

DeepSeek R1-0528: Det tyske firmaet slipper versjon av DeepSeek’s AI-modell som kjører dobbelt så raskt

Published by All Things Windows on July 5, 2025

montering-av-ekspert: En ny tilnærming til modellskaping

Benchmarks: Balancing Raw Intelligence med ekstrem

En innovasjon midt i geopolitisk og bedriftsmavvind

Enterprise-distribusjon: Tilgjengelighet, lisensiering og begrensninger

Related Posts

IT Info

Hvordan defragmenter en harddisk i Windows 11 og 10

IT Info

Fairphone 6 tjener perfekt 10/10 reparasjonsbarhet, lander i oss med en fangst

IT Info

Xbox Manager råder permittert Microsoft-ansatte for å få hjelp fra AI, og vakte forargelse