Deepseek R1-0528: Tyska företaget släpper versionen av Deepseeks AI-modell som går dubbelt så snabbt

tyska IT-företaget TNG Technology Consulting har släppt en ny AI-modell med öppen källkod som enligt uppgift är dubbelt så snabbt som Deepseek R1-0528-varianten från maj den är baserad på. Släppt den här veckan på kraming ansiktsplattform , Deepseek-tng r1t2 Chimera achie yttre av sin remarkering genom AMEMAMEL AMEMENT ‘NOMEALSEMENT‘ NOMEALE Teknik.

Den här metoden slår samman komponenter från tre olika modermodeller, inklusive de ursprungliga Deepseek R1-och V3-modellerna. Resultatet är en modell som behåller resonemang på hög nivå samtidigt som man genererar svar med 60% färre symboler, drastiskt sänkande inferenskostnader och responstider för utvecklare.

AI-utvecklaren har svarat med entusiasm. På X skrev på kramande ansiktsledare Vaibhav Srivastav:”Fan! Deepseek R1T2-200% snabbare än R1-0528 & 20% snabbare än R1,”>>

montering-of-experts: En ny metod för att skapa modellering

TNG: s”Assemble-of-Experts”(AOE)-metod representerar en betydande avvikelse från konventionell modellskapande. Istället för att finjustera eller omskolning bygger AOE en ny modell genom att selektivt slå samman vikttensorerna från flera förtränade föräldrar, en process som beskrivs i en Nyligen forskningspapper från juni. Tensorer-delarna av en modell som är mest ansvarig för specialiserad kunskap-när de behåller de effektivare delade skikten från snabbare föräldrar. Denna”tri-mind”chimera kombinerar resonemanget för R1-0528, strukturerad tanke på R1, och konisesenhet av V3-0324.

Detta tillvägagångssätt skiljer sig från blandningen av experter (MOE) arkitektur som används i sina modermodeller. Medan MOE är en runtime-arkitektur som aktiverar en bråkdel av en modells”experter”för varje given uppgift, är AOE en konstruktionsteknik som bakar den kombinerade expertisen till en enda, effektivare slutmodell. Enligt Benchmarks som publicerats av TNG uppnår R1T2 Chimera mellan 90% och 92% av resonemangsprestanda för dess mest kraftfulla förälder, R1-0528, på krävande tester som AIME och GPQA. Modellens viktigaste fördel är emellertid enighet. Det genererar korrekta svar med cirka 40% av de token som krävs av R1-0528, en 60% minskning av utgångslängden.

Detta innebär direkt snabbare responstider och lägre beräkningskostnader, vilket gör det över dubbelt så snabbt i praktiska termer. Denna effektivitet var ett kännetecken för sin V3-förälder. After its March release, developer Awni Hannun said of the improved March 2025 variant of V3, “it’s the most powerful model I’ve ever run on my laptop,”after kör den på sin bärbara dator . R1T2 Chimera transporterar framgångsrikt denna effektivitet på en starkare resonemangskärna.

En innovation mitt i geopolitisk och företags motvind

släppet av denna mycket effektiva modell kommer vid en turbulitisk tid för sin ursprungliga skapare, Deepseek AI. Det kinesiska företagets momentum har stannat, med sin förväntade R2-modell nu på obestämd tid försenad. Detta beror på både interna prestationsens missnöje och effekterna av amerikanska exportkontroller på viktiga AI-chips.

samtidigt står Deepseek inför montering av regleringstryck i väst. I Tyskland har Berlins Data Protection Authority begärt Apple och Google ta bort Deepseek-appen från butikerna och märkte den “olagligt innehåll” på grund av olagliga dataöverföringsrisker till Kina.

Detta följer en fördömande aprilrapport från US House Select-kommittén för CCP. Kommitténs ordförande John Moolenaar uttalade,”Denna rapport gör det klart: Deepseek är inte bara en annan AI-app-det är ett vapen i det kinesiska kommunistpartiets arsenal…”, påstår att appen är ett verktyg för spionage och data skörd. Dessa yttre tryck skapar en komplex bakgrund för alla tekniker som härrör från Deepseeks arbete.

Enterprise-distribution: tillgänglighet, licensiering och begränsningar

för företagstekniska ledare, R1T2 Chimera presenterar ett övertygande alternativ. MIT-licensen erbjuder maximal flexibilitet för privat värd, anpassning och distribution i kommersiella ansökningar utan licensavgifter. Den betydande minskningen av inferenskostnaden gör den idealisk för miljöer med hög genomströmning eller realtid.

Kostnadsbesparingarna är särskilt relevanta för applikationer som realtidssupportchatbots, storskaliga dokumentöversikt eller interna kunskapsbasfrågor, där både hastighet och budget är kritiska. Den placerar modellen i en önskvärd kvadrant på prestanda-versus-kostnadskurvan.

TNG noterar dock vissa aktuella begränsningar. Modellen rekommenderas ännu inte för användningsfall som kräver funktionssamtal eller verktygsanvändning, vilket innebär att den inte pålitligt kan interagera med externa API: er. Detta begränsar dess användning i komplexa, automatiserade arbetsflöden, även om framtida uppdateringar kan ta itu med detta gap.

Dessutom råder företaget europeiska användare att bedöma deras efterlevnad av EU AI-lagen, som har extraterritoriell räckvidd. Trots dessa varningar markerar frisläppandet av R1T2-chimera av TNG ett anmärkningsvärt steg i modulär AI-utveckling, och erbjuder en inblick i en framtid där modeller samlas, inte bara utbildade.

Deepseek R1-0528: Tyska företaget släpper versionen av Deepseeks AI-modell som går dubbelt så snabbt

Published by All Things Windows on July 5, 2025

montering-of-experts: En ny metod för att skapa modellering

En innovation mitt i geopolitisk och företags motvind

Enterprise-distribution: tillgänglighet, licensiering och begränsningar

IT Info

Hur man defragmenterar en hårddisk i Windows 11 & 10

IT Info

Xbox Manager råder avskedad Microsoft-personal att få hjälp från AI, vilket leder till upprörelse

IT Info

Studie: AI-riktmärken djupt felaktiga, kan överskatta prestanda med 100%

Deepseek R1-0528: Tyska företaget släpper versionen av Deepseeks AI-modell som går dubbelt så snabbt

Published by All Things Windows on July 5, 2025

montering-of-experts: En ny metod för att skapa modellering

En innovation mitt i geopolitisk och företags motvind

Enterprise-distribution: tillgänglighet, licensiering och begränsningar

Related Posts

IT Info

Hur man defragmenterar en hårddisk i Windows 11 & 10

IT Info

Xbox Manager råder avskedad Microsoft-personal att få hjälp från AI, vilket leder till upprörelse

IT Info

Studie: AI-riktmärken djupt felaktiga, kan överskatta prestanda med 100%