Deepseek R1 AI-modelluppdatering ökar resonemanget och fångar upp OpenAI O3 och Gemini 2.5 Pro

Kinesiska AI-starten Deepseek har lanserat en anmärkningsvärd uppdatering av sin R1 Artificial Intelligence-modell, utsedd Deepseek-R1-0528, vilket avsevärt förbättrar sin kapacitet och placerar den närmare ledande globala system. Trots anmärkningsvärda prestationsvinster betraktar företaget den nya modellen som en”mindre uppdatering.”

Företaget säger att den nya versionen ger väsentligt förbättrad prestanda i resonemang, matematik och programmering, samtidigt som det minskar genereringen av felaktig information eller”hallucinationer.”This is significant for users and the wider industry, highlighting the rapid progress of Chinese AI firms and promising more powerful, reliable AI tools, thereby intensifying global AI competition.

DeepSeek asserts that the upgraded model’s Övergripande prestanda är nu”närmar sig den ledande modellerna, till exempel O3 och Gemini 2.5 Pro.”Denna förbättring, enligt DeepSeek AI, är ett resultat av ökade beräkningsresurser och nya algoritmiska optimeringsmekanismer som tillämpades under dess efterträningsfas.

För användare innebär detta förväntningarna på mer exakta och kontextuellt relevanta utgångar, särskilt när man hanterar komplexa uppgifter. Företaget betonade också att R1-0528-versionen erbjuder förbättrat stöd för funktionssamtal, vilket möjliggör bättre interaktion med externa verktyg, och en förbättrad upplevelse för”vibe kodning”, vilket tyder på mer intuitiv kodgenerering, som anges i deras tillkännagivande.

th-iteration av deepseek r1 fortsätter att använda ablandning Aktiverar endast cirka 37 miljarder per token under slutsatsen.

Förbättrade kapaciteter och djupare tänkande

Deepseek kvantifierar prestandaprövningen med specifika referensresultat. I AIME 2025-testet, en utmanande matematikkonkurrens, ökade modellens noggrannhet enligt uppgift från 70% till 87,5%.

Detta tillskrivs ett större djup av resonemanget; Den nya modellen var i genomsnitt 23 000 tokens-enheter av textbehandling-per fråga i detta test, en betydande ökning från de tidigare 12 000 symbolerna. Further demonstrating its prowess, on the LiveCodeBench leaderboard, maintained by researchers from UC Berkeley, MIT, and Cornell, the new DeepSeek R1-0528 outperformed xAI’s Grok-3-mini and Alibaba’s Qwen-3.

A key improvement highlighted by DeepSeek is its “reduced hallucination rate,”a critical step forward as AI models generating Plausibel men falsk information förblir en ihållande utmaning. Developers testing the model have also observed that R1-0528 engages in @longer thinking sessions, reportedly spending 30 to 60 minutes on single tasks when needed,” indicating a shift towards more thorough responses. The maximum generation length for the model is a substantial 64,000 tokens.

Availability, Open Source, and Community Reception

Users can interact with the enhanced model via Deepseeks officiella chattwebbplats Genom att aktivera”Deepthink”-alternativet för utvecklare, en openai-kompatibel API är tillgänglig via MIT-licens , vilket möjliggör kommersiellt bruk och destillation. href=”https://unsloth.ai/blog/deepseek-r1-0528″Target=”_ tomt”> Blogginlägg Att de framgångsrikt kvantiserade Deepseeks R1 671B-Parameter-modell från 720 GB ner till 185 GB, en 75% reduktion, vilket gör det mer tillgängligt för lokal användning medan du håller på att hålla fastighet. och geopolitiska verkligheter

Medan Deepseeks kramande ansikte postdetaljer en betydande uppgradering, kännetecknade vissa frisläppandet i Express Tribune , som också nämnde en djupgående representativ beskrivande i en liknande typ i en privatmässig metod. Deepseek förbereder sig för sin nästa generations R2-resonemangsmodell, vars lansering enligt uppgift accelererades för att bättre konkurrera med Global AI Labs.

Den ursprungliga Deepseek R1 gjorde en betydande inverkan tidigare under året genom att överträffa OpenAI: s O1 på flera resonemang Benchmarks. Censurfri variant. Moolenaar hävdade att rapporten visade att DeepSeek inte bara var en annan AI-app utan”ett vapen i det kinesiska kommunistpartiets arsenal, utformad för att spionera på amerikaner, stjäla vår teknik och undergräva amerikansk lag.”

som svar på sådana press och oss exportkontroller som begränsar tillgången till toppnivt nVidia gpus, djupgående har strategiskt fokuserat på att få en sådan fokus. Utnyttja Deepseek-modellerna i slutet av 2024.

Deepseek R1 AI-modelluppdatering ökar resonemanget och fångar upp OpenAI O3 och Gemini 2.5 Pro

Published by All Things Windows on May 29, 2025

Förbättrade kapaciteter och djupare tänkande

Availability, Open Source, and Community Reception

IT Info

Apple överklagar EU: s iOS-interoperabilitetsmandat för iOS

IT Info

Samsung Galaxy S26 kan innehålla förvirring AI över Google Gemini

IT Info

Elon Musks X förbättrar DMS med ny krypterad Xchat, ljud/videosamtal

Deepseek R1 AI-modelluppdatering ökar resonemanget och fångar upp OpenAI O3 och Gemini 2.5 Pro

Published by All Things Windows on May 29, 2025

Förbättrade kapaciteter och djupare tänkande

Availability, Open Source, and Community Reception

Related Posts

IT Info

Apple överklagar EU: s iOS-interoperabilitetsmandat för iOS

IT Info

Samsung Galaxy S26 kan innehålla förvirring AI över Google Gemini

IT Info

Elon Musks X förbättrar DMS med ny krypterad Xchat, ljud/videosamtal