La startup cinese AI Deepseek ha lanciato un notevole aggiornamento al suo modello di intelligenza artificiale R1, designato Deepseek-R1-0528, migliorando significativamente le sue capacità e posizionandolo più vicino ai principali sistemi globali. Nonostante i notevoli guadagni delle prestazioni, la società considera il nuovo modello un”aggiornamento minore”.
La società afferma che la nuova versione offre prestazioni sostanzialmente migliorate in ragionamento, matematica e programmazione, riducendo anche la generazione di informazioni errate o”allucinazioni”. Ciò è significativo per gli utenti e per l’industria più ampia, evidenziando i rapidi progressi delle aziende di AI cinesi e promettendo strumenti di intelligenza artificiale più potenti e affidabili, intensificando così la competizione globale di AI.
DeepSeek
> Per gli utenti, questo si traduce in aspettative di output più accurati e contestualmente rilevanti, specialmente quando si affrontano compiti complessi. La società ha anche sottolineato che la versione R1-0528 offre un supporto migliorato per la chiamata delle funzioni, consentendo una migliore interazione con strumenti esterni e un’esperienza migliorata per”Codifica vibrante”, suggerendo una generazione di codice più intuitiva, come indicato nel loro annuncio. ma attiva solo circa 37 miliardi per token durante l’inferenza. DeepSeek quantifica il salto delle prestazioni con risultati specifici di riferimento. In particolare, nel test AIME 2025, una competizione di matematica impegnativa, l’accuratezza del modello è aumentata dal 70% all’87,5%. Ciò è attribuito a una maggiore profondità di ragionamento; Il nuovo modello era in media di 23.000 token-unità di testo elaborate-per questioni in questo test, un aumento significativo rispetto ai 12.000 token precedenti. Dimostrando ulteriormente la sua abilità, nella classifica LiveCodebench, gestita da ricercatori di UC Berkeley, MIT e Cornell, il nuovo Deepseek R1-0528 ha sovraperformato il Grok-3-Mini di Alibaba di Aliba da una tariffa di alimentazione di Alibaba. Ma le informazioni false rimangono una sfida persistente. Gli sviluppatori che testano il modello hanno anche osservato che R1-0528 in blank> in @Longo> in @Longo> in @Longo> in @LongH Sessioni, secondo quanto riferito, spendendo da 30 a 60 minuti su singoli compiti quando necessario,”Indicando uno spostamento verso risposte più approfondite. La lunghezza massima di generazione per il modello è una sostanziale 64.000 token. Href=”https://chat.deepseek.com/”Target=”_ blank”> Il sito Web di chat ufficiale di DeepSeek Abilita l’opzione”Deepthink”per gli sviluppatori Il modello R1-0528 è anche accessibile con un’API gratuita tramite OpenRouter. Comunità open source, DeepSeek ha anche rilasciato Deepseek-R1-0528-Qwen3-8b. Concesso in licenza con Licenza MIT , consentendo l’uso commerciale e la distillazione. href=”https://unsloth.ai/blog/deepseek-r1-0528″target=”_ blank”> post sul blog capacità migliorate e pensiero più profondo
Mentre il viso abbraccio di Deepseek dettaglia un aggiornamento significativo, alcuni hanno caratterizzato il rilascio in The Express Tribune , che ha anche menzionato un rappresentante Deepseek che lo descrive in modo simile in un approccio privato. Modello di ragionamento R2 di prossima generazione, il cui lancio è stato accelerato per competere meglio con i laboratori di AI globali.
L’originale Deepseek R1 ha avuto un impatto significativo all’inizio dell’anno, superando gli O1 di Oplexity, come la natura di R1 del ragionamento ha costantemente contribuito all’intelligenza artificiale open source, rilasciando strumenti come il kernel di decodifica flashmla e il modello DeepSeek-Prover-V2-671b per il teorema matematico. DeepSeek non era solo un’altra app di intelligenza artificiale ma”un’arma nell’arsenale del partito comunista cinese, progettata per spiare gli americani, rubare la nostra tecnologia e sovvertire la legge degli Stati Uniti.”
in risposta a tali pressioni e i controlli delle esportazioni statunitensi hanno limitato l’accesso a levelli di livello superiore per le levelli di levelle. Alla fine del 2024.