Deepseek R1-0528: firma germană lansează versiunea modelului AI Deepseek care se desfășoară de două ori mai rapid

firma IT germană TNG Technology Consulting a lansat un nou model AI open-source, care se pare că se bazează de două ori mai repede decât varianta Deepseek R1-0528 din mai. Lansat săptămâna aceasta pe îmbrățișarea platformei de față , Deepseek-Tng R1T2 Chimera își realizează eficiența remarcabilă printr-un novele de asamblare-O-OF-OEXPERTS”Tehnica Rezultatul este un model care păstrează capacități de raționament la nivel înalt, în timp ce generează răspunsuri cu 60% mai puține jetoane, reducând drastic costurile de inferență și timpul de răspuns pentru dezvoltatori.

Comunitatea dezvoltatorilor AI a răspuns cu entuziasm. Pe X, îmbrățișarea liderului senior Vaibhav Srivastav a scris: „Damn! Deepseek R1T2-200% mai rapid decât R1-0528 și 20% mai rapid decât R1,” evidențierea performanței sale câștiguri . Modelul este disponibil sub o licență MIT permisivă, permițând o utilizare și modificare comercială largă.

Assembly-of-Experts: o abordare nouă a creării modelului

metoda „Assembly-of-Experts” a TNG (AOE) reprezintă o îndepărtare semnificativă de la crearea de modele convenționale. În loc să se conecteze sau să se retragă, AOE construiește un nou model prin îmbinarea selectivă a tensorilor de greutate de la mai mulți părinți în prealabil, un proces detaliat într-un Recent de cercetare din iunie.

a focarului de implementare pe o combinație pe o combinație de expertiză în luna iunie. Model cel mai responsabil pentru cunoștințe de specialitate-păstrând în timp ce straturile mai eficiente de la părinți mai rapizi. Această chimeră „tri-mind” combină raționamentul R1-0528, gândirea structurată la R1 și concizia V3-0324.

Această abordare este distinctă de arhitectura amestecului de amestec-expertă (MOE) folosită în modelele sale părinte. În timp ce MOE este o arhitectură de rulare care activează o fracțiune din „experți” a unui model pentru orice sarcină dată, AOE este o tehnică de construcție care coace expertiza combinată într-un singur model final mai eficient.

criterii de referință: echilibrarea inteligenței brute cu o eficiență extremă

Beneficiul practic al acestei tehnici este o eficiență extremă

Beneficiul practic al acestei tehnici este un echilibru puternic al inteligenței și al vitezei. Potrivit de referință publicate de TNG, R1T2 Chimera obține între 90% și 92% din performanța raționamentului celui mai puternic părinte al său, R1-0528, la teste solicitante precum AIME și GPQA.

aceste repere sunt concepute pentru a testa sofisticat, raționament în mai multe etape, care depășește mult mai mult de cunoașterea simplă. Cu toate acestea, avantajul principal al modelului este concizia. Generează răspunsuri corecte folosind aproximativ 40% din jetoanele cerute de R1-0528, o reducere de 60% a lungimii de ieșire.

Acest lucru se traduce direct la timpi de răspuns mai rapide și la costurile de calcul mai mici, ceea ce îl face peste două ori mai rapid în termeni practice. Această eficiență a fost un semn distinctiv al părintelui său V3. După lansarea sa din martie, dezvoltatorul Awni Hannun a spus despre îmbunătățirea martie 2025 Varianta V3 ,”este cel mai puternic model pe care l-am condus vreodată pe Laptop”href=”https://twitter.com/awnihannun/status/1904177084609827054″Target=”_ Blank”> Rularea lui pe laptop . R1T2 Chimera grefează cu succes această eficiență pe un nucleu de raționament mai puternic.

O inovație pe fondul celor de la geopolitice și corporative din cap de cap

Eliberarea acestui model extrem de eficient vine într-un timp turbulent pentru creatorul său original, Deepseek AI. Momentul firmei chineze s-a oprit, cu modelul R2 anticipat acum întârziat la nesfârșit. Acest lucru se datorează atât nemulțumirii de performanță internă, cât și impactului controalelor de export din SUA asupra jetoanelor Vital AI.

Simultan, Deepseek se confruntă cu presiunea de reglementare în vest. În Germania, Autoritatea pentru Protecția Datelor din Berlin a solicitat Apple și Google să elimine aplicația Deepseek din magazine, etichetându-l „conținut ilegal” din cauza riscurilor ilegale de transfer de date către China. Președintele comisiei, John Moolenaar, a declarat: „Acest raport arată: Deepseek nu este doar o altă aplicație AI-este o armă în arsenalul Partidului Comunist Chinez…, susținând că aplicația este un instrument pentru spionaj și recoltarea de date. Aceste presiuni externe creează un fundal complex pentru orice tehnologie derivată din activitatea Deepseek.

Implementarea întreprinderii: disponibilitate, licențiere și limitări

pentru liderii tehnici ai întreprinderii, R1T2 Chimera prezintă o opțiune convingătoare. Licența sa MIT oferă o flexibilitate maximă pentru găzduirea, personalizarea și implementarea privată în aplicații comerciale fără taxe de licență. Reducerea semnificativă a costurilor de inferență o face ideală pentru medii cu un randament ridicat sau în timp real.

Economiile de costuri sunt deosebit de relevante pentru aplicații precum chatbot-uri de asistență pentru clienți în timp real, rezumarea documentelor pe scară largă sau interogări interne de bază de cunoștințe, unde atât viteza, cât și bugetul sunt critice. Acesta plasează modelul într-un cadran dezirabil pe curba performanței-versus-cost.

Cu toate acestea, TNG notează unele limitări curente. Modelul nu este încă recomandat pentru cazuri de utilizare care necesită apelare funcțională sau utilizarea instrumentului, ceea ce înseamnă că nu poate interacționa în mod fiabil cu API-urile externe. Acest lucru limitează utilizarea sa în fluxuri de lucru complexe, automatizate, deși actualizările viitoare pot aborda acest decalaj.

Mai mult, compania sfătuiește utilizatorilor europeni să evalueze respectarea lor cu Legea AI a UE, care are o acoperire extrateritorială. În ciuda acestor avertismente, eliberarea R1T2 Chimera de către TNG marchează un pas notabil în dezvoltarea AI modulară, oferind o privire asupra unui viitor în care modelele sunt asamblate, nu doar instruite.

Deepseek R1-0528: firma germană lansează versiunea modelului AI Deepseek care se desfășoară de două ori mai rapid

Published by All Things Windows on July 5, 2025

Assembly-of-Experts: o abordare nouă a creării modelului

criterii de referință: echilibrarea inteligenței brute cu o eficiență extremă

O inovație pe fondul celor de la geopolitice și corporative din cap de cap

Implementarea întreprinderii: disponibilitate, licențiere și limitări

IT Info

Cum să definească un hard disk în Windows 11 și 10

IT Info

Fairphone 6 câștigă scor perfect de reparabilitate 10/10, aterizează în noi cu o captură

IT Info

Xbox Manager recomandă personalului Microsoft pentru a primi ajutor de la AI, stârnind ultraj

Deepseek R1-0528: firma germană lansează versiunea modelului AI Deepseek care se desfășoară de două ori mai rapid

Published by All Things Windows on July 5, 2025

Assembly-of-Experts: o abordare nouă a creării modelului

criterii de referință: echilibrarea inteligenței brute cu o eficiență extremă

O inovație pe fondul celor de la geopolitice și corporative din cap de cap

Implementarea întreprinderii: disponibilitate, licențiere și limitări

Related Posts

IT Info

Cum să definească un hard disk în Windows 11 și 10

IT Info

Fairphone 6 câștigă scor perfect de reparabilitate 10/10, aterizează în noi cu o captură

IT Info

Xbox Manager recomandă personalului Microsoft pentru a primi ajutor de la AI, stârnind ultraj