firma gjermane IT TNG Technology Consulting ka lëshuar një model të ri AI me burim të hapur, i cili raportohet se dy herë më shpejt se varianti Deepseek R1-0528 nga maji bazohet. Lëshuar këtë javë në Përqafimi i platformës , Deepseek-tng r1t2 chimera arrin efikasitetin e saj të jashtëzakonshëm”teknikë.

Kjo metodë bashkon përbërësit nga tre modele të ndryshme të prindërve, duke përfshirë modelet origjinale Deepseek R1 dhe V3. Rezultati është një model që mban aftësi të nivelit të lartë të arsyetimit ndërsa gjeneron përgjigje me 60% më pak shenja, duke ulur në mënyrë drastike kostot e konkluzionit dhe kohën e përgjigjes për zhvilluesit.

Komuniteti i zhvilluesve të AI është përgjigjur me entuziazëm. Në X, Hugging Face Face Udhëheqësi i Lartë Vaibhav Srivastav shkroi,”Damn! Deepseek R1t2-200% më e shpejtë se R1-0528 & 20% më e shpejtë se R1,”. Modeli është i disponueshëm nën një licencë të lejueshme të MIT, duke lejuar përdorim të gjerë tregtar dhe modifikim.

montimi i ekspertëve: Një qasje e re për krijimin e modelit

“Metoda e montimit të ekspertëve”të TNG paraqet një largim të rëndësishëm nga krijimi i modelit konvencional. Në vend të rregullimit ose rikualifikimit të mirë, AOE ndërton një model të ri duke bashkuar në mënyrë selektive Tensorët e peshës nga prindër të shumtë të para-trajnuar, një proces i detajuar në një duke e drejtuar atë në laptopin e tij . R1T2 Chimera sharton me sukses këtë efikasitet mbi një thelb më të fortë arsyetimi. Momenti i firmës kineze ka ngecur, me modelin e tij të parashikuar R2 tani vonohet pafundësisht. Kjo është për shkak të pakënaqësisë së performancës së brendshme dhe ndikimit të kontrolleve të eksportit në SHBA në patate të skuqura jetike AI. Në Gjermani, Autoriteti i Mbrojtjes së të Dhënave të Berlinit ka kërkuar që Apple dhe Google të heqin aplikacionin Deepseek nga dyqanet, duke e etiketuar atë”përmbajtje të paligjshme”për shkak të rreziqeve të paligjshme të transferimit të të dhënave në Kinë. Kryetari i Komitetit John Moolenaar deklaroi,”Ky raport e bën të qartë: Deepseek nuk është vetëm një aplikacion tjetër i AI-është një armë në arsenalin e Partisë Komuniste Kineze…”, duke pretenduar se aplikacioni është një mjet për spiunazhin dhe korrjen e të dhënave. Këto presione të jashtme krijojnë një sfond kompleks për çdo teknologji që rrjedh nga puna e Deepseek. Liçensa e saj MIT ofron fleksibilitet maksimal për pritjen, personalizimin dhe vendosjen private në aplikimet tregtare pa tarifa licencimi. Ulja e konsiderueshme e kostos së konkluzionit e bën atë ideal për mjedise të larta ose mjedise në kohë reale. Ai e vendos modelin në një kuadran të dëshirueshëm në kurbën e performancës-kosto-kosto.

Sidoqoftë, TNG vëren disa kufizime aktuale. Modeli ende nuk rekomandohet për përdorimin e rasteve që kërkojnë thirrje për telefonin ose përdorimin e mjeteve, do të thotë se nuk mund të bashkëveprojë me besueshmëri me API-të e jashtme. Kjo kufizon përdorimin e tij në rrjedhën e punës komplekse, të automatizuara, megjithëse azhurnimet e ardhshme mund të adresojnë këtë boshllëk. Përkundër këtyre paralajmërimeve, lëshimi i R1T2 Chimera nga TNG shënon një hap të dukshëm në zhvillimin modular të AI, duke ofruar një paraqitje të shkurtër në një të ardhme ku janë mbledhur modele, jo vetëm të trajnuar.

Categories: IT Info