Një front i ri është hapur në garën e AI të AI të aksioneve të Kinës. Fillimi me bazë në Shanghai Minimax ka lëshuar Minimax-M1, një model i fuqishëm i arsyetimit me peshë të hapur që monton një sfidë të drejtpërdrejtë dhe shumëplanëshe për mbizotërimin e supozuar të rivalit të saj të brendshëm, Deepseek. Masa përshkallëzon konkurrencën rajonale nga një betejë e standardeve në një luftë më komplekse të luftuar mbi performancën, efikasitetin e kostos dhe vetë përkufizimin e”burimit të hapur”. Sipas një raport nga regjistri , kompania është duke synuar në mënyrë të qartë që të kërkojë DeepSeek si diskriminues kryesor të industrisë. Deri në këtë javë, modeli i azhurnuar R1-0528 i Deepseek u pa gjerësisht si pretendent kryesor i burimit të hapur të Kinës. e bën këtë me efikasitet më të madh dhe nën një licencë më lejuese. src=”të dhëna: imazh/svg+xml; nitro-empty-id=mtyzodoxnjg2-1; base64, phn2zyb2awv3qm94psiwidagmti4mca2od Eiihdpzhropsixmjgwiibozwlnahq9ijy4msigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Ky zhvillim sinjalizon një pjekuri të ekosistemit të AI jashtë Silicon Valley, ku kushtet e angazhimit tani përfshijnë garanci ligjore dhe pozicionimin etik krahas fuqisë teknike të papërpunuar. Për zhvilluesit dhe ndërmarrjet globale, rivaliteti premton mjete më të fuqishme dhe të arritshme, por gjithashtu nënvizon kompleksitetin në rritje të lundrimit të një peizazhi të formuar nga konkurrenca intensive dhe presionet gjeopolitike. Modeli depo zyrtare gitHub detajon një përzierje hibride-e-experts (MOE) arkitekturë që mbështet një procesverbal të një milionësh në lidhje me një milion-konteks një herë Ndërsa të dy modelet përdorin teknikën e MOE që rritin efikasitetin, Minimax pretendon se mekanizmi i tij i vëmendjes”të vëmendjes së rrufesë”dhe një algoritëm i ri i mësimit të përforcimit të quajtur CISPO janë diferencues kryesorë. Sipas letër teknike zyrtare Ky dizajn është themeli i efikasitetit të modelit.”Krahasuar me Deepseek… kjo ulje e konsiderueshme e kostos llogaritëse e bën M1 dukshëm më efikas gjatë konkluzionit dhe trajnimit [model] në shkallë të gjerë.”Ndërsa standardet e vetë-raportuara tregojnë një pamje të nuancuar-me Deepseek duke mbajtur një avantazh të vogël në disa teste kodimi-M1 duket se tërheq përpara në detyrat e arsyetimit me kontekst të gjatë, një aftësi kritike për aplikime të sofistikuara. src=”të dhëna: imazh/svg+xml; nitro-empty-id=mty0mtoxndkw-1; base64, phn2zyb2awv3qm94psiwidagoty1idk4ny Igd2lkdgg9ijk2nsigagvpz2h0psi5odciihhtbg5zpsjodhrwoi8vd3d3d3lnczlm9yzy8ymdawl3n2zyi+pc9zdmc+”>
Më shumë se një licencë: Gambit me burim të hapur
Ndoshta lëvizja më strategjike e Minimax është zgjedhja e tij e licencës. Kompania lëshoi M1 nën një licencë Apache 2.0 , të cilën e kornizon me të vërtetë si”në të vërtetë burim i hapur”. Kjo është një bllokim i qëllimshëm tek konkurrentët si Meta, modelet e të cilit llama përdorin një licencë kufizuese të komunitetit që iniciativa me burim të hapur argumenton është Jo me të vërtetë me burim të hapur , dhe madje edhe thellësi, e cila është vetëm e hapur, e cila është vetëm e hapur, e cila është vetëm e hapur, e cila është e hapur, e cila është e hapur, e cila është vetëm e hapur, e cila është e hapur, e cila është e hapur”. licencë.
Dallimi është më shumë se filozofik; Ka implikime të rëndësishme ligjore dhe tregtare. Liçensa Apache 2.0 siguron një avantazh thelbësor për zhvillimin e AI, pasi gjithashtu përfshin grante për patentë, të cilat mund të jenë të rëndësishme për modelet e AI. Kjo grant i qartë i patentave u ofron përdoruesve mbrojtje më të fortë kundër padive të mundshme të shkeljes, një konsideratë kritike për ndërmarrjet që kërkojnë të ndërtojnë produkte tregtare në krye të një modeli me peshë të hapur. Duke ofruar këtë qartësi ligjore, Minimax po bën një lojë të llogaritur për tu parë si zgjedhje më e sigurt, më miqësore për biznesin. Kompania është duke u kapur me një seri akuzash dëmtuese në lidhje me të dhënat e saj të trajnimit. Kjo praktikë shkel kushtet e shërbimit të laboratorëve më të mëdhenj të AI. Akuzat janë të ndërlikuara nga presioni intensiv gjeopolitik.”Deepseek nuk është vetëm një aplikacion tjetër i AI-është një armë në arsenalin e Partisë Komuniste Kineze, e krijuar për të spiunuar amerikanët, për të vjedhur teknologjinë tonë dhe për të shkatërruar ligjin e SHBA.”
Nëse do të isha thellë, unë patjetër do të krijoja një ton të të dhënave sintetike nga modeli më i mirë API atje. Ata janë të shkurtër në GPU dhe skuqen me para. Fjalë është fjalë për fjalë në mënyrë efektive më e llogaritur për ta. Po në pyetjen e distilimit të gemini. 2025
një garë globale e mbushur me pengesa
Ndërsa drama shpaloset në Kinë, raca globale e AI po dëshmon e vështirë për të gjithë. Sfidat me të cilat përballen Deepseek dhe presioni konkurrues nga Minimax janë pasqyruar në perëndim, ku edhe gjigantët e teknologjisë më të mirë të financuar po godasin bllokimet e zhvillimit. Kjo luftë në mbarë industrinë sugjeron që epoka e përparimeve të lehta, të shpejta mund të përfundojë. Siç vërejti asistentja e NYU, Profesori Ravid Shwartz-Ziv,”Progresi është mjaft i vogël në të gjitha laboratorët, të gjitha modelet.”
Duke parë përpara, diferencuesi konkurrues mund të zhvendoset plotësisht. një raport i fundit i PWC Në trendet e AI sugjeron që si modele themelore të bëhen komodituese, çelësi i suksesit nuk do të gënjejë në modelin më të mirë jashtë-shirishtë, por në mënyrën se si të krijuara nga Combin e tyre, por në mënyrë që të jenë të fuqishëm të Combine Model Të dhënat e pronarit dhe njohuritë institucionale. Sfida për Deepseek nuk ka të bëjë thjesht me metrikat e performancës, por është një konkurs më i gjerë i efikasitetit, strategjisë ligjore dhe besueshmërisë së perceptuar. Ndërsa raca globale vazhdon të përshpejtohet, kjo konkurs shumë-front në Kinë demonstron se ndërtimi i një modeli mbizotërues të AI tani kërkon më shumë sesa thjesht kod-kërkon një zotërim të ndërveprimit kompleks midis teknologjisë, etikës dhe tregtisë.