A globális verseny és a hardverellátási lánc nyomásainak fokozása, különös tekintettel a nagy teljesítményű GPU-khoz való hozzáférésre, az AI hatékonysága számos technológiai cég számára központi hangsúlyt jelent. A 2024. negyedévi 2024-es bevételi felhívása során, 2025 márciusában, a Tencent beszámolt arról, hogy csökkenti a GPU követelményeit a DeepSeek modelljeinek integrálásával. Ez-az a valóság.”Míg a Tencent továbbra is hardvereket szerez, mint például az NVIDIA H20 chipjei a DeepSeek integrációjához olyan alkalmazásokban, mint például a WeChat, a nyilatkozat kiemeli a DeepSeek hatékony terveire való stratégiai támaszkodást. > A DeepSeek nyílt forráskódú pushja elkezdődik
A hatékonyság első megközelítését megerősítve a DeepSeek új nyílt forráskódú kezdeményezést jelentett be az X-en keresztül. A tervet „kicsi, de őszinte előrehaladás megosztása” című cikke szerint a vállalat a következő héten, a Community Community-t, és a Community-t, hogy a Community Community-t, és a Community-t, a Community-t, és a Community Community-t, és a Community Community-t, és a Community-t, hogy a közösségi fejlődéshez hozzáadjon, és hozzáadja a közösségi fejlesztést, és hozzáadja a közösséget, és hozzáadja a közösséget. innováció.”A program keretében bemutatott első összetevő a FlashMla.
Kicsi csapat vagyunk. A jövő héten 5 repot nyitva tartunk, megosztva a kicsi, de őszinte előrehaladást teljes átláthatósággal. href=”https://twitter.com/deepseek_ai/status/1892786555494019098?ref_src=twsrc%5etfw”Target=”_ üres”> február 21., 2025
flashmla jelenik meg, mint a multi-time-féle, multi-latering ( A kernel, a transzformátor figyelmét a jobb hatékonysághoz tervezett variáció, kifejezetten az NVIDIA Hopper GPU architektúrájához hangolva. Elérhető a flashattion 2 & 3 és az nvidia saját byllass”> birlary “> carrary”> lasslass”> cirrary”> carrary “> circary”> birlary A Github-tároló rámutat a közösség erőfeszítéseire is, amelyek a technológia más hardverplatformokhoz igazítják, ideértve a Metax-maca/flashmla ), moore szálak ( Moorethreads/Mt-Flashmla ), hygon dcu ( opendas/mlattment ), intellifusion ( intellifusion/tyllm ), iluvatar corex ( mély-spark/flashmla ), és AMD ösztön ( aiter/mla ), jelezve, hogy szélesebb ökoszisztéma érdeklődésre számot tart a mögöttes technikák iránt. A DeepSeek állítólag felgyorsította a következő fő modell, az R2 fejlesztési ütemtervét, amely a tervezett 2025. májusi debütálásról egy potenciálisan korábbi indításra váltott, amint azt február végén jelentették. Ezen piaci dinamika összetétele szabályozási kihívások, ideértve az Egyesült Államok korlátozásait és az Európában végzett vizsgálatokat az adatgyakorlásokkal kapcsolatban. Ezenkívül a DeepSeek az NVIDIA hardverre való támaszkodása továbbra is tényező, mivel a folyamatos amerikai exportvezérlők befolyásolják a chip elérhetőségét Kínában. Counts, az Openai erőforrás-igényes modelljei, mint például az óriás, drága GPT-4.5. href=”https://arxiv.org/abs/2504.02495″Target=”_ üres”> ARXIV-n elérhető papír ), A következtetési idő igazítási technika, amelynek célja az emberi visszajelzések függőségének csökkentése. potenciálisan versenyelőnyt teremt az erőforrás-korlátozott környezetben.