Intsik AI Firm Deepseek ay naglabas ng isang bagong open-source system noong Lunes na idinisenyo upang malutas ang isang pangunahing AI bottleneck: ang pagproseso ng mga napakalaking dokumento. Ang kapangyarihan, naiulat na nagpapanatili ng 97% na katumpakan na may sampung beses na pagbawas sa data.

Ang paglabas ng modelo ay nagmamarka ng isang madiskarteng pivot patungo sa kahusayan para sa Deepseek, na ang punong punong R2 ay walang katiyakan na naantala nang mas maaga sa taong ito sa gitna ng mga hamon sa hardware na naka-link sa digmaang tech ng U.S. Mukha , ang bagong modelo at ang signal ng code nito ay isang malakas na pangako sa bukas na mapagkukunan ng komunidad.”Optical compression.”sa opisyal na teknikal na papel , ang sistema ay lubos na epektibo.”Ipinapakita ng mga eksperimento na kapag ang bilang ng mga token ng teksto ay nasa loob ng 10 beses na ng mga token ng paningin… ang modelo ay maaaring makamit ang pag-decode (OCR) na katumpakan ng 97%.”

Ang kahusayan nito ay nakamit sa pamamagitan ng isang sopistikadong arkitektura. Ang isang malakas na”DeepenCoder”ay unang nagpoproseso ng mga imahe na may mataas na resolusyon gamit ang mga sangkap mula sa meta’s Segment kahit anong modelo (sama) Ang 16x compressor pagkatapos ay drastically binabawasan ang token count bago pakainin ang data sa isang dalubhasang deepseek-3b-moe na modelo ng wika para sa pag-decode. Sa mga pagsubok sa benchmark, ang Deepseek-OCC ay lumampas sa mga kakumpitensya tulad ng GOT-OCR2.0 gamit lamang ang 100 mga token ng pangitain kumpara sa huli na 256. Ito rin ay higit sa 800. Ang paggawa nito ng isang malakas na tool para sa pagbuo ng mga napakalaking datasets na kinakailangan upang sanayin ang susunod na henerasyon na AI. Ang paglabas nito ay sumusunod sa isang magulong panahon para sa kumpanya matapos ang mataas na inaasahang R2 na pangangatuwiran na modelo ay walang hanggan na natigil sa kalagitnaan ng 2025. Ang kabiguang iyon ay kumakatawan sa isang pangunahing pag-aalsa para sa mga ambisyon ng Tsina na makamit ang soberanya ng teknolohiya, na itinampok ang napakahirap na kahirapan sa pagbuo ng isang mapagkumpitensyang software na nakasalansan sa umuusbong na domestic hardware. Posisyon ng Competitive, na lumilikha ng isang pagbubukas para sa mga domestic rivals tulad ng Z.AI at Alibaba upang makakuha ng lupa. Isang ulat ng komite sa bahay ng Estados Unidos mula noong Abril ay binansagan ng firm ang isang banta sa seguridad, kasama ang chairman na si John Moolenaar,”Ang Deepseek ay hindi lamang isa pang AI app-ito ay isang sandata sa Arsenal ng Partido Komunista ng Tsina, na idinisenyo upang maniktik sa mga Amerikano, magnakaw ng aming teknolohiya, at ibagsak ang batas ng Estados Unidos.”Deepseek-OCR Bilang isang malakas, bukas na mapagkukunan na tool, ang kumpanya ay lilitaw na nagsasagawa ng isang diskarte na multi-pronged upang mabawi ang momentum. Nagsisilbi rin ito bilang isang praktikal na pagpapakita ng patuloy na mga kakayahan sa pananaliksik, kahit na ang modelo ng punong barko nito ay nananatili sa limbo. Ang isang open-source model ay nag-aalok ng isang natatanging panukala ng halaga. Ang pipeline ay aktibo at umaangkop sa mapaghamong geopolitical landscape.