Ang
AI Startup Peclexity ay naglabas ng isang bukas na mapagkukunan ng sistema noong Nobyembre 4 na nagpapahintulot sa pinakamalaking mga modelo ng AI sa mundo na tumakbo nang mahusay sa imprastraktura ng ulap ng Amazon sa unang pagkakataon. Ang mga modelo tulad ng kimi k2 sa aws. Ang mga kasanayan, na lumilikha ng isang matalim na kaibahan sa pagitan ng mga open-source na kontribusyon at mga pamamaraan ng negosyo nito. href=”https://github.com/perplexityoi/pplx-sarden”target=”_ blangko”> magagamit sa isang repositoryo ng github na pinangalanang’pplx-garden’. Chen, na binabalangkas ang arkitektura ng system .
Sa core ng pagbabago ay isang portable library na tinatawag na’TransferEngine,’na binuo upang pamahalaan ang high-throughput, mababang latency na paglilipat ng data gamit ang Remote Direct Memory Access (RDMA).
Teknolohiya , na nagbibigay-daan sa isang GPU na direktang makipag-usap sa isang network card ngunit lumilikha ng lock-in ng hardware, ang pagkalito ay napili para sa isang mas nababaluktot na disenyo ng host-proxy. Habang ipinakikilala nito ang isang maliit na overhead, ginagawa nito ang buong sistema ng hardware-agnostic. Ang pangunahing pananaw nito ay upang bumuo ng isang abstraction na hindi nakasalalay sa mahigpit na in-order na paghahatid ng data na ginagarantiyahan ng NVIDIA’s ConnectX cards. Nakamit ng mga kernels ang pagganap ng state-of-the-art.