Alibabas Tongyi Lab har avduket R1-Omni, en åpen kildekunstig kunstig intelligens (AI)-modell som er i stand til å tolke menneskelige følelser gjennom visuell og auditiv dataanalyse.
R1-omni bruker forsterkningslæring med verifiserbar belønning (RLVR), og forbedrer dens resonnement, nøyaktighet og tilpasningsevne. Modellen posisjonerer Alibaba sammen med ledende AI-konkurrenter som Openai og DeepSeek, og markerer et strategisk fremskritt i AI-modellsektoren.
I følge Alibaba bruker R1-OMNI RLVR for første gang innenfor en multimodal stor språkmodell. Selskapet uttaler : “R1-omni er bransjens første anvendelse av forsterkningslæring med verifiserbar belønning (RLVR) til en omni-multimodal storspråklig modell. Vi fokuserer på følelsesgjenkjenning, en oppgave der både visuelle og lydmodaliteter spiller avgjørende roller, for å validere potensialet til å kombinere RLVR med Omni-modellen.”
rlvr og hvordan det fremmer R1-Omnis læring
RLVR fungerer ved å belønne AI-modellen bare når utganger oppfyller verifiserbare kriterier, og sikrer at modellens læringsprosess er styrt av nøyaktig og pålitelig
Modellens treningsprosess inkorporerte store datasett som MAFW og DFEW, med over 15 000 videoprøver, noe Politikkoptimalisering (GRPO) , reduserer avhengigheten av tradisjonelle kritikermodeller, samtidig som det muliggjør raskere komparative evalueringer.
Denne tilnærmingen er designet for å fremskynde læringsprosessen uten at det går ut over ytelsen, og sikrer at R1-OMNI kan behandle komplekse data mer effektivt og levere konsistent følelsesgjenkjenningsnøyaktighet.
Alibabas AI-modellutvikling og konkurransedyktig fokus
INNLEDNING AV R1-OMNI BROGINGS
Ai-modellen. I januar 2025 lanserte Alibaba Qwen 2,5-max, en blanding-of-Experts (MOE)-modell designet for forbedret resonnement og problemløsing. Modellen er fullt kompatibel med Openais API, og gir utviklere et sømløst integrasjonsalternativ for skalerbare AI-applikasjoner.
Februar så utgivelsen av QWQ-Max-Preview, en resonnementfokusert modell også basert på MOE-arkitektur. Mens Alibaba holdt tilbake referansedata, la den vekt på modellens utforming for beregningseffektivitet-et kritisk attributt gitt stramming av amerikanske begrensninger på avansert AI-maskinvareeksport.
I mars la Alibaba til QWQ-32B til porteføljen, og ga en balanse mellom pris og høy ytelse for å fornuft og kodet tasker. Denne modellen henvender seg spesielt til utviklere som jobber innenfor begrensede beregningsmiljøer, og forsterker Alibabas forpliktelse til skalerbare og tilgjengelige AI-verktøy.
DeepSeek’s R2 Rollout midt for å intensivere konkurransen. å opprettholde konkurransedyktig momentum midt i regulatoriske og markedspress. DeepSeek har navigert i økt granskning fra europeiske regulatorer over GDPR-samsvar og står overfor amerikanske diskusjoner om potensielle begrensninger knyttet til nasjonale sikkerhetsproblemer.
Ytterligere komplikasjoner oppsto fra påstander om at DeepSeek på en feil måte har tilgang til sin egenutdanning. Selv om den hevder å ha vært avhengig av 2.048 NVIDIA H800 GPUer for å trene sin R1-resonnementsmodell, har det vært spekulasjoner om hvorvidt selskapet lagret begrenset maskinvare før sanksjoner.
Alibabas åpen kildekode og prisstrategi: Å forme konkurrerende dynamikk
Alibabas tilnærming til åpen kildekode AI-utvikling spiller en nøkkelrolle i strategien for å utvide tilgjengeligheten og bransjens innflytelse. Utgivelsen av WAN 2.1 AI-videomodellen tidligere i år understreker denne innsatsen.
Ved å tilby open source-alternativer til proprietære plattformer som Openais Sora og Googles Veo 2, posisjonerer Alibaba seg som en ledende talsmann for tilgjengelig AI-innovasjon.
Wan 2.1 tilbyr funksjoner som tekst-til-Video (T2V) og bilde-til-video (I2-Video (T2V) og bilde-til-video (I2-Video (T2V) og image-to-Video (I2-Video (T2V) og image-to-Video (I2-Video (T2V) og image-to. Denne åpen kildekode-tilnærmingen senker ikke bare barrierer for utviklere, men gir også fart på Alibabas langsiktige AI-økosystemutvidelse.
Kompletterer sin åpen kildekodeinnsats, understreker Alibabas prisstrategi ytterligere bud for å fange markedsandelen. I desember 2024 reduserte selskapet prisene for sine QWEN-VL-modeller med 85%, noe som økte prisgunstigheten for bedrifter og utviklere. I desember 2024 skåret selskapet prisen på Qwen-VL-modellene med 85%, noe som gjorde AI mer tilgjengelig.
Denne prisstrategien utfordrer direkte konkurrenter som DeepSeek, som nylig sto overfor API-tilgangsbegrensninger på grunn av overveldende etterspørsel. Ved å kombinere åpen kildekode med konkurransedyktige priser, styrker Alibaba sin posisjon blant utviklere og bedrifter, og tilbyr løsninger som er både skalerbare og økonomisk levedyktige.
Når Alibaba og DeepSeek fortsetter sin konkurranse, kan deres forskjellige strategiske tilnærminger forme den fremtidige banen til AI-utvikling i Kina. DeepSeeks kommende R2-modell vil bli nøye evaluert for sin resonnementnøyaktighet og effektivitet, spesielt midt i regulatoriske trykk og maskinvarebegrensninger. I mellomtiden posisjonerer Alibabas vektlegging av forklarbare AI-modeller som R1-Omni og dens open source-initiativer det som ledende for å sette nye bransjestandarder for tilgjengelighet og effektivitet.