Fillimi i zërit të AI ElevenLabs lançoi sot modelet e tij Scribe v2 dhe Scribe v2 Realtime të të folurit në tekst, të dizajnuara për aplikacione të drejtpërdrejta dhe interaktive.
Scribe v2 ofron saktësinë më të lartë të mundshme në transkriptimin e audios, duke i dhënë përparësi besnikërisë së transkriptimit, si p.sh. përmbajtja e regjistruar, arkivimi i saktë në kohë reale, v2, arkivimi i saktë, v2 në kohë reale. transkriptim i drejtpërdrejtë, në kohë reale dhe ofron shpejtësi lider në industri me vonesë jashtëzakonisht të ulët prej rreth 150 milisekonda duke ruajtur saktësi të lartë
Sipas kompanisë me bazë në Londër Scribe v2 Realtime mundëson agjentë më të natyrshëm të AI, ndihmës takimesh dhe titrim në kohë reale. I disponueshëm tani nëpërmjet API-së së tij, mjeti i ri synon të ofrojë saktësi në nivel njerëzor në 90 gjuhë.
Lëshimi forcon shtytjen e ElevenLabs në tregun e ndërmarrjeve, duke ofruar një komponent kritik për zhvilluesit që ndërtojnë përvoja të përgjegjshme të fuqizuara nga zëri.
Lëvizja e tij ndjek rritjen e fundit të kompanisë në vlerësimin e saj 6 miliardë dollarësh. Hapësira e inteligjencës artificiale.
Një standard i ri për transkriptimin në kohë reale
I projektuar posaçërisht për mjedise të drejtpërdrejta dhe interaktive, Scribe v2 Realtime adreson një pengesë kritike në inteligjencën artificiale zanore: shpejtësinë.
Kompania thekson një vonesë transkriptimi prej nën 15 milikononje me pak se 15 milliterike. biseda e ngjashme me njeriun.
[përmbajtje e integruar]
Aftësitë e tilla janë thelbësore për aplikacionet ku përgjigja e menjëhershme është e panegociueshme. Një veçori unike që kontribuon në këtë shpejtësi është”vonesa negative”, ku modeli parashikon fjalën dhe shenjat e pikësimit të ardhshëm, duke reduktuar më tej vonesën e perceptuar, sipas kompanisë.
saktësi në më shumë se 90 gjuhë. Sipas faqes së produktit, Scribe v2 Realtime tejkalon disa konkurrentë të mëdhenj në standardet e brendshme, duke përfshirë Gemini Flash 2.5 të Google, GPT-4o Mini të OpenAI dhe Deepgram v2Scriva’s. Rezultati i standardit të FLEURS (Burimi: ElevenLabs)
Duke vazhduar një tendencë të performancës për kompaninë, ajo më parë duke publikuar të dhënat e para të fjalës së saj në e-gene Ofertat e OpenAI, duke krijuar një rekord konkurrues.
Fuqizimi i Gjeneratës së ardhshme të AI bashkëbiseduese
Në një treg të mbushur me shërbime transkriptimi, ElevenLabs po bast mbi shpejtësinë dhe saktësinë për të kapur segmentin e ndërmarrjes që ndërton ndërfaqe zanore të gjeneratës së ardhshme. Rastet e tij kryesore të përdorimit përqendrohen në AI bisedore, ku vonesa e ulët lejon ndërveprime më të rrjedhshme në agjentët zanorë për shitje ose mbështetje.
Për përdoruesit fundorë, kjo përkthehet në biseda me më pak pauza të sikletshme, duke i bërë ndërveprimet me sistemet e automatizuara të ndihen më të natyrshme.
Modeli i ri është tashmë i integruar në pronësi të kompanisë
Ky integrim pa probleme përputhet me vizionin afatgjatë të kompanisë. CEO Mati Staniszewski ka deklaruar,”zëri është ndërfaqja e së ardhmes dhe ne po ndërtojmë për të siguruar që ElevenLabs të vazhdojë të jetë zëri i teknologjisë.”
Duke ofruar një mjet themelor për të kuptuar zërin në kohë reale, ElevenLabs synon të bëhet një pjesë e domosdoshme e ekosistemit në rritje të softuerit të fuqizuar nga zëri.
-Reater3 Për zhvilluesit që ndërtojnë valën e ardhshme të aplikacioneve me fuqi zëri, qasja e parë e modelit API thjeshton integrimin. ElevenLabs e ka vënë në dispozicion Scribe v2 Realtime përmes API-së së tij ekzistuese, duke siguruar që ai të jetë i aksesueshëm për bazën e tij të gjerë të përdoruesve. ElevenLabs sqaroi gjithashtu modelin e tij të çmimeve, duke konfirmuar se përdorimi do të faturohet kundrejt kuotave për orë të planeve ekzistuese të abonimit. Kjo shmang prezantimin e një niveli të ri kompleks çmimesh për teknologjinë e saj më të fundit, siç detajohet në dokumentacionin e tij API. Për të përmbushur nevojat e klientëve të korporatave, platforma përfshin një sërë veçorish të nivelit të ndërmarrjes. Zbulimi i aktivitetit zanor (VAD) ndihmon në menaxhimin efikas të transmetimeve audio duke filtruar heshtjen, duke reduktuar kostot e përpunimit. Ekziston gjithashtu një modalitet i mbajtjes zero për trajtimin e ngarkesave të ndjeshme të punës, sipas njoftimit. Për më tepër, përputhja me standardet si SOC 2 dhe GDPR është thelbësore për adoptimin e modeleve shëndetësore të industrisë, të tilla si industria e financave, si p.sh. treg i adresueshëm. Lansimi i produktit të tij është lëvizja më e fundit nga një kompani që po përjeton rritje shpërthyese. Vetëm dy muaj më parë, ElevenLabs njoftoi një ofertë tenderi që dyfishoi vlerësimin e tij në 6.6 miliardë dollarë. Ky lajm erdhi pasi ai tejkaloi 200 milionë dollarë të ardhura vjetore të përsëritura, siç u raportua në shtator. Ngjitja e tij e shpejtë është e jashtëzakonshme. E themeluar në vitin 2022 nga ish-inxhinierë të Google dhe Palantir, kompania përparoi nga një raund i paraardhur prej 2 milionë dollarësh në fillim të vitit 2023 në statusin e saj shumë miliardë dollarësh në më pak se tre vjet, duke e përshkallëzuar ekipin dhe operacionet e saj me një ritëm të vrullshëm, . Nga mjetet fillestare të tekstit në të folur deri te hyrja e saj kontroverse, por e kujdesshme ligjore në hapësirën muzikore të AI, ElevenLabs ka zgjeruar vazhdimisht ofertat e saj. Lëshimi i Scribe v2 Realtime është një hap strategjik që thellon aftësitë e saj të ndërmarrjes. Duke ofruar një motor transkriptimi me performancë të lartë për të plotësuar modelet e saj të sintezës së zërit të përdorur gjerësisht, kompania pozicionohet për të kapur një pjesë më të madhe të tregut të zhvillimit të inteligjencës artificiale zanore nga skaji në skaj.Ndërtimi mbi një themel të rritjes së shpejtë