Openai rrit modelet e fjalës së AI me zëra më realistë dhe transkriptim të përmirësuar

Openai ka nisur modelet e azhurnuara të të folurit në tekst dhe tekst në të folur, duke përmirësuar saktësinë e transkriptimit dhe zgjerimin e opsioneve të personalizimit për zërat e gjeneruar nga AI. Lojtarët e Google, Microsoft dhe në zhvillim si susami AI duke shtyrë kufijtë e realizmit sintetik të zërit.

Përmirësimi i të folurit në tekst: Fiksimi i gabimeve të transkriptimit dhe halucinacionet e AI

Openai i ri

Burimi: Openai

Ndërsa Openai pretendon se këto azhurnime zvogëlojnë ndjeshëm halucinacionet, vlerësimet e pavarura do të jenë të nevojshme për të verifikuar përmirësimet e saktësisë së tij. Modelet e transkriptimit të AI ende luftojnë në rastet e skajeve, veçanërisht kur trajtoni fjalimin e mbivendosur, zhurmën e rëndë në sfond, ose gjuhën informale bisedore. Target=”_ bosh”> Modeli i ri GPT-4O Mini TTS tekst-në-fjalë i dizajnuar për të bërë zëra të gjeneruar nga AI më ekspresiv, të personalizueshëm dhe të ngjashëm me njeriun. href=”https://openai.com/index/introducing-our-next-generation-audio-models/”target=”_ bosh”> sipas Openai ,”këto modele ofrojnë përmirësimin e transkriptimit të transkriptimit, të zvogëluar latencën, dhe të përmirësohet shprehshmëria e zërit për të sjellë aplikimet e fjalës AI-të ngjeshur me ndërtimin e ndërveprimeve të njeriut.”Gjithnjë e më konkurruese, me përparime të mëdha nga rivalët si Google dhe Microsoft. Modeli i ri i zërit të CHIRP 3 HD të Google lejon përshtatjen e tonit në kohë reale. Shqetësimet etike për dezinformimin dhe mashtrimin e krijuar nga AI.

Openai vetë është përballur me kritika të profilit të lartë mbi etikën e zërit. Në maj të vitit 2024, kompania hoqi një nga zërat e saj të gjeneruar nga AI, Sky, pasi përdoruesit vunë në dukje ngjashmërinë e saj me aktoren Scarlett Johansson. Johansson më vonë deklaroi se ajo”kurrë nuk kishte dhënë leje Openai për të përdorur zërin e saj.”Sidoqoftë, kompania ende nuk ka siguruar transparencë të plotë në masat mbrojtëse të sakta që ka zbatuar për të parandaluar përsëritjen e zërit të paautorizuar. Kompania i ka integruar këto modele me Agjent SDK , duke i mundësuar zhvilluesit të ndërtojnë sisteme AI të bazuara në zë për asistentët virtualë, chatbots të shërbimit të klientit, dhe akses të Agjentit. duke u zhvilluar në të gjithë industrinë. Raportet Financiare Raportet që Openai pret që zëri i drejtuar nga zëri AI të bëhet një ndërfaqe kryesore për të llogaritur nga llogaritja nga 2025, me një Agents Agents. Ndërkohë, Google është duke ngulitur AI në aplikacione të produktivitetit Ashtu si Gemini Canvas, dhe Microsoft IS Expandering”> Ekosistemi i kopilot. Modelet e fundit të Openai tregojnë përparime të qarta në realizëm dhe përdorueshmëri, por shqetësimet etike dhe të sigurisë rreth sintezës së zërit të drejtuar nga AI janë larg nga zgjidhja.

Openai rrit modelet e fjalës së AI me zëra më realistë dhe transkriptim të përmirësuar

Published by All Things Windows on March 20, 2025

Përmirësimi i të folurit në tekst: Fiksimi i gabimeve të transkriptimit dhe halucinacionet e AI

IT Info

Windows 11 24H2 UPDATE KB5053656 Sjell Windows & Kërko të Zgjeruar, Kërko Taskbar dhe veçori të tjera të reja. Shkarkoni lidhjen.

IT Info

Aktivizo Windows Hello Anti-Spoofing në Windows 11

IT Info

Aktivizoni Windows Hello Anti-Spoofing në Windows 11

Openai rrit modelet e fjalës së AI me zëra më realistë dhe transkriptim të përmirësuar

Published by All Things Windows on March 20, 2025

Përmirësimi i të folurit në tekst: Fiksimi i gabimeve të transkriptimit dhe halucinacionet e AI

Related Posts

IT Info

Windows 11 24H2 UPDATE KB5053656 Sjell Windows & Kërko të Zgjeruar, Kërko Taskbar dhe veçori të tjera të reja. Shkarkoni lidhjen.

IT Info

Aktivizo Windows Hello Anti-Spoofing në Windows 11

IT Info

Aktivizoni Windows Hello Anti-Spoofing në Windows 11