Google laajentaa keinotekoista älykkyyttään työkalupakkia yritysasiakkaille, paljastaen merkittäviä päivityksiä median sukupolven malleihinsa Cloud-konferenssi 9. huhtikuuta 2025 , ensisijaisesti Vertheks AI-lavalla. Yrityksen VEO 2-videon sukupolven malli aloitti nopean seuraajien nopean seurannan kautta valittujen käyttäjien 11. huhtikuuta, joihin pääsee Googlen AI Studio Platform Gemini Api-sovelluksen

-video-työkalun kautta. Käyttöliittymä antaa joitain yhdysvaltalaisia ​​käyttäjiä käytännön kokemusta VEO 2: sta. Varhainen pääsy näyttää rajoitetulta, ja Yhdysvaltojen ulkopuoliset käyttäjät saattavat tarvita teknisiä kiertotapoja, kuten VPN: t, jopa nähdäksesi vaihtoehdon. Nykyiset ominaisuudet, kuten varhaiset testaajat ovat ilmoittaneet ja vahvistettu Googlen kehittäjäblogissa, asetetaan 720p-resoluutiolle ja 24 kehystä sekunnissa, ja videon enimmäiskesto on 8 sekuntia. Tämä alkuperäinen käyttöönotto seuraa Cloud Next-ilmoitusta, jossa Google yksityiskohtaiset uudet VEO 2-ominaisuudet ovat tulossa esikatseluun Vertex AI: iin, mukaan lukien parantunut Vaikutusten, kuten taustan poisto tai aikataulut. Vertex AI: n ominaisuuksien esikatselun ja AI-studion mallin käyttöönoton välinen ero ehdottaa yrityksen kehittäjille erilaisia ​​pääsyreittejä verrattuna yksittäisiin luojiin tai testaajiin. > Lyria lisää AI-musiikin sukupolven

Videon rinnalla Google esitteli Lyrian, sen tekstin ja musiikin AI-mallin nyt yksityisessä esikatselussa Vertex AI: ssä hyväksytyille asiakkaille sallistalistapyyntömuoto . Google ehdottaa, että Lyria voi tuottaa täydellisiä musiikillisia kappaleita eri tyylilajeista teksti-ohjeista, mikä voi auttaa yrityksiä luomalla räätälöityjä ääniä markkinointikampanjoille tai syventäville kokemuksille, mikä mahdollisesti vähentäisi perinteisten osakekannat-kirjastojen luottamista ja niihin liittyviä lisensointia monimutkaisuuksia. Chirp 3, Googlen äänentuotanto-ja ymmärrysmalli, joka on yleisesti saatavana Vertex AI: llä. Aikaisemman esikatseluvaiheen jälkeen, joka on ilmoitettu maaliskuussa 2025, Chirp 3 sisältää nyt muodollisesti’välittömän mukautetun äänen’ominaisuuden, jonka Google-väitteet voivat kloonata äänen vain 10 sekunnista äänen. Useita kaiutinvaihtoehtoja ja toimii ilmoitetun vahvistusprosessin mukaisesti tarkistaaksesi asianmukaiset käyttöoikeudet. Chirp 3 esittelee myös transkriptiotyökalun, joka on suunniteltu erottamaan eri kaiuttimet nauhoituksissa.

kuvan luomista ei jätetty pois. Image 3, joka näki aikaisemman esikatselun käyttöönoton Vertex AI: llä, sai vielä lisäparannuksia seuraavaksi Cloudissa. Nämä parannukset keskittyvät parempaan rekonstruointiin puuttuvien kuvaosien (maalaus) ja laadukkaampaan objektin poistoon, jolloin realistisempi ja yksityiskohtaisempi kuvatulos on aiempiin versioihin verrattuna. Googlen virallinen blogi korosti Vertex AI: tä, joka tarjoaa ainutlaatuisesti generatiivisia malleja, jotka kattavat videon, kuvan, puheen ja musiikin. Tämä strategia asettaa Googlen suoraan kilpailuun muiden Cloud AI-alustojen kanssa, kuten Amazon Bedrock. Seuraavassa Cloud-tapahtumassa nähtiin myös laajemmat AI-ilmoitukset, mukaan lukien uudet mukautetut piit, kuten Ironwood TPU ja kehykset, kuten Agent Development Kit (ADK), mikä merkitsi laaja-alaisen AI-painopisteen Google Cloud-asiakkaille. Google totesi, että sen uudempien mallien, kuten Imagen, Veeo ja Lyria, tuottamat mediat sisältävät syntettivesileimat. Yhtiö viittasi myös sisäänrakennettuihin suojatoimiin haitallista sisällön luomista ja äänikloonaustyökalun erityistä varmennusprosessia.

Google ei kuitenkaan määrittänyt näiden tehokkaiden mallien kouluttamiseen käytettyjä tietojoukkoja. Tämä on edelleen herkkä aiheala-maailma, jolla on meneillään olevaa