Google sta ampliando il suo toolkit di intelligenza artificiale per i clienti aziendali, rivelando sostanziali aggiornamenti ai suoi modelli di generazione di media durante il suo cloud alla prossima conferenza sul 9 aprile 2025 , bersaglio in primo piano. Dimostrando un rapido follow-through, il modello di generazione di video Veo 2 dell’azienda ha iniziato ad apparire per utenti selezionati l’11 aprile, accessibile tramite Piattaforma di Strong>
L’implementazione iniziale offre ad alcuni utenti basati sugli utenti con cui VEO 2. L’accesso anticipato appare limitato e gli utenti al di fuori degli Stati Uniti potrebbero aver bisogno di soluzioni tecniche come VPN per vedere l’opzione. Le funzionalità attuali, come riportato dai primi tester e confermati nel blog di sviluppatori di Google, sono impostate con una risoluzione 720p e 24 frame al secondo, con una durata video massima di 8 secondi.
[contenuto incorporato]
Questo accesso ha un costo, ancorato a $ 0,35 al secondo dei filmati generati, un fattore che probabilmente influenza la sua adozione per vari progetti. Questa distribuzione iniziale segue il prossimo annuncio di cloud in cui Google ha dettagliato le nuove funzionalità Veo 2 che entrano in anteprima su Vertex AI, tra cui potenziata Per effetti come rimozione di fondo o interruzioni temporali. La separazione tra l’anteprima delle caratteristiche su Vertex AI e il lancio del modello su AI Studio suggerisce percorsi di accesso diversi per gli sviluppatori aziendali rispetto ai singoli creatori o tester.
consentire la richiesta di richiesta . Google suggerisce che Lyria può produrre pezzi musicali completi attraverso diversi generi dalle istruzioni di testo, potenzialmente aiutando le aziende a creare audio personalizzati per campagne di marketing o esperienze immersive, riducendo potenzialmente la dipendenza dalle biblioteche di musica stock tradizionali e le loro complessità di licenze. CHIRP 3, modello di generazione e comprensione di Google, diventando generalmente disponibile su Vertex AI. A seguito di una fase di anteprima precedente riportata intorno a marzo 2025, CHIRP 3 ora include formalmente una funzione”Voce personalizzata istantanea”, che Google afferma che Google può clonare una voce da soli 10 secondi di audio.
Questa funzione supporta
La generazione di immagini non è stata esclusa. Imagen 3, che ha visto un precedente lancio di anteprima su Vertex AI, ha ricevuto ulteriori miglioramenti annunciati su Cloud Avanti. Questi miglioramenti si concentrano sulla migliore ricostruzione di parti di immagini mancanti (dipinte) e una rimozione di oggetti di qualità superiore, mirando a un output di immagini più realistico e dettagliato rispetto alle versioni precedenti. Questi aggiornamenti su più tipi di media sotto la spinta di Google per produrre una piattaforma di enterprise, in particolare per i media. Il blog ufficiale di Google ha evidenziato Vertex AI come offrendo modelli generativi in modo univoco che abbraccia video, immagini, discorsi e musica. Questa strategia colloca Google in diretta concorrenza con altre piattaforme di AI cloud come Amazon Bedrock. Il prossimo evento Cloud ha anche visto annunci di intelligenza artificiale più ampi, tra cui un nuovo silicio personalizzato come Ironwood TPU e framework come il Kit di sviluppo degli agenti (ADK), che segnalano un focus di intelligenza artificiale ad ampio raggio per i clienti di Google Cloud. Google ha dichiarato che i media generati dai suoi nuovi modelli come Imagen, Veo e Lyria incorporano filigrane sintosetiche. La società ha anche fatto riferimento a garanzie integrate contro la creazione di contenuti dannosi e il processo di verifica specifica per lo strumento di clonazione vocale. Tuttavia, Google non ha specificato i set di dati utilizzati per la formazione di questi potenti modelli. Questo rimane un argomento sensibile in tutta l’industria, con in corso
Google affilia ai bordo per gli utenti aziendali