Google memperluas alat kecerdasan buatannya untuk pelanggan perniagaan, mendedahkan kemas kini yang besar kepada model generasi media semasa AI studio platform melalui Gemini Api.
Pelancaran awal memberikan beberapa pengalaman pengguna berasaskan AS dengan VEO 2. Akses awal muncul terhad, dan pengguna di luar AS mungkin memerlukan penyelesaian teknikal seperti VPN untuk melihat pilihan. Keupayaan semasa, seperti yang dilaporkan oleh penguji awal dan disahkan dalam blog pemaju Google, ditetapkan pada resolusi 720p dan 24 bingkai sesaat, dengan tempoh video maksimum 8 saat. Penyebaran awal ini mengikuti pengumuman awan seterusnya di mana Google terperinci ciri baru Veo 2 memasuki pratonton di puncak AI, termasuk dipertingkatkan Dengan pelbagai pilihan penceramah dan beroperasi di bawah proses pengesahan yang dinyatakan untuk memeriksa kebenaran penggunaan yang betul. Chirp 3 juga memperkenalkan alat transkripsi yang direka untuk membezakan antara penceramah yang berbeza dalam rakaman.
Generasi imej tidak ditinggalkan. Imagen 3, yang menyaksikan pelancaran pratonton awal di Vertex AI, menerima peningkatan selanjutnya yang diumumkan di Cloud Seterusnya. Penambahbaikan ini memberi tumpuan kepada membina semula bahagian imej yang hilang (inpainting) dan penyingkiran objek berkualiti yang lebih tinggi, yang bertujuan untuk output imej yang lebih realistik dan terperinci berbanding dengan versi sebelumnya. Blog rasmi Google menyerlahkan Vertex AI sebagai unik menawarkan model generatif yang merangkumi video, imej, ucapan, dan muzik. Strategi ini meletakkan Google dalam persaingan langsung dengan platform AI Cloud lain seperti Amazon Bedrock. Acara Next Cloud juga menyaksikan pengumuman AI yang lebih luas, termasuk silikon adat baru seperti TPU Ironwood dan kerangka seperti Kit Pembangunan Ejen (ADK), menandakan fokus AI yang luas untuk pelanggan Google Cloud. Google menyatakan bahawa media yang dihasilkan oleh model yang lebih baru seperti Imagen, Veo, dan Lyria menggabungkan watermark sintetik. Syarikat itu juga merujuk kepada perlindungan terbina dalam penciptaan kandungan yang berbahaya dan proses pengesahan khusus untuk alat pengklonan suara. Ini kekal sebagai topik yang sensitif di seluruh industri, dengan berterusan