Google erweitert sein Toolkit für künstliche Intelligenz für Geschäftskunden und enthüllt wesentliche Updates für seine Mediengenerierungsmodelle während seines ai Studio-Plattform über das Gemini-API-API-API.

Der anfängliche Rollout bietet einigen US-amerikanischen Benutzern praktische Erfahrung mit Veo 2. Early Access erscheint begrenzt, und Benutzer außerhalb der USA benötigen möglicherweise technische Problemumgehungen wie VPNs, um die Option überhaupt zu erkennen. Die aktuellen Funktionen, die von frühen Tester gemeldet und im Entwicklerblog von Google bestätigt wurden, werden auf eine Auflösung von 720p und 24 Frames pro Sekunde mit einer maximalen Videodauer von 8 Sekunden festgelegt. Diese anfängliche Bereitstellung folgt der nächsten Ankündigung der Cloud, bei der Google neue Veo 2-Funktionen in der Vorschau auf Vertex AI detailliert eingingen, einschließlich erweitert . Google schlägt vor, dass Lyria komplette Musikstücke in verschiedenen Genres aus Textanweisungen produzieren kann, was Unternehmen möglicherweise dazu beiträgt, benutzerdefinierte Audio für Marketingkampagnen oder immersive Erlebnisse zu erstellen und möglicherweise die Abhängigkeit von herkömmlichen Musikbibliotheken zu verringern, und deren zugehörige Lizenzkomplexitäten. CHIRP 3, Googles Audio-Generierung und-verständnismodell, das im Allgemeinen auf der Vertex AI verfügbar wird. Nach einer früheren Vorschau-Phase, die im März 2025 gemeldet wurde, enthält Chirp 3 jetzt formell eine Funktion „Sofort benutzerdefinierte Sprache“, die Google behauptet, eine Stimme aus nur 10 Sekunden Audio zu klonen. Mehrere Lautsprecheroptionen und arbeitet unter einem angegebenen Überprüfungsprozess, um nach ordnungsgemäßen Nutzungsberechtigungen zu überprüfen. CHIRP 3 führt auch ein Transkriptionswerkzeug ein, das zwischen verschiedenen Lautsprechern in Aufzeichnungen unterscheidet. Imageen 3, bei dem eine frühere Vorschau-Rollout auf der Vertex AI zu sehen war, erhielt weitere Verbesserungen, die als nächstes bei Cloud angekündigt wurden. Diese Verbesserungen konzentrieren sich auf eine bessere Rekonstruktion fehlender Bildteile (Inpainting) und einer höheren Objektentfernung, die auf realistischere und detailliertere Bildausgabe abzielen. Der offizielle Blog von Google hob die Vertex AI als einzigartige Generativmodelle hervor, die Video, Bild, Sprache und Musik überspannen. Diese Strategie versetzt Google in direkten Wettbewerb mit anderen Cloud-KI-Plattformen wie Amazon Bedrock. Bei der Cloud-Veranstaltung im nächsten Ereignis wurden auch breitere KI-Ankündigungen, darunter ein neues kundenspezifisches Silizium wie das Ironwood TPU und die Frameworks wie das Agent Development Kit (ADK), und signalisierte einen weitreichenden KI-Fokus für Google Cloud-Kunden. Google erklärte, dass Medien, die von seinen neueren Modellen wie Image, Veo und Lyria generiert wurden, synthidische Wasserzeichen integrieren. Das Unternehmen verwies auch auf integrierte Schutzmaßnahmen gegen die Erstellung der schädlichen Inhalte und den spezifischen Überprüfungsprozess für das Sprachkloning-Tool. Dies bleibt ein sensibler Thema, das branchenweit ist, mit laufend