Ein Team von Forschern von HKUST und M-A-P hat Yue veröffentlicht, eine Familie von AI-Modellen mit Open-Source-Modellen, die in der Lage sind, in voller Länge, fünfminütige Songs aus Just Text-Texten zu erzeugen. Angekündigt neben einem technisches Papier auf Arxiv , tritt Yue eine Branche mit einer intensiven legalen Prüfung ein. target=”_ leer”> verfügbar über GitHub unter einem ermessenen Apache 2.0 Lizenz . Dieser Schritt zielt darauf ab, transparente Innovationen bei der KI-Musik zu fördern und eine legal zugängliche Alternative für Künstler und Entwickler zu bieten. Die Forscher führen dies auf mehrere architektonische Innovationen zurück, die in ihrem Papier . src=”https://winbuzer.com/wp-content/uploads/2024/04/microsoft-voice-ai-generic.jpg”>

Eine Schlüsseltechnik ist”Track-Decoubled Next-Token Prediction”. Auf diese Weise kann das Modell Vocals und Begleitung als separate parallele Ströme verarbeiten. Dies verhindert dichte instrumentelle Abschnitte, die in Genres wie Metall üblich sind, von überwältigender und verzerrter Stimmspur, um die lyrische Klarheit zu gewährleisten. Durch das Aufentieren eines Songs in logische Segmente wie [Vers] und [Chor] konzentriert sich das Modell auf die Aufrechterhaltung der melodischen Konsistenz in jedem Abschnitt, bevor sie zum nächsten wechselt, wodurch die Qualitätsverschlechterung über lange Sequenzen verhindert wird. Benutzer können einen kurzen Audioclip zur Verfügung stellen, um den Stil zu leiten, um das Klonen von Hochfidelität und den Genre-Biege-Stil zu ermöglichen. Das offizielle Demo-Seite enthält beeindruckende Beispiele für fortgeschrittene Stimmtechniken, die nicht ausdrücklich darauf trainiert wurden, wie Scatting, Todesfälle und Multi-Part-Harmongers. Das Debüt von Field

Yues ist, als die AI Music World mit grundlegenden rechtlichen Fragen gilt. Im Juni 2024 eskalierte der RIAA den Konflikt, indem er Suno und Udio wegen Massen-Urheberrechtsverletzung verklagte. Der Vorsitzende und CEO von RIAA, Mitch Glazier, warnte, dass”nicht lizenzierte Dienste wie Suno und Udio behaupten, es sei”fair”, das Lebenswerk eines Künstlers zu kopieren… das Versprechen eines wirklich innovativen KI für uns alle.”Skala.”Beide Unternehmen haben ihre Technologie unter der Lehre „Fair Use“ verteidigt. Der CEO von Suno, Mikey Shulman, behauptete, sein Modell sei „… entworfen, um völlig neue Ausgaben zu generieren, um nicht vorbestehende Inhalte zu merken und wiederzubeleben. Inmitten dieser Unsicherheit kennzeichnen andere Spieler einen vorsichtigeren Kurs. Voice AI Startup ElevenLabs hat kürzlich ein eigenes Tool, Eleven Music, aufgebaut, das auf einer „lizenzigen“ Strategie basiert. CEO Mati Staniszewski betonte, dass „das Modell streng für Daten erstellt wurde, auf die wir Zugriff haben. Die Branche bleibt tief unterteilt, wie sie vorgehen sollen, und zwingt Plattformen und Technologieunternehmen, ihre Strategien sorgfältig auszuwählen. Googles Music AI Sandbox Watermarks Alle Ausgaben, um die Rückverfolgbarkeit zu gewährleisten. Nvidia machte einen noch konservativeren Schritt und enthüllte sein leistungsstarkes Fugatto-Audiomodell, hat jedoch seine öffentliche Befreiung zurückgehalten. Ein Unternehmen Vizepräsident, Bryan Catanzaro, stellte fest, dass „jede generative Technologie immer einige Risiken birgt, da die Leute dies möglicherweise nutzen, um Dinge zu generieren, die wir bevorzugen würden.“

Streaming-Plattformen zeichnen auch Linien. Spotify bestätigte, dass es KI-Musik ermöglichen würde, aber die Polizei nicht autorisierte Sprachimpotationen, während Universal Music und Deezer zuvor ein „künstlerisch-zentriertes“ Modell ankündigten, um menschliche Schöpfer in Lizenzgebührenberechnungen zu priorisieren. Während einige Künstler die KI als kollaboratives Werkzeug einnehmen, befürchten andere, dass es die menschliche Kunst abwertet. Dieses Gefühl wurde von der Autorin Joanna Maciejewska berühmt gefangen genommen, die sagte: „Ich möchte, dass Al meine Wäsche und meine Gerichte waschen, damit ich Kunst und Schreiben machen kann, nicht damit Al meine Kunst und schreibe, damit ich meine Wäsche und meine Wäsche waschen kann. target=”_ leer”> Open-Source-Tool seine Schöpfer geben eine absichtliche Aussage. Sie setzen darauf, dass Transparenz und Gemeinschaftsentwicklung und nicht mit Rechtsstreitigkeiten mit geschlossenen Türen die Zukunft von KI in der Musik definieren werden.

Categories: IT Info