Μια ομάδα ερευνητών από το HKUST και το M-P-P κυκλοφόρησε το Yue, μια οικογένεια μοντέλων AI ανοιχτού κώδικα που μπορούν να δημιουργήσουν πλήρους μήκους, πέντε λεπτών τραγουδιών από στίχους Just Text. Ανακοινώθηκε παράλληλα με το A Τεχνικό χαρτί για το arxiv , yue εισέρχεται σε μια βιομηχανία που αντιμετωπίζει έντονο νομικό έλεγχο. Target=”_ blank”> Διατίθεται μέσω github Κάτω από ένα επιτρεπόμενο apache 2.0 Άδεια . Αυτή η κίνηση στοχεύει στην προώθηση της διαφανούς καινοτομίας στη δημιουργία μουσικής AI, προσφέροντας μια ισχυρή, νομικά προσβάσιμη εναλλακτική λύση για τους καλλιτέχνες και τους προγραμματιστές. Οι ερευνητές το αποδίδουν σε αρκετές αρχιτεκτονικές καινοτομίες που αναλύονται λεπτομερώς στο χαρτί
Αυτό επιτρέπει στο μοντέλο να επεξεργάζεται φωνητικά και συνοδεία ως ξεχωριστά, παράλληλα ρεύματα. Αυτό αποτρέπει τα πυκνά όργανα, τα κοινά σε είδη όπως το μέταλλο, από τη συντριπτική και τη στρέβλωση της φωνητικής διαδρομής, εξασφαλίζοντας λυρική σαφήνεια. Με το σπάσιμο ενός τραγουδιού σε λογικά τμήματα όπως ο [στίχος] και η [χορωδία], το μοντέλο επικεντρώνεται στη διατήρηση της μελωδικής συνέπειας σε κάθε τμήμα πριν μετακομίσει στο επόμενο, αποτρέποντας την υποβάθμιση της ποιότητας σε μακρές ακολουθίες. Οι χρήστες μπορούν να παρέχουν ένα σύντομο κλιπ ήχου για να καθοδηγήσουν το στυλ, επιτρέποντας την κλωνοποίηση φωνής υψηλής πιστότητας και τις μεταφορές στυλ κάμψης. Το Επίσημη σελίδα demo Διαθέτει εντυπωσιακά παραδείγματα προχωρημένων φωνητικών τεχνικών που δεν είναι ρητά εκπαιδευμένα για, όπως το Scatting, το Death Growls και το Multi-Part A Cappella Harmonies. Πεδίο
Το ντεμπούτο του Yue έρχεται καθώς ο κόσμος της μουσικής AI αγωνίζεται με θεμελιώδη νομικά ερωτήματα. Τον Ιούνιο του 2024, η RIAA κλιμάκωσε τη σύγκρουση με το Suno και το Udio για μαζική παραβίαση πνευματικών δικαιωμάτων. Ο Πρόεδρος και Διευθύνων Σύμβουλος της RIAA Mitch Glazier προειδοποίησε ότι”οι μη αδειοδοτημένες υπηρεσίες όπως η Suno και η Udio ισχυρίζονται ότι είναι« δίκαιη »για να αντιγράψουν τις εργασίες της ζωής του καλλιτέχνη… να επιστρέψουν την υπόσχεση της πραγματικά καινοτόμου AI για όλους μας. μαζική κλίμακα.”Και οι δύο εταιρείες υπερασπίστηκαν την τεχνολογία τους με το δόγμα της”δίκαιης χρήσης”, με τον CEO της Suno Mikey Shulman να ισχυρίζεται ότι το μοντέλο του”… σχεδιάστηκε για να δημιουργήσει εντελώς νέες εξόδους, να μην απομνημονεύσει και να ανατρέψει τις προ-υπάρχουσες περιεχόμενο.”Μέσα σε αυτή την αβεβαιότητα, άλλοι παίκτες καταγράφουν μια πιο προσεκτική πορεία. Η Voice AI Startup Elevenlabs ξεκίνησε πρόσφατα το δικό της εργαλείο, έντεκα μουσική, χτισμένη σε μια στρατηγική”πρώτης άδειας”. Ο Διευθύνων Σύμβουλος Mati Staniszewski υπογράμμισε ότι”το μοντέλο δημιουργείται αυστηρά σε δεδομένα στα οποία έχουμε πρόσβαση.”
Οι μουσικοί πολέμοι AI: ένα τοπίο αγωγών και αδειών
Η βιομηχανία παραμένει βαθιά χωρισμένη από το πώς να προχωρήσει, αναγκάζοντας τις πλατφόρμες και τις εταιρείες τεχνολογίας να επιλέξουν προσεκτικά τις στρατηγικές τους. Η μουσική της Google AI Sandbox υδατογράφησε όλες τις εξόδους της για να εξασφαλίσει την ανιχνευσιμότητα. Η Nvidia πήρε ένα ακόμη πιο συντηρητικό βήμα, αποκαλύπτοντας το ισχυρό μοντέλο ήχου Fugatto, αλλά παρακρατεί τη δημόσια απελευθέρωσή του. Μια εταιρεία VP, Bryan Catanzaro, σημείωσε ότι”οποιαδήποτε γενετική τεχνολογία μεταφέρει πάντα ορισμένους κινδύνους, επειδή οι άνθρωποι θα μπορούσαν να το χρησιμοποιήσουν για να δημιουργήσουν πράγματα που θα προτιμούσαμε να μην το κάνουν”. Η Spotify επιβεβαίωσε ότι θα επέτρεπε τη μουσική της AI, αλλά την αστυνομία που δεν έχουν εξουσιοδοτηθεί φωνητικές παραμορφώσεις, ενώ η Universal Music και ο Deezer ανακοίνωσαν προηγουμένως ένα”καλλιτέχνη”μοντέλο για να δώσουν προτεραιότητα στους ανθρώπινους δημιουργούς σε υπολογισμούς δικαιωμάτων. Ενώ ορισμένοι καλλιτέχνες αγκαλιάζουν το AI ως συνεργατικό εργαλείο, άλλοι φοβούνται ότι υποτιμούν την ανθρώπινη τέχνη. Αυτό το συναίσθημα καταγράφηκε φημισμένα από τον συγγραφέα Joanna Maciejewska, ο οποίος δήλωσε:”Θέλω να κάνω τα ρούχα και τα πιάτα μου, ώστε να μπορώ να κάνω τέχνη και να γράφω, όχι για να κάνω την τέχνη και τη γραφή μου, ώστε να μπορώ να κάνω τα πλυντήρια και τα πιάτα μου.”Target=”_ blank”> Εργαλείο ανοικτού κώδικα , οι δημιουργοί του κάνουν μια σκόπιμη δήλωση. Στοιχηματίζουν ότι η διαφάνεια και η ανάπτυξη της κοινότητας, αντί της έκθεσης κλειστής πόρτας, θα καθορίσουν τελικά το μέλλον της AI στη μουσική.