Google stworzyło AI do generowania muzyki. Jest tak dobra, że nie zostanie wypuszczona
Już nie tylko generatory obrazu i tekstu, ale teraz także muzyki.
Koncepcja sztucznej inteligencji towarzyszy nam już od lat 50. ubiegłego wieku, a choć sam zamysł przetrwał do dziś w niemal identycznej formie, to jej rozwój wielokrotnie hamował ze względu na ograniczenia technologiczne. W ostatnich latach coś się jednak zaczęło zmieniać – na tyle, że właściwie każdy człowiek zdolny do obsługi komputera mógł sprawdzić działanie popularnych generatorów obrazów, takich jak Midjourney, DALL-E oraz Stable Diffusion.
Potem przyszedł czas na SI, z którą można sobie porozmawiać – ChatGPT nie przypomina prymitywnych, internetowych chatbotów sprzed lat i już pojawiły się przesłanki co do tego, że zagości w niemal każdym domu, w którym znajduje się komputer. A co z muzyką? Skoro uczone maszynowo generatory radzą sobie z innymi dziedzinami sztuki, to tylko kwestią czasu było powstanie czegoś, co będzie zdolne do „komponowania”…
MusicLM, bo taką nazwę nosi najnowsze dziecko Google’a, nie jest oczywiście pierwszym tego typu generatorem, ponieważ Riffusion czy Jukebox istnieją już od jakiegoś czasu, jednak to właśnie MusicLM jest na tyle zaawansowany, że firma postanowiła go… nie wypuszczać.
Chodzi tu głównie o złożoność kompozycji – tam, gdzie zawodziły inne generatory, wytrenowany na bazie 280 tysięcy godzin muzyki MusicLM radzi sobie bardzo dobrze, wypluwając imponujące efekty. Aplikacja zaskakująco trafnie rozpoznaje wprowadzane polecenia i nawet nieźle jej idzie generowanie wokalu, choć trudno byłoby rozpoznać język, jakim się posługuje.
Oprócz polecenia tekstowego, MusicLM jest w stanie interpretować muzyką obrazy, a użytkownik może wybrać konkretny instrument dla SI, wybrać poziom zaawansowania wirtualnego „muzyka”, czy zasugerować mu jakieś miejsce i epokę. Średniowieczny jazz byłby pewnie trochę dziwny, ale naśladowanie stereotypowych stylów ostatnich dekad XX wieku idzie jej całkiem nieźle.
Problemem z tego typu przedsięwzięciami jest zawsze to samo – kwestie etyczne, bo przecież mamy tu ogromne pole do nadużyć w kwestii prawa autorskiego. W dokumencie opisującym działanie generatora przeczytamy, że tylko 1% muzyki to bezpośrednia kopia istniejących piosenek, ale to ciągle o 1% za dużo. Jak piszą sami twórcy:
Mocno podkreślamy potrzebę dalszej pracy nad rozwiązaniem zagrożeń związanych z generowaniem muzyki – w tym momencie nie planujemy wypuszczać żadnego modelu.
Nie ma żadnych konkretów co do tego, czy MusicLM po odpowiednim dostosowaniu trafi do sieci, ale prace nad SI mają trwać dalej. Najpierw autorzy skupią się na doskonaleniu wokali. Z kolei jeśli chcecie posłuchać, co w „duszy” MusicLM gra, to z wieloma przykładami działania wirtualnego muzyka zapoznacie się tutaj.
Czytaj dalej
I have no mouse and I must click.