Sprawdź relację:
Dzieje się!
Analizy

Generatywna sztuczna inteligencja – selektywna rewolucja?

Treści generowane przez AI będą odpowiadały za bardzo istotną część rynku audiowizualnego i muzycznego. Prawdopodobnie rewolucja związana ze sztuczną inteligencją będzie dotyczyć głównie treści tworzonych dla „tła”, czyli pasywnych odbiorców.

Protest muzyków zrzeszonych The American Federation of Musicians (AFM) w Nowym Jorku we wrześniu 2024 r. Artyści wyrażali zaniepokojenie możliwością zastąpienia ich przez generatywną sztuczną inteligencję w tworzeniu muzyki do filmów i seriali.

Z tego artykułu dowiesz się…

  1. Ile będzie wart rynek muzyki i treści audiowizualnych generowany przez sztuczną inteligencję do 2028 r.
  2. Jakie będą kluczowe segmenty odpowiadające za wzrost rynku.
  3. Które prace kreatywne mają największy potencjał do substytucji przez sztuczną inteligencję i jakie mogą być tarcze ochronne stosowane przez AI.

Generatywna sztuczna inteligencja (Gen AI) ma ogromny potencjał do zrewolucjonizowania wszelkich prac zawierających kreatywne elementy. Od pisania książek przez nagrywanie muzyki, reklam, czy nawet filmów po tworzenie profesjonalnych raportów analitycznych. Może to być jednak selektywna rewolucja, która dotknie przede wszystkim treści obecne w „tle”, czyli dla pasywnych odbiorców.

Wartość muzyki i treści audiowizualnych tworzonych przez Gen AI zaliczy w najbliższych latach wykładniczy wzrost – jego wartość powiększy się z 7 mld euro w tym roku do 64 mld euro w 2028 r. Zwiększy się więc prawie dziesięciokrotnie w ciągu czterech lat. To główny wniosek z raportu „Study on the economic impact of Generative AI in Music, and Audovisual Industries” (Studium wpływu ekonomicznego generatywnej sztucznej inteligencji w branży muzycznej oraz audiowizualnej), opracowane przez firmę doradztwa strategicznego PMP Strategy na zlecenie CISAC, czyli Międzynarodowej Konferencji Związku Autorów i Kompozytorów. Jest to organizacja zrzeszająca prawie 230 krajowych związków twórców, w tym polski ZAiKS.

Raport jest niezwykle ciekawą, wielowątkową analizą wpływu AI w różnych segmentach rynków muzyki i treści audiowizualnych, w tym filmów i seriali fabularnych, a także filmików zamieszczanych w social media, czy na Youtubie. Osobom zainteresowanym tematem polecam zapoznanie się z całym raportem, dostępnym na stronie CISAC. W poniższym tekście koncentruję się natomiast na ogólnych wnioskach dotyczącą możliwości zmian zasady gry w branżach, w których istotną część prac stanowi tworzenie treści (contentu) i przez to kreatywność.

Warto wiedzieć

Czym jest Gen AI?

AI (sztuczna inteligencja) to określenie dziedziny, która obejmuje systemy zdolne do naśladowania ludzkiego myślenia, rozwiązywania problemów i uczenia się. Z kolei Gen AI (generatywna sztuczna inteligencja) to podzbiór AI, który tworzy nowe treści, takie jak teksty, obrazy, muzykę czy filmy na podstawie wzorców w danych treningowych.

Gen AI w muzyce i treściach audiowizualnych

Zacznijmy od omówienia kluczowych liczb. Inwestycje prywatnych podmiotów w obszarze Gen AI wzrosły z 2,9 mld euro w 2022 r. do 25,2 mld euro w 2023 r. Tak gwałtowne zwiększenie wydatków na rozwój technologii będzie według autorów przyczyną szybkiego wzrostu rynku tworzonych przez nią treści. Co stoi za tak mocnym wzrostem inwestycji? Przede wszystkim dostrzeżenie potencjału na zrewolucjonizowanie wielu branż, m.in. technologicznej, ochrony zdrowia, usług finansowych, mediów oraz rozrywki. I tutaj kolejny argument w debacie o powiększającej się różnicy w rozwoju technologicznym między USA a Europą za prawie 90 proc. wydatków inwestycyjnych na Gen AI w 2022 r. odpowiadały firmy z USA. Natomiast przedsiębiorstwa z UE i Wielkiej Brytanii jedynie za 3 proc.

Wartość rynku muzyki generowanej przez Gen AI ma wynieść aż 16 mld euro w 2028 r., wobec szacowanej wartości zaledwie miliarda euro w tym roku. – wynika z raportu. To daje średnią roczną stopę wzrostu na poziomie 100 proc. Rynek będzie się wówczas składać z trzech segmentów:

  • Tradycyjnego streamingu muzyki tworzonego przez Gen AI – muzyka kreowana przez AI i publikowana w tradycyjnych serwisach streamingowych, typu Spotify, Tidal, czy Apple Music.
  • Muzyki tworzonej przez Gen AI na potrzeby biznesu – tzw. „muzyka tła” do różnych celów, np. reklam, galerii handlowych, czy restauracji.
  • Streamingu muzyki opartej na Gen AI – muzyka tworzona przez sztuczną inteligencję indywidualnie dla każdego słuchacza, w oparciu o jego dotychczasowe preferencje.

Największym segmentem ma być tworzenie muzyki dla serwisów streamingowych, jego wartość ma wynieść 10 mld euro w 2028 r. I faktycznie potencjał do ogromnych zmian w tym obszarze rynku jest widoczny. Obecnie aż 41 proc. ze 100 najbardziej popularnych playlist w największym serwisie streamignowym świata, czyli Spotify to tzw. playlisty nastrojowe (np. Coffee Table Jazz, Intense Studying). A więc niezwiązane z żadnym konkretnym wykonawcą i często wypełnione utworami nieznanych artystów.

Generatywna sztuczna inteligencja po prostu zaleje takie serwisy treścią i będzie za pięć lat odpowiadać za 20 proc. całego rynku streamingu. Tylko w jednym portalu pozwalającym na tworzenie muzyki za pomocą Gen AI – Udio – użytkownicy generowali w lipcu 2024 r. aż 860 tys. utworów dziennie.

Zalew treści czeka też segment muzyki na potrzeby biznesu. Sam rynek utworów generowanych przez AI ma odpowiadać za aż 57 proc. całości rynku muzyki dla celów biznesowych na świecie.

Zupełnie innym przykładem jest trzeci z segmentów, ponieważ stanowi on pewnego rodzaju rozszerzenie rynku. Może spowodować, że dzięki dostępności lepiej dopasowanej muzyki, jej słuchalność i możliwości monetyzacji wzrosną.

Nieco mniejszą rewolucję Gen AI wywoła w branży audiowizualnej, choć wartość treści będzie znacznie większa – wzrośnie z 6 mld euro w tym roku do 48 mld euro w 2028 r., to udział tych treści w rynku będzie zdecydowanie mniejszy. Kluczowym obszarem będą filmiki tworzone przez Gen AI i publikowane w social mediach. Ich wartość wyniesie 30 mld euro w 2028 r., co będzie stanowiło 13 proc. wartości całego rynku. Drugim co do wielkości segmentem będzie tworzenie filmów czy seriali animowanych, także w formatach opery mydlanej dla telewizji. Łącznie ten segment ma być wart 14 mld euro w 2028 r. Z kolei za tworzenie filmów przez AI na Youtube i podobne platformy ma odpowiadać kolejne 5 mld euro.

Linia podziału dla rewolucji Gen AI i trzy tarcze obrony

Kluczowe pytanie dla wszystkich prac polegających na tworzeniu treści to – jaki jest potencjał do substytucji przez AI? Biorąc pod uwagę wnioski płynące z branży muzycznej i audiowizualnej, można stwierdzić, że bardzo wysoki. Jednocześnie widać istotną linię podziału, co do tego, które segmenty rynków mogą być bardziej, a które znacznie mniej podatne na generowanie treści przez sztuczną inteligencję. Przebiega ona wzdłuż celu tworzenia treści jeśli mają być one tłem, czy mówiąc mniej elegancko „zapychaczem”, to wówczas możliwości jej zastąpienia przez AI gwałtownie rosną. Natomiast jeśli jest dany utwór muzyczny, artykuł w gazecie, czy też książka mają służyć jako samoistna, niezależna treść dla aktywnych odbiorców, to wówczas szanse na zastąpienie treściami generowanymi przez AI wydają się mniejsze.

Barierami są trzy tarcze, które chronią taki rodzaj treści od treści „tła”: ludzka kreatywność i wrażliwość, wiarygodność oraz efekt marki. Myślę, że pierwszy z nich nie wymaga większego rozwinięcia choć AI robi ogromne postępy w kreatywności i udawaniu ludzkiej wrażliwości, to jednak wciąż w tym zakresie ma poważne braki.

Kwestia wiarygodności dotyczy zwłaszcza treści, które mają być podstawą do zdobywania wiedzy, czy informacji. Sztuczna inteligencja ma wciąż duże problemy m.in. z tzw. halucynacjami, czyli zmyślaniem i źródłem podawanych twierdzeń. Dlatego profesjonalne analizy, czy teksty będą raczej tworzone przez ekspertów, którzy wezmą odpowiedzialność za przedstawione fakty i liczby.

W końcu pozostaje też efekt marki (brandu), zarówno jeśli jest to marka własna, jak i też instytucja. Ludzie są przywiązani do pewnych twórców, mediów, podmiotów, których analizy czytają w pracy. Krótko mówiąc, ludzie są bardziej skłonni słuchać piosenek Taylor Swift czy Dawida Podsiadło niż nieznanych twórców. Podobnie chętniej czytają raporty McKinsey niż małych butików konsultingowych, nawet jeśli te drugie są ciekawsze. Siła marki utrzymuje i zapewne będzie utrzymywała wielu twórców na powierzchni.

Nie oznacza to jednak, że oryginalni twórcy nie będą wspierać się rozwiązaniami z zakresu Gen AI. Takie wykorzystywanie sztucznej inteligencji będzie szybko postępowało. Ostatecznie jednak trzeba pamiętać, że w przypadku całej sztucznej inteligencji mówimy o bardzo nowej technologii, która jest na wczesnym etapie rozwoju. Paul Krugman, laureat nagrody Nobla z dziedziny ekonomii napisał w 1998 r. „do 2005 r. stanie się jasne, że wpływ internetu na gospodarkę nie będzie większy niż faksu”. Jakiekolwiek kategoryczne stawianie tez dotyczących AI może skończyć wraz z tym cytatem na śmietniku prognoz.

Główne wnioski

  1. Rynek muzyki generowanej przez sztuczną inteligencję będzie wart 16 mld euro (wobec miliarda euro w 2024 r.), wynika z raportu opublikowanego przez PMP Strategy na zlecenie CISAC. Z kolei rynek treści audiowizualnych będzie wart 48 mld euro wobec 6 mld w 2024 r.
  2. Głównymi segmentami odpowiadającym za wzrost na rynku muzyki będzie tworzenie tzw.  „muzyki tła" w serwisach streamingowych i w biznesie, m.in. w reklamach. Z kolei głównym segmentem napędzającym rozwój rynku treści audiowizualnych generowanych przez AI będą filmiki tworzone na potrzeby social mediów.
  3. Wydaje się, że główną linią podziału dla rewolucji Gen AI jest to, czy dane treści (content) są tworzone jako podstawowe dzieło, czy też jako dodatek lub tło. W tym drugim przypadku możliwości zastąpienia twórców przez sztuczną inteligencję wydają się bardzo duże.