Głos staje się aktywem. Startup Moody Pines chce oddać kontrolę artystom
Startup Moody Pines pozyskał finansowanie od amerykańskich funduszy venture capital oraz polskiego S20. Spółka rozwija technologię voice AI opartą na współpracy z artystami i modelu, w którym twórcy zachowują kontrolę nad wykorzystaniem swoich głosów.
Z tego artykułu dowiesz się…
- Czy rynek voice AI jest gotowy na model, w którym twórca zachowuje prawa do własnego głosu.
- Dlaczego inwestorzy stawiają dziś na startupy budujące voice AI wokół danych pozyskiwanych bezpośrednio od artystów.
- Co może być kolejnym etapem rozwoju voice AI – technologia czy własność i kontrola nad głosem.
Rynek voice AI wchodzi w kolejny etap rozwoju. Obok wyścigu o coraz naturalniejszą syntezę mowy coraz większego znaczenia nabierają kwestie praw do głosu, pochodzenia danych treningowych oraz zasad współpracy z twórcami.
Na te wyzwania odpowiada Moody Pines – startup założony przez Monikę Podsiadło, rozwijający technologię voice AI w modelu opartym na bezpośredniej współpracy z artystami i transparentnym licencjonowaniu głosów. Spółka pozyskała finansowanie od amerykańskich funduszy venture capital SignalFire i Race Capital oraz od polskiego funduszu S20, współtworzonego przez Bartłomieja Golę.
Voice AI z innym punktem wyjścia
Moody Pines rozwija technologię syntezy mowy. Jednak – jak podkreśla założycielka spółki – przyjmuje inne założenia niż wiele firm działających dziś na tym rynku.
– To podejście wynika z mojego wieloletniego doświadczenia w obszarze voice AI. Zajmuję się tą technologią od początku kariery – zarówno na etapie studiów, jak i pracy zawodowej. Nie jest to więc przypadkowy wybór, lecz efekt świadomie przyjętej strategii – mówi Monika Podsiadło.
Moody Pines chce wyróżnić się na rynku ścisłym powiązaniem generowanego głosu z konkretną osobą. Startup odchodzi od modelu, w którym syntetyczny głos funkcjonuje niezależnie od człowieka, którego brzmienie naśladuje.
– Chcemy uniknąć sytuacji, w której głos generowany przez sztuczną inteligencję nie jest powiązany z konkretną osobą. Dziś miarą sukcesu technologii jest przede wszystkim to, jak wiernie odwzorowuje ludzki głos. Jednocześnie zdarza się, że za takimi rozwiązaniami nie stoi żaden twórca albo że rzeczywiste głosy są wykorzystywane komercyjnie bez odpowiedniej zgody i wynagrodzenia. To rodzi szereg wyzwań prawnych, etycznych i biznesowych – mówi Monika Podsiadło.
Model rozwijany przez spółkę zakłada, że twórca zachowuje kontrolę nad sposobem wykorzystania swojego głosu. To on decyduje o warunkach licencji, zakresie zastosowań oraz kontekstach komercyjnych, w których może być wykorzystywana jego cyfrowa reprezentacja.
Od „brzmi jak człowiek” do „głosu człowieka”
Moody Pines koncentruje się na rozwoju wyspecjalizowanych modeli voice AI, zaprojektowanych pod konkretne zastosowania.
– Dla mnie sukces nie polega na tym, że głos „brzmi jak człowiek”, ale na tym, że „jest głosem człowieka” i spełnia określoną funkcję – podkreśla Monika Podsiadło.
Spółka rozwija działalność równolegle w dwóch obszarach. Pierwszy obejmuje tworzenie korpusów danych głosowych, które mogą być wykorzystywane przez laboratoria rozwijające modele sztucznej inteligencji. Drugi dotyczy budowy własnej infrastruktury technologicznej i narzędzi z zakresu voice AI. Rozwiązania te znajdują się obecnie na etapie przedwdrożeniowym.
Warto wiedzieć
ElevenLabs stawia na głos przyszłości
„Możesz zbudować inteligentny system, ale jeśli twoja AI brzmi robotycznie, nie będzie do niej zaufania” – mówił przed kilkoma dniami w Teatrze Wielkim w Warszawie Mati Staniszewski, współzałożyciel ElevenLabs.
Jak pisaliśmy w XYZ, jego zdaniem głos stanie się podstawowym interfejsem komunikacji ze sztuczną inteligencją – od obsługi klienta i rezerwacji podróży po ochronę zdrowia i edukację. Staniszewski zapowiedział nowy model text-to-speech v4. Demonstracja obejmowała m.in. zmianę akcentu, emocji, szeptu i śpiewu.
Mati Staniszewski przekonywał, że nowy model zapewnia większą kontrolę nad sposobem generowania mowy i pozwala uzyskiwać efekty, które wcześniej były trudne do osiągnięcia.
Przypomniał również, że od początku działalności ElevenLabs stawiało na rozwój naturalnej komunikacji człowieka z AI. Według spółki to właśnie głos będzie kluczowym elementem upowszechniania sztucznej inteligencji. Dlatego firma rozwija rozwiązania nie tylko dla twórców treści, lecz także dla biznesu, administracji i konsumentów.

Dane pozyskiwane bezpośrednio od artystów
Jednym z kluczowych elementów projektu Moody Pines jest sposób pozyskiwania danych treningowych. Startup deklaruje, że nie wykorzystuje publicznie dostępnych nagrań z internetu, takich jak podcasty czy otwarte biblioteki audio.
– Uważamy, że takie podejście budzi wątpliwości etyczne – mówi Monika Podsiadło.
Zamiast tego spółka współpracuje bezpośrednio z twórcami, w tym członkami organizacji zrzeszających aktorów. Ci ostatni świadomie przekazują materiał wykorzystywany do trenowania modeli na określonych warunkach licencyjnych.
– Dzięki temu twórcy mają większą kontrolę nad sposobem wykorzystania swoich głosów oraz nad udziałem w całym procesie – dodaje rozmówczyni.
W dłuższej perspektywie startup planuje uruchomić platformę działającą w modelu marketplace.
– Chcemy zbudować „Airbnb dla głosów”. Artysta będzie mógł zarządzać swoim profilem, akceptować lub odrzucać propozycje wykorzystania głosu oraz samodzielnie określać warunki licencji – zapowiada Monika Podsiadło.
Dlaczego S20 zainwestował w Moody Pines?
Dla funduszu S20 inwestycja w Moody Pines wpisuje się w strategię wspierania projektów technologicznych na etapie pre-seed.
– Angażujemy się w przedsięwzięcia na bardzo wczesnym etapie rozwoju, kiedy model biznesowy i produkt dopiero się kształtują. W takich przypadkach kluczowe znaczenie mają dla nas kompetencje założycieli oraz ich zdolność do budowy firmy w danym obszarze – mówi Bartłomiej Gola.
Jak podkreśla, o decyzji inwestycyjnej w Moody Pines przesądziły przede wszystkim kompetencje Moniki Podsiadło oraz potencjał rynku voice AI.
– Monika ma silne zaplecze techniczne i naukowe w obszarze voice AI. To wymagający technologicznie segment. Dlatego zależało nam na osobie, która dobrze rozumie stojące przed nim wyzwania i potrafi rozwijać tego typu rozwiązania – wskazuje Bartłomiej Gola.
Warto wiedzieć
Zagraniczna ofensywa polskiego venture capital
Dane wskazują na wyraźny wzrost aktywności polskich funduszy venture capital na rynkach zagranicznych.
„Polskie fundusze VC bardzo mocno rozpoczęły 2026 r. pod względem inwestycji zagranicznych. W pierwszym kwartale zrealizowały 26 transakcji o łącznej wartości 235 mln zł, co już dziś przewyższa całoroczny wynik z 2022 r. i niemal dorównuje całemu 2024 r.” – wskazuje Dmytro Golournyi, menedżer inwestycyjny w PFR Ventures.
Prognozuje on, że jeśli podobne tempo utrzyma się w kolejnych kwartałach, 2026 r. może okazać się rekordowy pod względem zagranicznej aktywności inwestycyjnej polskich funduszy venture capital.
Jak wynika z danych PFR Ventures, największym zainteresowaniem inwestorów cieszyły się spółki działające w obszarze deep tech oraz przedsiębiorstwa rozwijające technologie obronne.
Drugim argumentem był sam rynek voice AI
– To rynek o dużym potencjale wzrostu. Coraz więcej urządzeń wykorzystuje interfejsy głosowe – maszyny komunikują się z użytkownikami, a użytkownicy z maszynami. Trend ten jest widoczny m.in. w motoryzacji, mediach, elektronice użytkowej i usługach cyfrowych. W naszej ocenie jest to rynek, na którym obok obecnych liderów, takich jak ElevenLabs, może funkcjonować wielu wyspecjalizowanych graczy – mówi Bartłomiej Gola.
Jak dodaje, Moody Pines rozwija technologię, która ma wyróżniać się sposobem pozyskiwania danych oraz podejściem do tworzenia modeli głosowych.
– Założeniem projektu jest tworzenie wysokiej jakości cyfrowych klonów głosu przy wykorzystaniu relatywnie niewielkiej liczby nagrań treningowych. Celem jest lepsze odwzorowanie emocji i naturalności mowy. Na etapie pre-seed są to jednak wciąż założenia technologiczne. Tak jak w przypadku każdego projektu na tak wczesnym etapie rozwoju, istnieje ryzyko, że nie wszystkie z nich zostaną zrealizowane zgodnie z planem – przyznaje inwestor.
Zdaniem inwestora
Inwestujemy tam, gdzie startupy mogą skalować się najszybciej
Obecnie jesteśmy na etapie domykania inwestycji w polski zespół działający głównie na rynku amerykańskim. To nie jest odosobniony przypadek. W portfelu Simpact mamy trzy zagraniczne spółki założone lub współzałożone przez Polaków. Jedną z nich jest Nutrix, firma z sektora medtech założona przez Marię Hahn.
Spółka działa w Szwajcarii, co daje jej dostęp do rozbudowanego ekosystemu naukowego, grantów badawczych oraz międzynarodowych partnerstw. Dziś pozyskuje kapitał od inwestorów z różnych części świata, w tym funduszy z Japonii, Stanów Zjednoczonych i Arabii Saudyjskiej.
Zainwestowaliśmy także w Verdant Nature, spółkę biotechnologiczną z USA, która ma dział badawczo-rozwojowy i produkcję w Polsce. Firma prowadzi sprzedaż głównie na rynku amerykańskim. Natomiast Prosoma, spółka z polskimi founderami, działa na rynkach zachodnich i w USA.
Nasze doświadczenie pokazuje, że startupy budowane od początku z myślą o globalnym rynku często skalują się szybciej. Założyciele funkcjonujący w międzynarodowym środowisku łatwiej nawiązują relacje z inwestorami, partnerami biznesowymi i klientami. Z perspektywy funduszu oznacza to większy potencjał wzrostu wartości spółki, a w konsekwencji większe szanse na atrakcyjny zwrot z inwestycji.
Rynki takie jak Stany Zjednoczone czy Europa Zachodnia oferują również łatwiejszy dostęp do dużych inwestorów na kolejnych etapach rozwoju oraz do potencjalnych nabywców w przypadku wyjścia z inwestycji. To jeden z powodów, dla których chętnie inwestujemy w spółki rozwijane za granicą, szczególnie gdy stoją za nimi polscy przedsiębiorcy. Z jednej strony dobrze rozumieją oni lokalne ekosystemy, w których działają, a z drugiej często utrzymują silne związki z Polską, lokując tutaj zespoły technologiczne i kompetencje badawczo-rozwojowe.
Globalne ambicje i skalowanie
Od początku działalności Moody Pines rozwija projekt z myślą o rynkach międzynarodowych.
– Od stycznia 2026 r. pozyskaliśmy kilkadziesiąt głosów i systematycznie rozbudowujemy ich katalog. Naszym głównym ograniczeniem pozostaje obecnie skala zespołu. Działamy m.in. w Los Angeles i Nowym Jorku, a równolegle rozpoczynamy projekty w Warszawie. Nad Wisłą planujemy ulokować centrum technologiczne – mówi Monika Podsiadło.
Międzynarodowy charakter przedsięwzięcia był również jednym z czynników branych pod uwagę przez inwestorów. Jak podkreślają przedstawiciele funduszu S20, rynek voice AI rozwija się globalnie. Możliwość budowania relacji i pozyskiwania partnerów poza Polską ma więc istotne znaczenie dla dalszego rozwoju spółki.
Fundusz szuka spółek aktywnych na świecie
W portfelu funduszu S20 znajduje się obecnie 17 spółek. Około połowę z nich stanowią przedsięwzięcia rozwijane przez zagranicznych założycieli lub projekty budowane poza Polską przez polskich przedsiębiorców.
– W naszej ocenie spółki budowane od początku z myślą o rynkach międzynarodowych mają większe możliwości skalowania działalności, łatwiejszy dostęp do kolejnych rund finansowania oraz wyższy potencjał wzrostu. Zależy nam, aby w kolejnych etapach rozwoju pozyskiwały inwestorów z USA i Europy Zachodniej, którzy poza kapitałem mogą wnieść również doświadczenie operacyjne, sieć kontaktów oraz wsparcie w ekspansji – mówi Bartłomiej Gola.
Jak podkreśla, sukces funduszu zależy od zdolności spółek portfelowych do budowy biznesów o globalnym zasięgu.
– Trudno osiągnąć ponadprzeciętne zwroty, inwestując wyłącznie w firmy koncentrujące się na lokalnych rynkach – podsumowuje przedstawiciel funduszu S20.
Główne wnioski
- Voice AI przesuwa się z wyścigu technologicznego w stronę sporu o własność i prawa do głosu. Rynek voice AI przestaje być wyłącznie konkurencją o to, kto stworzy najbardziej naturalnie brzmiącą syntezę mowy. Coraz większe znaczenie zyskują kwestie prawne i etyczne: kto jest właścicielem głosu i na jakich zasadach może być on wykorzystywany. Moody Pines buduje model, w którym głos nie jest anonimowym zasobem, lecz pozostaje powiązany z konkretnym twórcą zachowującym kontrolę nad jego użyciem. To zmienia sposób myślenia o całej kategorii – od samej technologii do relacji twórca–platforma.
- Dane i sposób ich pozyskania stają się kluczowym źródłem przewagi w voice AI. W centrum modelu Moody Pines nie stoi wyłącznie algorytm, ale także jakość i legalność danych treningowych. Startup świadomie rezygnuje z publicznie dostępnych nagrań, stawiając na bezpośrednią współpracę z artystami. Dzięki temu buduje kontrolowane, licencjonowane zbiory danych, które mogą mieć przewagę jakościową i prawną nad rozwiązaniami opartymi na scrapingu internetu. To pokazuje szerszy trend: w voice AI własność danych staje się równie ważna jak sama architektura modelu.
- Rynek voice AI pozostaje na wczesnym etapie, ale inwestorzy już grają o globalną skalę. Zarówno Moody Pines, jak i inwestorzy tacy jak S20, zakładają, że rynek voice AI dopiero się formuje i ma przestrzeń dla wielu wyspecjalizowanych graczy. Kluczowe jest inwestowanie w zespoły o silnym zapleczu technologicznym oraz globalne podejście do budowy spółki od samego początku. Strategia funduszu zakłada wspieranie firm, które mają potencjał wejścia na rynki międzynarodowe i przyciągania kolejnych rund finansowania od inwestorów z USA i Europy Zachodniej. To może zadecydować o ich długoterminowym sukcesie.


