Złodzieje głosu i pieniędzy. Jak AI staje się narzędziem kradzieży?
Przez kanadyjskie media społecznościowe przemknęła nowa miejska legenda: AI może sklonować głos na podstawie zwykłego „hi” lub „hello” i użyć go do okradzenia właściciela głosu ze wszystkich pieniędzy. Ta historia prowadzi do dużych firm, które już wcześniej zetknęły się z przypadkami wykorzystania AI opartej na skradzionych głosach.
![](https://xyz.pl/wp-content/uploads/2025/01/GettyImages-2138297488-1920x1080.jpg)
![](https://xyz.pl/wp-content/themes/xyz/img/backgrounds/bg-mesh-32x32.png)
Z tego artykułu dowiesz się…
- Skąd wzięło się zagrożenie klonowaniem głosu dla klientów banków.
- Czy zabezpieczenia w bankach są podatne na ataki AI.
- Czy przy wypowiedziach krótszych niż 20 sekund ludzie są w stanie odróżnić sklonowany głos od prawdziwego.
Dziesięć lat temu kanadyjskie instytucje finansowe dumnie reklamowały nowoczesny system weryfikacji tożsamości dla klientów korzystających z telefonicznego dostępu do kont. Największy kanadyjski bank, RBC, chwalił się, że cyfrowy odcisk głosu uwzględnia ponad sto unikalnych cech i zapewniał: „nie ma potrzeby haseł, PIN-ów ani standardowych pytań potwierdzających tożsamość”. Podobnie Canadian Imperial Bank of Commerce (CIBC) określał ten system jako odpowiednik odcisków palców, dodając, że „nie będziecie musieli używać PIN-ów, haseł ani odpowiadać na pytania zabezpieczające”. Te uproszczenia sprzed dekady stały się jednym z ziaren legendy, że proste „hi” wystarczy, aby AI mogła sklonować głos.
Na platformach takich jak Reddit nie brakuje obaw – zarówno prawdziwych, jak i przesadzonych, na przykład: „Odpowiedziałem «tak» na pytanie, «czy mnie słychać» albo, «Czy da się sklonować mój głos w trzy sekundy?»”. W 2017 r. firma Lyrebird wprowadziła technologię klonowania głosu na podstawie jednej minuty nagrania. Już w 2019 r. pojawiły się doniesienia, że AI może tego dokonać w pięć sekund. Zaledwie w 2023 r. Microsoft ogłosił stworzenie modelu VALL-E, który potrafi wygenerować „wysokiej jakości spersonalizowaną wypowiedź” na podstawie trzech sekund nagrania. Microsoft ostrzegał, że technologia ta „może być niewłaściwie wykorzystywana, na przykład do oszustw głosowych”.
Oficjalna naiwność Microsoftu aż prosi się o komentarz, ale lepiej zacytować początek materiału CBS News z marca 2023 r.: „Jeśli odbierasz telefon z nieznanego numeru, niech dzwoniący zacznie mówić pierwszy. Ktokolwiek jest na drugim końcu – może nagrywać twój głos”. W tym samym czasie Federal Trade Commission (FTC) opublikowała materiał ostrzegający przed wyłudzeniami z wykorzystaniem AI i zauważyła, że „sztuczna inteligencja przestała być wizją z filmów science fiction”. Better Business Bureau (BBB) w marcu 2024 r. przestrzegało, by nie odpowiadać na telefony rozpoczynające się od pytania, „czy mnie słychać?”, ponieważ może chodzić o nagranie głosu. „Nie wiemy, jakie skutki te oszustwa mogą przynieść w przyszłości” – ostrzegało BBB.
„Nie rozmawiaj z nieznajomymi” – słyszą dzieci. W podobnym tonie brzmi rada kanadyjskiego Canadian Anti-Fraud Centre: nie zakładaj, że numer wyświetlający się na telefonie jest autentyczny.
Czy jeszcze dziś ktoś dzwoni do banku?
Nie chodzi tylko o to, że złodziej może wykorzystać klasyczną metodę „na wnuczka”. Problemem jest również możliwość podszycia się pod nas podczas rozmowy z bankiem, aby dotrzeć „tam, gdzie są pieniądze” – jak powiedział słynny amerykański rabuś bankowy Willie Sutton, zapytany, dlaczego wybierał właśnie banki.
Według danych Statistics Canada opublikowanych w 2024 r., aż 94 proc. Kanadyjczyków korzysta z internetu, a przełomowym momentem była pandemia, po której Kanadyjczycy „częściej zarządzają online swoimi osobistymi i domowymi finansami”. Jeszcze w 2018 r. 80 proc. użytkowników internetu korzystało z bankowości internetowej, w 2022 r. – już 82 proc. Co ciekawe, wzrost zainteresowania tą formą kontaktu z bankiem dokonał się głównie dzięki osobom po 65. roku życia: w 2018 r. 62 proc. tej grupy korzystało z bankowości online, a w 2022 r. – już 70 proc.
Jednak o ile 76 proc. osób między 65. a 74. rokiem życia korzysta z bankowości internetowej, to pozostałe 24 proc. wciąż wybiera wizyty w oddziale, korzystanie z bankomatu lub – co ważne – telefon. W wyższych grupach wiekowych 61 proc. klientów banków korzysta z bankowości online. Z bankowości internetowej nie korzystają również często osoby o najniższych dochodach i najniższym poziomie wykształcenia. Kolejnym istotnym czynnikiem jest zaufanie: 88 proc. tych, którzy ufają instytucjom finansowym, korzysta z bankowości internetowej. Wśród mniej ufnych odsetek ten wynosi 69 proc. Właśnie z tej grupy mogą pochodzić osoby przekonane, że ich głos jest niemożliwy do podrobienia.
Skąd bank wie, że ja to ja?
Przy nagraniach krótszych niż 20 sekund ludzie mają trudności z odróżnieniem sklonowanego głosu od prawdziwego – zauważyli w październiku 2024 r. Sarah Barrington i Hany Farid w artykule na platformie Arxiv.org, zarządzanej przez Cornell Tech. Czy systemy weryfikacji tożsamości mogą być skuteczniejsze od ludzi? W lutym 2023 r. dziennikarz „Vice” przetestował bankowy system zabezpieczeń, używając swojego głosu sklonowanego za pomocą narzędzi AI od ElevenLabs. System weryfikacji głosu nie poradził sobie z atakiem klonów. „Vice” ostrzegał, że ofiarą może zostać każdy, kto udostępnia nagrania swojego głosu w internecie, a banki powinny zainwestować w bardziej zaawansowane zabezpieczenia. Portal Speechtechmag.com przypomniał, że już w 2019 r. Google oferował narzędzie do wykrywania głosowego „deepfake”, a wśród zabezpieczeń pojawiły się takie rozwiązania jak „znaki wodne” w głosie.
Strach przed tego typu oszustwami jest widoczny w badaniu z 2024 r., przeprowadzonym przez kanadyjski oddział KPMG wśród 300 firm, które padły ofiarą oszustów. Wynika z nich, że 91 proc. z firm obawia się, że narzędzia AI do tworzenia fałszywek, w tym głosowych, otworzą złodziejom nowe możliwości kradzieży. Według „Wall Street Journal” pierwszy znany przypadek oszustwa z użyciem głosu głosowego „deepfake” miał miejsce w 2019 r. – była to próba kradzieży 243 tys. dolarów od brytyjskiej firmy z sektora energetycznego. W 2021 r. „Forbes” opisał przypadek oszustwa w banku w Zjednoczonych Emiratach Arabskich, gdzie sklonowany głos dyrektora firmy posłużył do próby wyprowadzenia 35 mln dolarów. W listopadzie 2024 r. kanadyjski bank BMO poinformował, że 75 proc. specjalistów ds. bezpieczeństwa zauważyło znaczący wzrost liczby ataków, w tym tych wykorzystujących narzędzia AI.
Tak więc miejskie legendy prowadzą do rzeczywistego problemu, który znają już wielkie firmy. Ale co zrobi Kowalski, gdy po odebraniu telefonu z nieznanego numeru usłyszy: „Czy mnie słychać?”
![](https://xyz.pl/wp-content/themes/xyz/img/backgrounds/bg-mesh-32x32.png)
Główne wnioski
- Banki muszą wzmocnić zabezpieczenia przed nowymi narzędziami AI wykorzystywanymi przez przestępców.
- Osoby, które nie korzystają z bankowości internetowej, są bardziej narażone na wyłudzenia za pomocą sklonowanego głosu.
- 91 proc. kanadyjskich firm dotkniętych oszustwami obawia się, że narzędzia AI do tworzenia deepfake’ów, w tym głosowych, zwiększą ryzyko kradzieży.