Mona Lisa. Słynne płótno Leonarda da Vinci w paryskim Luwrze. Wielu jest takich, którzy próbują zgłębić tajemnicę owego, bodaj najbardziej zagadkowego portretu w dziejach świata. Jedni piszą na jego temat książki. Drudzy dzielnie snują teorie spiskowe. A jeszcze inni postanowili go po prostu … ożywić. Nie tak dawno miałem okazję usłyszeć o dokonaniu programistów Samsunga, którzy za pomocą specjalnie opracowanej technologii dosłownie „wprawili w ruch” Monę Lisę. Zresztą nie tylko ją. Wyjątkowy algorytm wykorzystujący uczenie maszynowe może już teraz stworzyć animację twarzy praktycznie każdej osoby na podstawie zaledwie jednego zdjęcia lub obrazu. Sztuczna inteligencja analizując tysiące nagrań prawdziwych osób i nakładając na nie specjalne znaczniki jest w stanie przenieść ich ruch na postać, którą chcemy ożywić. W ten sposób wygenerowano już płynne i realistyczne animacje twarzy między innymi Alberta Einsteina, Marilyn Monroe, Salvadora Dalego, czy właśnie Mony Lisy. To wszystko w oparciu o zaledwie jeden źródłowy wizerunek danej osoby. Doprawdy imponujące osiągnięcie.
Jak mówią sami przedstawiciele Samsunga „ma to praktycznie nieograniczone zastosowanie w teleprezentacjach, wideokonferencjach, a także przemyśle efektów specjalnych.” To co wcześniej mogliśmy sobie jedynie wyobrażać już niedługo będziemy mogli na własne oczy zobaczyć w ruchu. Poczet królów polskich Jana Matejki i mrugający do nas na powitanie Kazimierz Wielki? Proszę bardzo. Wrogo marszczący na siebie brwi Mickiewicz ze Słowackim? Jak najbardziej. A może „żywy portret” naszej prababci w komunijnej sukni? Nie ma problemu. Co prawda, póki co oprogramowanie na bazie tej technologii najczęściej wykorzystuje się do memów i tworzenia „zabawnych” filmików z Korwinem Mikke i papieżem śpiewających „Koksu pięć gram” Cypisa. No ale zawsze coś. W jakże ciekawych czasach przyszło nam żyć. Tylko, że o świetlanej przyszłości i magii nowych odkryć rodem z kreskówki „Byli sobie wynalazcy” to niestety nie dziś. Deepfake (bo takie miano przyjęła rzecz, o której mowa) to tak naprawdę historia żywcem wyjęta z serialu „Black Mirror”. I to z tych bardziej dołujących epizodów.
Parę miesięcy temu szerokim echem w mediach odbiła się na przykład sprawa tzw. „aplikacji do rozbierania kobiet”. Oprogramowanie nosiło nazwę „DeepNude” i według twórców miało być zdolne do cyfrowego usuwania ubrania ze zdjęć kobiet i tworzenia w ten sposób fałszywych nagich wizerunków. Całość miała działać na zasadzie algorytmu, który na podstawie bazy wzorcowych zdjęć dopasowywał odpowiedni odcień skóry i fizjonomie do twarzy pani na fotografii. Program spotkał się z ogromnym zainteresowaniem użytkowników, jednak bardzo szybko został usunięty. Sami jego autorzy w swoim oświadczeniu ogłosili, że „świat nie jest jeszcze na to gotowy”, a prawdopodobieństwo, że aplikacja będzie nadużywana jest zbyt wysokie. Dziękujemy ci kapitanie oczywistość. Szkoda, tylko że nie pomyślano o tym przed wypuszczeniem programu na rynek. Trzeba jednak przyznać, że w jednym twórcy DeepNude mieli słuszność. My naprawdę nie jesteśmy na to gotowi.
Z całą pewnością nie są gotowe przepisy. W polskim prawie próżno szukać jakichkolwiek regulacji na ten temat. Publikacja deep fakeów z naszym udziałem może oczywiście stanowić naruszenie dóbr osobistych. To jednak tylko powództwo cywilne, które do wszczęcia procesu wymaga dokładnego wskazania stron, a więc i pozwanego. A o namierzenie autora takiego filmu może być trudno, zwłaszcza w przypadku treści publikowanych w Internecie. Oznacza to, że ofiary takich przeróbek, póki co są zdane absolutnie na siebie i same muszą walczyć o swoje prawa. Nawet zaproponowany niedawno w USA projekt przepisów dotyczącej deepfake’ów może nie zapewnić odpowiedniej ochrony skrzywdzonym przez DeepNude i jemu podobne twory. Nie przewiduje on bowiem ochrony osób na nagich zdjęciach, jeśli te zdjęcia nie przedstawiają ich własnych ciał. A w sytuacji takiego fotomontażu faktycznie nie przedstawiają. Tyle, że efekt jest dokładnie identyczny, co w przypadku „normalnych zwykłych zdjęć”. Bo to czy nasze nagie zdjęcie jest prawdziwe, czy nie – nie ma żadnego znaczenia. Stracona twarz, ośmieszenie i poniżenie w obu przypadkach są zupełnie takie same.
Brak gotowych regulacji prawnych i potencjalne poniżające nagie zdjęcia to jednak tylko wierzchołek góry lodowej. Daleko bardziej istotny jest fakt, że na deep fake nie jest gotowy nasz ludzki aparat poznawczy. Oprogramowanie do produkcji deep fakeów powstaje już na potęgę i nie ogranicza się tylko do zdjęć. W przemyśle pornograficznym deep fake jest od jakiegoś czasu używany do wstawiania do filmów twarzy znanych celebrytek, piosenkarek czy aktorek. Spreparowane klipy z Gal Gadot, czy Scarlett Johansson w rolach głównych są ponoć tak perfekcyjne, że trudno dostrzec manipulację. Deep fake wkracza już nawet do świata polityki, gdzie powoli staje się nową bronią. Bardzo potężną bronią. Bo wyobraźmy sobie tylko, że mamy możliwość przygotowania dowolnego filmu, na której dowolna osoba np. Donald Trump, lub Władimir Putin, robi dowolne rzeczy. W kwietniu 2018 roku w serwisie You Tube ukazało się wideo z Barackiem Obamą, na którym były amerykański prezydent – między innymi – przeklina do kamery. Całość ostatecznie okazała się fałszerstwem. Podobnie zresztą jak zmanipulowana wypowiedź właściciela Facebooka Marka Zuckerberga, który w fakeowym klipie przyznaje się do kradzieży danych miliardów osób. Już teraz testowane są programy, które pozwalają na żywo wygenerować wideo z osoba mówiącą dowolny wpisany wcześniej w programie tekst. Twórcy zapewniają, że pozwolą one zmieniać filmy tak łatwo, jak dzisiaj edytujemy grafikę w Photoshopie. Wcześniej do tworzenia deep fakeów potrzeba było kilkaset zdjęć danej osoby. Dlatego też najczęściej dotyczyły one przede wszystkim celebrytów i innych ludzi szeroko obecnych w mediach. Teraz do takich fałszywych przeróbek może wystarczyć nawet jedno zdjęcie. Możliwości faktycznie są nieograniczone. Tylko w jaki sposób je wykorzystamy?
Film z Barackiem Obamą był zrobiony dla żartu i sam autor ujawniał w nim na końcu jego fałszywość oraz zachęcał do sprawdzania wiarygodności źródeł. Klip z Markiem Zuckerbergiem był wyprodukowany przez dwójkę artystów jako artystyczna prowokacja. Jednak nie zawsze twórcami będą kierowały takie intencje. Epoka iluzji tak naprawdę dopiero się rozpoczyna. Ale to nawet nie nasza potencjalna wiara w manipulacje i fałszywki jest tutaj głównym zagrożeniem. Sceptycyzm będzie przecież lekarstwem, które będziemy sobie aplikować dożylnie przez 24 godziny na dobę. Prawdziwa tragedia zacznie się dopiero wówczas, gdy przedawkujemy i przestaniemy wierzyć także w fakty. Bo przecież i one mogą być fake’ami.
Granica między tym co rzeczywiste, a wykreowane jeszcze nigdy nie była tak mocno zatarta. Dziś coraz częściej „ludzie nie wierzą już w rzeczywistość – wierzą w obrazy, które widzą”. Współczesna kultura to dominacja obrazu – jak pisała amerykańska eseistka Susan Sontag społeczeństwa przemysłowe zamieniły swoich obywateli w narkomanów obrazu. Co więcej – przez dziesiątki lat, odkąd wynaleziono fotografie – zdjęcia, a następnie filmy stanowiły niepodważalny miernik autentyczności. Zdaniem Sontag to właśnie fotografia narzuciłam nam pogląd, że poznamy świat, jeżeli zgodzimy się, aby wyglądał tak jak na fotograficznym zapisie. W przeciwieństwie do subiektywnych i odpowiadających indywidualnej wizji autora malarskich portretów – zdjęcie od zawsze było postrzegane jako „przeźroczyste”, „niewybiórcze” oddanie rzeczywistości – odzwierciedlające ją taką jaka jest naprawdę. Nawet mimo świadomości możliwych zniekształceń – modyfikacji barw i kadrów, indywidualnego spojrzenia samego twórcy i jego motywacji artystycznej, pokazującej jedynie subiektywnie wybrany fragment rzeczywistości – jedno pozostawało bezsprzeczne – to co oglądamy musiało kiedyś znaleźć się przed obiektywem aparatu bądź kamery, a więc niepodważalnie – istniało.
Powstanie deep fakeów wywraca jednak tę teorię do góry nogami. Czy powinniśmy więc przestać bezkrytycznie wierzyć w filmy i fotografie? Tak, tyle tylko, że ich współczesne postrzeganie wciąż się nie zmieniło. Ludzki aparat poznawczy nie jest w stanie nadążyć za zmianami jakie zaszły w technologii tworzenia wizualnych obrazów. Zdjęcia i filmy to wciąż nośniki znaczeń jako pierwsze kojarzące się z prawdą i faktami – to przecież z nich korzystają media informacyjne, jako z czynników „obiektywnie” oddających rzeczywistość. Media robią co mogą by nadal potrzymać faktograficzny i dokumentacyjny charakter zdjęć, tak by nie straciły one swojej wiarygodności. To właśnie dlatego zdjęcia w konkursie Word Prees Photo dyskwalifikuje się za najmniejsze nawet manipulacje. W 2010 roku fotografia Stepana Rudika „Street fighting” została wykluczona z konkursu za usunięcie naruszającej kompozycje fragmentu stopy jednej z postaci. Czy takie zabiegi działają? Wydaje się, że wciąż tak – mimo coraz szerszej obecności fotomontaży społeczeństwo nadal wierzy, że to co na zdjęciu, to co w obiektywie kamery – musi być prawdą. Bo jeśli nie to, to co?
Deep fake to jednak coś znacznie gorszego niż poprawiane czy retuszowane zdjęcia – to tworzenie od podstaw zupełnie nowej sytuacji, która nigdy nie zaistniała. To już nie zniekształcający świat fotomontaż – to w pełni fałszywy obraz świata bez absolutnie żadnego odniesienia do rzeczywistości. Co gorsza, braku owego odniesienia do rzeczywistości nie jesteśmy zupełnie w stanie sprawdzić czy zweryfikować, ponieważ sami nie znamy jej prawdziwego kształtu. Mało kto z nas widział na własne oczy Baracka Obamę – były prezydent Stanów Zjednoczonych to dla większości ludzi tylko obraz oglądany w mediach. Medialne wyobrażenie Baracka Obamy wyprzedza rzeczywistość. Obamę widzimy przez ekrany komputerów i telewizorów. Media jedynie przekazują nam jak może wyglądać postać Baracka Obamy – to zawieszony gdzieś w przestrzeni medialnej pewnego rodzaju hologram, wizualna emanacja, a może wręcz SYMULACJA. Dokładnie o tym w 1981 roku – jeszcze na długo przed erą powszechnego Internetu i deep fakeów pisał francuski socjolog i filozof kultury Jean Baudrillard. W książce zatytułowanej „Symulakry i symulacja” dowodził, że w społeczeństwach ponowoczesnych, za sprawą mediów ludzie odbierają rzeczywistość za pośrednictwem znaków. Znaki stanowią swojego rodzaju „procesję symulacji”, kroczącą przed właściwym obrazem rzeczywistości. Rzeczywistość jest więc w zasadzie zapośredniczona przez jej medialną symulację. Odbiorcy jedynie wydaje się, że zna prawdziwy świat, wydaje się, że kojarzy Baracka Obamę, którego tak naprawdę nigdy nie widział. A jednak możemy sądzić, że mimo symulowanego, niebezpośredniego przedstawienia – były prezydent Stanów Zjednoczonych jednak istnieje.
Co jednak gdybyśmy za pomocą znaków wykreowali postać bądź sytuacje, która nie posiada żadnego odniesienia do rzeczywistości – która istnieje tylko w odniesieniu do siebie samej? Do tego wcale nie trzeba deep fakeów – anioły i demony to postaci, których nikt nigdy nie widział, ponieważ istnieją jedynie w wyobraźni ludzi. A jednak każdy z nas bez problemu potrafi rozpoznać anioła – dlatego, że jego przedstawienie odnosimy do wielu tworzących go znaków w kulturze. Archanioł Michał z „Sądu Ostatecznego” Hansa Memlinga, anioł stróż z obrazka wiszącego nad łóżkiem, aniołek z jasełek – to wszystko byty odnoszące się wzajemnie do siebie samych i tworzące w świadomości odbiorcy określone wyobrażenie i obraz anioła. Nieistniejąca postać stworzona przez znaki, niemająca odniesienia do rzeczywistości – to zdaniem Baudrillarda „symulakrum” – obraz będący czystą symulacją, pozorującego rzeczywistość i tworzącego jej własny wymiar. O ile jednak wiedząc to jesteśmy w stanie stwierdzić, że anioły, demony, diabły, gobliny, trolle i krasnale to bez wątpienia wykreowane symulakra – tak w przypadku deep fakeów nie mamy już takiej pewności. Obama to przecież nie postać z bajki, mitów czy baśni – to postać, w której istnienie wierzymy, a która być może w momencie jej oglądania nie istnieje, zastąpiona przez komputerowo wykreowaną symulakrę. A co z osobami stworzonymi od zera, wyglądającymi jak człowiek, a jednak nim nie będące? Chińska telewizja już jakiś czas temu testowała wygenerowane przez AI postaci prezenterów wiadomości. Przypomnijmy sobie Susan Sontag i przedstawiane przez nią przekonanie społeczeństw o bezwarunkowej prawdziwości filmu i fotografii. Imię jednego z chińskich, cyfrowo stworzonych prezenterów TV to Qiu Hao. Czy mamy prawo podważać jego istnienie, skoro jego postać widoczna jest przecież w obiektywnie aparatu?
Być może przez jakiś czas będzie nam jeszcze pomagać zjawisko uncanny valley (doliny niesamowitości), wywołujące niepokój w związku z niemal perfekcyjnym, choć nieidealnym podobieństwem robota, czy cyfrowego animowanego modelu do człowieka. Jednak dopracowanie technologii pozwoli zapewne „przeskoczyć” i tę przeszkodę. Wówczas deep fakeowe symulakry staną się niemal niewykrywalne. Baudrillard już 40 lat temu przewidział to co czeka nas teraz. To wizja przerażająco pesymistyczna – anihilacja rzeczywistości i całkowite stopienie ze sobą prawdy i fałszu, autentyczności i sztuczności – bez możliwości jakiegokolwiek ich odróżnienia. W książce „Wymiana symboliczna i śmierć” Baudrillard jako ostatnią ostoję realności wskazuje śmierć – jedyną rzecz, która prędzej czy później każdemu przydarzy się na pewno.
Ostatnio coraz częściej mówi się, że uśmiech Mona Lisy jest nieprawdziwy. Najnowsze badania dowodzą, że tak naprawdę mógł to być po prostu grymas bólu, bo słynna Gioconda cierpiała na chorą tarczycę. Taki to uśmiech okrutnie wykrzywiony w krzywym zwierciadle. Teraz Mona Lisa na swój sposób też się tak uśmiecha. A jej twarz odbija się w czarnym lustrze symulakry.
Łukasz Trzaska