Casa Casi 120: Wollen wir Fakes überhaupt erkennen?

02.03.2024, 14:00

Carsten Drees

Allein gelassen haben sie mich in unserer schönen Tech-WG. Gelegenheit für mich, um über die letzte Folge mit den abgefahrenen KI-Videos und einiges mehr nachzudenken. Ich nehme Euch mit in diese Gedankenwelt in dieser vielleicht etwas ernsteren Podcast-Folge, spreche also über KI, aber auch über unsere Gesellschaft.

Wir erwähnen es ja immer wieder gern in den Folgen, in denen wir über künstliche Intelligenz sprechen: Wir finden es auf der einen Seite ultraspannend – und auf der anderen Seite gleichzeitig auch creepy. Heute will ich in dieser Solo-Folge unter anderem "EMO" ansprechen von Alibaba. "Emote Portrait Alive", so der volle Name, ist ein neues Tool, welches ein Bild nimmt und ein vorhandenes Audiofile – und beides für ein komplett KI-generiertes Video zusammenbringt.

Apps, die uns dazu bringen, auf Basis von hochgeladenen Fotos lustig einen Song mitzusingen, gibt es so einige, das ist nichts Neues. Aber die Perfektion, mit der das hier geschieht, ist beeindruckend und nicht nur das: EMO animiert das Foto nicht nur perfekt, sodass es jeden Text mitsprechen oder jeden Song mitsingen kann – auch die Mimik passt sich perfekt an.

Geschlossene Augen bei hohen Tönen oder gefühlvollen Textpassagen, hochgezogene Augenbrauen an den passenden Stellen – die KI scheint wirklich zu wissen, welcher Gesichtsausdruck gerade der geeignete ist. Macht Euch bitte selbst einen Eindruck davon, was Emote Portrait Alive zu bieten hat und schaut Euch die Clips an. Und wer bei LinkedIn am Start ist, kann sich dort auch Palles Einschätzung zu EMO reinziehen.

Das gesellschaftliche Problem ist größer als das technologische ...

Aber, und das betone ich auch in meinem Monolog: Ich möchte gar nicht schon wieder nur staunend und gruselnd über eine neue Video-Technologie reden, sondern klarmachen, dass wir ganz andere Sorgen haben als die Perfektion, mit der solche Videos mittlerweile erstellt werden können. Wir leben dummerweise in einer Zeit, in der viele Menschen sprichwörtlich auf Fakten scheißen. Denen müsst Ihr nicht ein Hochglanzvideo vorspielen, um sie zu täuschen, da sie eh glauben, was sie glauben wollen.

Wir müssen also gesellschaftlich wieder zurückkommen auf einen Pfad, der uns zwar laut streiten und argumentieren lässt und der Gegenmeinungen zulässt oder gar wünscht. Aber wir müssen uns auf eine Faktenbasis verständigen können. Es hilft einfach nicht, wenn drei Leute unter 80 Millionen sich darum scheren, ob ein KI-Video ein Wasserzeichen trägt und millionenfach gleichzeitig Fakes durchs Netz geschossen werden, ohne dass sich jemand drum schert.

Wir müssen lernen, besser mit den Technologien, besser mit Medien umzugehen. Aber vorher müssen wir anscheinend erst auch wieder lernen, besser mit uns und unserem Gegenüber umzugehen. Das soll auch nicht die Nummer mit dem erhobenen Zeigefinger sein, denn ich muss mir ja auch gehörig an die eigene Nase fassen. Darum das Beispiel mit Mai Thi von MaiLab im Podcast. Die hat all diese Populismus-Werkzeuge in ihrem YouTube-Video eingesetzt und nicht nur mich damit gehörig geleimt.

Schaut Euch bitte nicht nur das eingebettete Video oben an, sondern auch ihre Auflösung. Und apropos Populismus: Deswegen habe ich in der Folge auch die Story von Habeck und Söder bei der Handwerksmesse in München angeschnitten – um aufzuzeigen, dass selbst ein informierter, mit reichlich Fakten ausgestatteter Mensch ein Vielfaches an Zeit und Energie aufwenden muss im Vergleich zu seinem populistischen Gegenüber mit dessen Falschaussage.

Nochmal: Die Technologien gehen komplett durch die Decke gerade und wir kommen kaum noch hinterher, jede Innovation zu erkennen und einzordnen. Das geht auch KI-Experten wie YouTuber Matt Wolfe so, der jetzt schon wieder seine im Januar getätigte Aussage zu KI-Videos korrigieren musste.

Aber unser Hauptproblem sind eben nicht die Technologien an sich, sondern dass viel zu viele von uns entweder die Skills oder das Interesse vermissen lassen, richtig mit Medien umzugehen. Wenn wir schon ohne Video, ohne Fake-Foto usw. einfach blind alternative Fakten verbreiten, nur weil sie zur Ideologie passen, spielt es keine Rolle, ob ein KI-Video in HD läuft, ob es Glitches oder Fragmente gibt, die es als Fake erkennbar machen.

Deswegen sage ich im Podcast, dass uns die Zeit davonrast. Bald werden wir in den News-Feeds der sozialen Medien zugeschissen mit KI-generierten Fakes aller Art. Also bleibt uns nicht mehr viel Zeit, um uns selbst dafür zu sensibilisieren – und auf andere Menschen einzuwirken, dass wir uns wirklich auf Fakten konzentrieren müssen, egal wie sehr wir auch eine Partei oder einen Politiker hassen und wie sehr wir auch bestimmte Entscheidungen für ideologiegetrieben halten.

Wie gesagt: keine wirklich lustige Folge, aber eine, von der ich glaube, dass sie wichtig ist, weil wir uns dieses Problems deutlicher bewusst werden müssen. Und nächste Woche wird wieder mehr gelacht, versprochen! ;)

Beste Smart TVs 2024

	Bester OLED-TV 2024	Bester QLED-TV 2024	Preis-Leistungs-Tipp
Gerät	LG OLED evo 55G4	Sony Bravia 65X95L	Hisense 55E7KQ Pro
Abbildung
Preisvergleich	Auf Amazon finden (Amazon) * Auf eBay finden (eBay) *	Auf Amazon finden (Amazon) * Auf eBay finden (eBay) *	Auf Amazon finden (Amazon) * Auf eBay finden (eBay) *