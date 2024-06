Damit Falschinformationen und Videofakes aber tatsächlich funktionieren, müssen Sie vor allem eines sein: plausibel. Das gilt auch für täuschend echte Deepfakes. So sei ein künstlich generierter Bundeskanzler, der eine aktuelle außenpolitisch schwierige Situation betont, durchaus glaubwürdig. "Wenn ich dagegen jetzt Bundeskanzler Scholz, ganz fiktiv, in einer Situation sehe, wo er koksend in Umgebung von Prostituierten gezeigt wird, dann würde ich vielleicht verdutzt reagieren und denken: Das ist jetzt irgendwie seltsam." Das bedeutet: Deepfakes sind dann überzeugend, wenn sie eigentlich etwas bestärken, was wir ohnehin schon zu wissen glauben.

Was sind Deepfakes? Unter Deepfakes bezeichnet man gefälschte, täuschend echte audiovisuelle Inhalte, die mithilfe von generativer KI entstanden sind. Reelles Material dient dabei dem Training – deshalb funktionieren Deepfakes bei Schauspielerinnen und Schauspielern besonders gut. Mit Deepfake-Technologie war es zum Beispiel auch möglich, in der Serie "Neue Geschichten vom Pumuckl" die bekannte Pumuckl-Stimme des bereits verstorbenen Hans Clarin anzubieten.

Auch Edda Humprecht, Professorin für Digitalisierung und Öffentlichkeit an der Uni Jena, betont, dass unplausible Fakes schnell entlarvt würden: "Man muss dazusagen, bisher haben Deepfakes in der politischen Kommunikation keine sehr große Rolle gespielt. Der Großteil war eher im pornografischen Bereich, aber das heißt jetzt nicht, dass nicht zukünftig im Vorfeld von Wahlen, politische Akteure ins Visier genommen werden."

Gerade bei starken Emotionen wie Angst und Empörung steige Humprecht zufolge das Risiko, dass falsche Inhalte geteilt werden. Deren Erstellung ist nun auch ohne gesonderte medientechnische Ausbildung in quasi-jedermanns Hand. Neben Text-generierenden Chatbots geben Firmen wie Adobe, Microsoft und Open-AI Nutzenden Tools an die Hand, mit denen sich Bilder per Texteingabe erstellen lassen. Solche Software hört auf Namen wie Midjourney, Stable Diffusion, Dall-E oder Firefly und ihre Ergebnisse lassen sich, wenn sie mit der nötigen Akribie erstellt wurden, nur mit einem sehr findigen Blick als KI-generiert identifizieren. (Immer erstmal auf die Finger gucken!)

GPT-4o, GPT-5 oder Sora: Wo steuert Open AI hin?

Statt durch GPT-5 überraschte KI-Pionier Open AI im Mai mit einer Version seines großen Sprachmodells, das die etwas sperrige Versionsnummer GPT-4o trägt. Das O steht für omni und bedeutet, dass das Modell Text, Bild und Ton gleichermaßen versteht. Das ist trotz anerkennender Worte aber nicht der ganz große Brüller, nicht so einer, wie ihn Open AI dieses Jahr bereits mit Sora präsentiert hat. Ein Modell, das den anderen Produkten im Haus schlichtweg den Rang abläuft. Videos sind das High-End-Futter für die von Edda Humprecht angesprochenen Emotionen und mit Sora lassen sie sich, so sieht es zumindest erstmal aus, per Texteingabe vom Schreibtisch aus generieren. Die bis zu einer Minute langen Clips, die Open AI öffentlichkeitswirksam vorgeführt hat, überraschen durch ihre scheinbare Makellosigkeit. Zum Beispiel beim felligen Vierbeiner, der morgens bei Frauchen im Bett sanft, aber doch penetrant nach dem Frühstück fragt. Oder bei der Frau, die erhaben durch das verregnete Tokio spaziert. Auf den ersten Blick ist das eine ganz andere Hausnummer als der Pommes-Fake um Ricarda Lang. Und auch als das, was noch vor gerade einmal etwas mehr als einem Jahr viral ging: Ein Spaghetti futternder Will Smith, der einem angesichts der ganzen KI-Fehler und Bildfragmente fast schon leidtut.

Open AI und Sora: Eine Frage des Aufwands