Science vs. Fiction CSI & Co.: Wie die digitale Forensik wirklich Verbrechen aufklärt

Reinzoomen, entpixeln, schärfer machen – in Krimiserien und Hollywood-Filmen wird im Handumdrehen aus den schlechtesten Überwachungsfotos ein gestochen scharfes Bild. Geht das wirklich so einfach? Nicht immer, aber die Trickkiste der digitalen Forensik ist groß: Mit Methoden aus der Kunstfotografie, cleveren Vergleichen und der Hilfe von Künstlicher Intelligenz kommen die Bild-Profis den Tätern auf die Schliche.

Es sieht so einfach aus: Ein Mausklick, zwei Tasten gedrückt und schon hat das Ermittlungsteam aus einem verpixelten Video die verdächtige Person identifiziert. Was in Fernsehen und Kino als Handgriff gezeigt wird, ist in Wirklichkeit ein langwieriger und wenig glamouröser Prozess.

"Ich glaube, kein Zuschauer will sehen, wie wir wirklich arbeiten", sagt Dirk Labudde, Professor für Allgemeine und Digitale Forensik an der Hochschule Mittweida. Als Gutachter und Berater arbeitet er eng mit der Polizei zusammen und ist immer wieder in spektakuläre Fälle eingebunden, zum Beispiel den sogenannten Leipziger Rockerkrieg oder den Kunstraub im Grünen Gewölbe in Dresden.

Dreharbeiten für die neue Youtube-Folge von Science vs. Fiction
Dirk Labudde ist Professor für Forensik an der Hochschule Mittweida Bildrechte: Anne C. Brantin

Forensiker nutzen Methoden aus der Kunstfotografie

Dabei sei es vor allem die Geschwindigkeit der Bildbearbeitung, die in den Krimis unrealistisch dargestellt ist. Aber die grundlegenden Methoden aus CSI und Co. gibt es in der digitalen Forensik tatsächlich: Kontrast optimieren, Helligkeit und Sättigung anpassen, Unschärfe und Rauschen beseitigen, bis hin zu komplexeren Methoden, mit denen sich beispielsweise aus verpixelten Überwachungsfotos eines vorbeifahrenden Autos ein Nummernschild rekonstruieren lässt.

Dieses "Foto-Stacking" kommt eigentlich aus der Kunstfotografie und setzt mehrere Aufnahmen, die ihren Schärfebereich an unterschiedlichen Stellen haben, zu einem Bild zusammen. Die einzelnen Schärfebereiche ergänzen sich dann und es entsteht ein Foto mit deutlich mehr Details. Labudde hat diese Methode beispielsweise genutzt, um ein verdächtiges Fahrzeug aus den nächtlichen Videoaufnahmen einer Tankstelle zu bestimmen. "Als wenn man Rauschen übereinander legt und in dem Rauschen ist immer an der gleichen Stelle ein Signal." Legt man die Bilder dann übereinander, "verschwindet alles andere und nur dieses Signal wächst heraus".

Bild zeigt drei Messer nebeneinander.
Drei Bilder, drei mal liegt der Fokus an einer anderen Stelle. Werden diese Aufnahmen aber übereinander gelegt, ergibt sich ein komplett scharfes Foto – das Prinzip vom "Foto-Stacking" Bildrechte: Panthermedia

Es gibt keine Informationen aus dem Nichts

Damit zeigt sich schon die erste Grenze der TV-Forensik: Aus einem einzelnen schlechten Foto lässt sich ohne Vergleichsmaterial kein gestochen scharfes Bild erzeugen. "Wo keine Information ist, können wir auch keine neue Information produzieren." Dies sei zum Beispiel nach den tödlichen Schüssen im Leipziger Rockerkrieg ein Problem gewesen: "Wenn Menschen nur 70 Pixel groß sind, dann kann ich da auch keine Identifizierung machen. Ich brauche allein für ein Gesicht 150 mal 150 Pixel." Den Super-Zoom der Crime-Serien gibt es in Wirklichkeit also nicht.

Dreharbeiten für die neue Youtube-Folge von Science vs. Fiction
Um ein Gesicht zu erkennen, sind mindestens 150x150 Pixel nötig. Pixel ist ein Bildpunkt, das kleinste Element auf einem digitalen Foto. Bildrechte: Anne C. Brantin

Stattdessen nutzt die digitale Forensik häufig clevere Vergleiche. Im Fall der Rocker konnten Labudde und sein Team die Todesschützen aus dem verpixelten Video anhand ihrer Kleidung, Größe, Statur und Tätowierungen mit Festnahmefotos und anderem Videomaterial in besserer Qualität abgleichen und dadurch zuordnen. Wo die Technik nicht weiterkommt, "da beginnt die kognitive Arbeit der Mitarbeiter", sagt Labudde. Genau darin stecke auch der Reiz der Foto- und Videoforensik.

Nichtsdestotrotz sind Computer unerlässliche Forensik-Hilfsmittel, vor allem mit der Weiterentwicklung von Künstlicher Intelligenz. Die liefert mittlerweile Algorithmen, die anhand tausender Beispiele selbstständig lernen, wie sich ein menschlicher Körper bewegt. Durch dieses "maschinelle Lernen" kann der Algorithmus später Bewegungsabläufe automatisch aus Videos herauslesen. Um solche Muster sichtbar zu machen, nutzen Labudde und seine Team zum Beispiel das System OpenPose (das hier in einem pdf erklärt wird). Es legt, wenn es auf Fotos und Videos Körper erkennt, sogenannte Keypoints an – zum Beispiel auf beide Schultern, Hände und Knie oder auch Mund, Nase und Ohren. So lässt sich zum Beispiel die Länge einzelner Gliedmaßen vermessen. Diese Technik nutzte Labudde unter anderem im Fall der 100 Kilogramm schweren Goldmünze, die im März 2017 aus dem Berliner Bode-Museum gestohlen wurde.

Die Überwachungsbilder ließen damals keine Gesichtserkennung zu, weil die Täter ihre Hände vor das Gesicht hielten oder Basecaps trugen. Das Körperbild und ihre Bewegungen aber ließen sich dank OpenPose herauslesen. 

In diesem Fall konnte Künstliche Intelligenz also die Verbrecher überführen. Und Dirk Labudde geht fest davon aus, dass die Bedeutung von Algorithmen in der Forensik in Zukunft noch zunehmen wird – aber so unkompliziert wie bei CSI und Co. wird seine Arbeit mit Sicherheit auch dann nicht funktionieren.

Wenn Sie noch mehr zur digitalen Verbrechensaufklärung erfahren möchten oder sich schon immer gefragt haben, ob das Schrumpfen auf Ameisengröße eine tolle Idee ist – schauen Sie doch mal auf unserem YouTube-Kanal "Science vs. Fiction" vorbei. Dort finden Sie auch die aktuelle Folge "CSI in echt: Verbrecherjagd trotz Pixelbilder" mit Prof. Dirk Labudde von der Hochschule Mittweida sowie Jacob Beautemps vom YouTube-Kanal "Breaking Lab".

0 Kommentare