Der Redakteur | 09.07.2021 Was wissen Smart Speaker über die Nutzer?

MDR THÜRINGEN-Hörerin Christin hat den Verdacht, dass Alexa & Co. auch mithören, wenn sie es eigentlich nicht tun sollten, also nicht angesprochen wurden. Der Grund für den Verdacht: Sie bekommt in sozialen Netzwerken wie Instagram oder Facebook personalisierte Werbung von Produkten zu sehen, über die sie sich zwar unterhalten, aber die sie nie gegoogelt hat. Wie kommt das zustande?

Ein Smart Speaker auf einem Tisch.
Radio hören, Wetter abfragen, Musik abspielen - Smart Speaker werden per Sprachbefehl gesteuert. Bildrechte: MITTELDEUTSCHER RUNDFUNK

Werden wir etwa ständig abgehört? Gibt es permanente Lauschangriffe von Google, Facebook, Amazon oder Apple, von denen nicht einmal die Stasi zu träumen gewagt hat?

Zunächst müssen wir daran erinnern, dass wir das Internet als kostenfreien Raum kennengelernt haben und auch so nutzen. Google ist dann irgendwann zum Sinnbild für die Kommerzialisierung geworden, obwohl das den ersten Nutzern gar nicht sofort auffiel. Ungeschickt war dieser Start nämlich nicht. In den Anfangsjahren war es zunächst Yahoo, das uns durchs Internet führte. Dessen Gründer David Filo und Jerry Yang studierten an der Universität Stanford und hatten 1994 eine Navigationshilfe geschaffen, indem sie Internetseiten nach Kategorien ordneten. Die Startseite Yahoo war sehr bunt und enthielt viele Werbebanner.

Viele Online-Angebote sind vermeintlich kostenlos

Anders dann Google. Das bis heute gebliebene sehr aufgeräumte Erscheinungsbild der Startseite sah verlockend aus. Scheinbar frei von nerviger Werbung wurde uns diese dann allerdings schnell in den Suchergebnissen untergejubelt. Heute sind längst "echte" Suchergebnisse, Werbung und Verkaufsangebote vermischt und SEO (Suchmaschinenoptimierung) ernährt ganze Heerscharen von IT-Dienstleistern, die ihre Kunden in die erste Reihe setzen, also ganz oben auf Seite 1 auftauchen lassen wollen.

Neben Google sind auch andere Angebote wie Facebook, Instagram oder Twitter für den Nutzer kostenlos, obwohl deren Betrieb schon der Server und der Stromkosten wegen richtig Geld kostet. Das muss irgendwoher kommen - nur wir zahlen halt nicht mit Geld, sondern mit unseren Daten.

Die Kunden von Facebook und Google sind überhaupt nicht die Nutzer, sondern die Werbetreibenden. Und die Nutzer sind eigentlich das Kapital dieser Unternehmen.

Wolfgang Pauler, Leiter Testzentrum Chip.de

Je genauer die Interessen der Nutzer bekannt sind, umso zielgenauer kann Werbung an den Mann gebracht werden, und diese personalisierte interessenbezogene Werbung lässt sich auch viel teurer verkaufen. Dass auch die Sprachsysteme für die Erstellung der Nutzerprofile benutzt werden, das ist logisch. Dass sie aber auch ungefragt mithören, dieser Verdacht besteht schon seit Langem.

Ein Smart Speaker auf einem Tisch 10 min
Bildrechte: imago/AFLO

MDR THÜRINGEN - Das Radio Fr 09.07.2021 20:09Uhr 09:40 min

https://www.mdr.de/mdr-thueringen/audio-chip-wolfgang-pauler-interview-100.html

Rechte: MITTELDEUTSCHER RUNDFUNK

Audio

So könnte es durchaus sein, dass ungefragt mitgeschnittene Gespräche am Ende dazu führen, dass wir gezielt Werbung gezeigt bekommen. Die Experten von Chip haben dazu auch schon einen Versuch gemacht, haben extra angelegte jungfräuliche Facebookprofile genutzt und Smartphones in einen Raum gelegt, der mit ganz bestimmten Schlüsselwörtern beschallt wurde.

Wir haben dann überprüft, ob wir in den Feeds Werbung sehen, die darauf gepasst hätte. Das konnten wir so nicht bestätigen. Aber es gibt immer wieder Menschen, die aus dem persönlichen Erleben berichten, dass so etwas passiert.

Wolfgang Pauler, Leiter Testzentrum Chip.de

Ist die heimliche 24-Stunden-Überwachung denkbar?

Nun muss man sich zunächst die Frage stellen, welchen Mehrwert es hat, quasi alles mitzuhören, 24/7. Schließlich reicht es ja nicht, einfach nur ein Mikrofon mit einer Aufnahmesoftware mitlaufen zu lassen. An irgendeiner Stelle muss eine künstliche Intelligenz diese Daten auch auswerten und sie dann den anderen Daten des Nutzers zuordnen.

Das passiert auf Servern und dorthin müssen die Audios erst einmal kommen. Zum Vergleich: Etwa 100 kbit/s sind für das Telefonieren nötig, viel schlechter sollte die Sprachqualität auch für die technischen Mithörer nicht sein. Würde alles, was wir sagen, zum Auswerten weitergereicht, würde sich folgende Rechnung ergeben: 100 kbit pro Sekunde sind rund  0.012 MB mal 60 Sekunden, mal 60 Minuten mal 24 Stunden = 1.036 MB jeden Tag an Daten. Bei einer besseren Tonqualität deutlich mehr. Gerade bei der Nutzung mobiler Daten auf dem Handy würde diese Datenmenge von umgerechnet täglich mindestens einem Gigabyte ganz sicher auffallen.

Der technische Aufwand wäre riesig, wenn die Geräte nicht nur auf ein Schlüsselwort warten und dann aufwachen, sondern alles aufzeichnen und zum Auswerten irgendwohin schicken würden. Und dann wäre auch der Akku relativ schnell leer.

Wolfgang Pauler, Leiter Testzentrum Chip.de

Smart Speaker "denken" nicht immer mit

Dass Anrufe bei Servicehotlines "zur Verbesserung der Servicequalität" mitgehört werden, das ist bekannt. Auch Amazon ist mit seiner Praxis schon auffällig geworden, weil Mitarbeiter persönliche Mitschnitte von Nutzern abgehört hatten, um Fehler zu finden, also zum Beispiel Fragen, auf die Alexa falsch geantwortet hat. Und das fängt beim Code-Wort an.

Auch wenn das 24-Stunden-Abhören nicht das Problem zu sein scheint, so haben Alexa und Co. offensichtlich so schlechte Ohren, dass sie alles Mögliche als Aufforderung verstehen, aktiv zu werden, woraufhin dann auch Daten verarbeitet und zum Server gesendet werden. Wissenschaftler vom Max-Plack-Institut für Sicherheit und Privatsphäre haben elf gängige Systeme einem Extremtest unterzogen und sie tagelang mit Serien oder Nachrichtensendungen beschallt. Einmal auf Englisch und dann auch auf Deutsch.

Wir haben zwölf Tage auf Englisch abgespielt und 300 Trigger gefunden und auf Deutsch waren es acht Tage gewesen und 272 Trigger.

Maximilian Golla, Max-Plack-Institut für Sicherheit und Privatsphäre in „STRG_F“ vom NDR

Das heißt: mehr als 30 Mal pro Tag haben die verschiedenen Sprachassistenten irgendeinen deutschen Satz als Code-Wort interpretiert. Nun muss man zur Ehrenrettung der Systeme sagen, dass in den Haushalten selten 24 Stunden durchgetextet wird und diese 30 Fehlstarts nicht alle bei jedem einzelnen Gerät, sondern bei allen zusammen auftraten. Aber auch die Auswertung von Datensammlungen aus dem Alltag durch die NDR-Kollegen von „STRG_F“ NDR offenbarten zahllose fehlerhafte Lauschangriffe und damit ungewolltes Mithören.

Also einfach den Stecker ziehen! Und dann?

Sprachassistenten mögen den Alltag erleichtern, es soll aber auch schon Generationen von Menschen gegeben haben in der Erdgeschichte, die ohne solche Systeme überlebt haben. Von daher: Einfach deaktivieren, auch auf dem Handy, wenn man es sowieso nicht nutzt. Damit ist wenigstens das direkte Mithören durch die "Bordsysteme" des Handys wie zum Beispiel den Google Sprachassistenten "Assistant", Cortana (Microsoft), Bixby (Samsung) oder Siri (Apple) kein Thema mehr.

Allerdings ist das Datensammeln schon so sehr in unseren Alltag vorgedrungen, dass ein komplettes Abkoppeln unmöglich erscheint. Als Nutzer erkennen wir gar nicht alle Möglichkeiten, die die Datensammler nutzen. Das mögliche Interesse an irgendwelchen Produkten lässt sich nämlich nicht zwangsläufig nur aus Suchaktivitäten oder Internetkäufen schließen.

Auch über die Auswertung von Metadaten können Informationen gewonnen werden. Facebook weiß zum Beispiel über die Positionsdaten, mit wem man sich getroffen hat. Daraus könnte Facebook auf gleiche Interessen schließen.

Wolfgang Pauler, Leiter Testzentrum Chip.de

Produktvorschläge bisweilen absurd

Dass das "intelligente" Gesamtsystem permanent auch Blödsinn produziert, uns nervig Dinge anpreist, die wir gerade gekauft haben, uns Flüge nach Barcelona andrehen will, nur weil wir das gleichnamige Lied von Freddie Mercury und Montserrat Caballé gesucht haben, das alles fällt wahrscheinlich unter Kollateralschaden.

Fest steht nur: Die technischen Möglichkeiten werden in Zukunft eher zunehmen. Das bedeutet, wir als Nutzer sollten weiter wachsam, aber nicht hysterisch mit der Technik umgehen. So braucht nicht jede App jede Berechtigung. Deshalb ist es ratsam, sich einmal einen der zahlreichen verregneten Sommertage Zeit zu nehmen und sich einerseits von unnötigen Apps zu befreien und andererseits auch die Berechtigungen der verbleibenden Apps anzuschauen. Denn Experten warnen immer wieder vor unscheinbaren Apps bis hin zur Taschenlampe, die die heimlichen Datensammler auf dem Smartphone sind.

Klar, die Navigationsapp muss meinen Standort kennen. Ob ich aber einer Facebook-App immer erlauben sollte meinen Standort abzufragen oder irgendeiner anderen App, die nichts damit zu tun hat, da würde ich eben genauer schauen.

Wolfgang Pauler, Leiter Testzentrum Chip.de

Viele sind erschrocken, wie genau die eigenen Webaktivitäten dokumentiert werden, und sind auch überrascht, welche Einstellungsmöglichkeiten man hat, das Sammeln zu verhindern. Bei Google sollten Sie hier einen Blick hineinwerfen.

Oder Sie warten auf den Sprachassistenten "Made in Germany" - das Projekt "Speaker", das aktuell am Fraunhofer-Institut für Integrierte Schaltungen IIS entwickelt wird. Das Ziel: Die Datensouveränität personenbezogener und unternehmensrelevanter Informationen sollen allein bei den deutschen Unternehmen und Behörden liegen, die das System nutzen. Und die europäischen Standards zur Datensicherheit werden auch eingehalten.

Wer suchet, der findet - aber wie?

Bei der Internetsuche gibt es bereits EU-Alternativen. Die französische Suchmaschine Qwant verspricht, keine Nutzerdaten und Suchergebnisse zu speichern, die deutsche Version ist mittlerweile verfügbar, die Juniorvariante allerdings nur auf Französisch.

Und auch aus Deutschland gibt es Alternativen. In Kooperation mit der Leibniz-Universität Hannover ist Metager entstanden, da steckt das „GER“ schon im Namen. Hier werden keine personenbezogenen Daten gespeichert, keine Session-Cookies, keine IP-Adressen, es werden keine Benutzerprofile angelegt, und auch keine Nutzerverfolgung (User-Tracking); und auch die Server stehen in Deutschland.

Google, Amazon, Facebook & Co. können das alles nicht von sich sagen. Im Gegenteil, wenn Sie sich die Datenschutzbestimmungen von Google anschauen, werden Sie schon nach ein paar Zeilen feststellen: So heimlich ist das gar nicht, was da alles passiert, nur ein bisschen unheimlich eben.

Unter anderem könnten folgende Aktivitätsdaten erhoben werden: Begriffe, nach denen Sie suchen, Videos, die Sie sich ansehen, Inhalte und Werbeanzeigen, die Sie sich ansehen und mit denen Sie interagieren, Sprach- und Audiodaten bei Ihrer Nutzung von Audiofunktionen, Kaufaktivitäten, Personen, mit denen Sie kommunizieren oder Inhalte austauschen, Aktivitäten auf Websites und Apps von Drittanbietern, die unsere Dienste nutzen …

Datenschutzbestimmungen von Google

Quelle: MDR THÜRINGEN

Dieses Thema im Programm: MDR THÜRINGEN - Das Radio | Ramm am Nachmittag | 09. Juli 2021 | 16:40 Uhr

0 Kommentare