Amazon Echo und Google Home Okay, Kuchen

Die virtuellen Assistenten von Amazon und Google können unbeabsichtigt aktiviert werden - durch falsche Signalwörter. Das ist bisweilen witzig, kann aber zum Problem werden.

Es ist ein süßes Missverständnis: Der Befehl "Okay, Kuchen" weckt den sogenannten smarten Lautsprecher Google Home ebenso auf wie die eigentliche Aktivierungsphrase "Okay, Google". Auch "Okay, gut" oder "Okay, gucken wir mal" funktionieren, wie die Marktwächter der Verbraucherzentrale NRW herausgefunden haben.

Amazons Lautsprecher Echo mit der virtuellen Assistentin Alexa passiert so etwas den Marktwächtern zufolge ebenfalls. Er höre auf das eigentliche Aktivierungswort "Alexa", aber auch auf "Alexandra". Und statt nur bei "Echo" werde er auch bei "Gecko" aktiv, ebenso bei "Ham wa schon" statt "Amazon". Mitunter reagiere Alexa "sogar völlig willkürlich", heißt es im Artikel der Marktwächter .

"Verbraucher sollten sich bei der Nutzung von digitalen Sprachassistenten also bewusst machen, dass auch von ihnen unbeabsichtigt Daten an die Anbieter-Server übertragen werden könnten", schreibt die Verbraucherschützerin Ayten Öksüz. Es sei "denkbar", dass das gesprochene Wort der Nutzer "für Werbung genutzt werden könnte".

Fotostrecke

Smarte Lautsprecher im Test: Gadgets mit Alexa und Google Assistant im Vergleich

Foto: SPIEGEL ONLINE

In ihrer Untersuchung konnten die Tester allerdings nur feststellen, dass Daten mitunter an Googles Analyse- und Werbeserver übertragen werden, nicht aber, welche Daten. Die - an sich natürlich löbliche - verschlüsselte Übertragung verhindert genauere Einblicke.

In einem technischen Hintergrundpapier der Marktwächter  heißt es allerdings, dass sich Amazon wiederum durch seine Nutzungsbedingungen grundsätzlich vorbehalte, Echo-Nutzerdaten für individualisierte Werbung zu nutzen.

Amazon will transparent sein

Auf SPIEGEL-Anfrage teilte Amazon mit, das Unternehmen habe "aktuell keinerlei Pläne, die über Alexa generierten Daten für Werbezwecke zu nutzen." Echo-Besitzer würden zudem am blauen Leuchtring des Lautsprechers erkennen, ob das Gerät gerade aktiviert sei. Auf Wunsch können sie auch ein akustisches Signal wählen, das immer erklingt, wenn der Echo "aufgeweckt" wurde. Und sie können einzelne oder alle Aufnahmen von Amazons Servern löschen.

Unabsichtlich gestartete Aufnahmen, die Alexa nicht verarbeiten kann, weil sie keine Frage oder keinen Befehl enthalten, beantwortet die Assistentin mit einem Satz wie "Das habe ich nicht verstanden". Gespeichert werden diese Aufnahmen trotzdem. Durch die hörbare Reaktion von Alexa sollten Nutzer aber bemerken, dass sie gerade mit dem Gerät interagiert haben.

Google hat zum Zeitpunkt der Veröffentlichung dieses Artikels eine Stellungnahme in Aussicht gestellt, sie aber noch nicht geschickt.

Update vom 15.3.: Google schreibt in einer E-Mail: "Wir verarbeiten die Sprache erst, nachdem die Hotwords "Hey Google" oder "OK Google" erkannt wurden. Wenn das Hotword nicht gehört wird, bleibt das Audio-Snippet lokal auf dem Gerät und wird verworfen."

Ähnlich wie bei Amazons Echo wird auch an Googles Lautsprecher angezeigt und durch eine Reaktion des Assistant verdeutlicht, ob er aktiv ist. Auch ein entsprechendes akustisches Signal lässt sich einstellen.

Zur Verwendung der aufgezeichneten Daten teilt Google mit: "Suchanfragen, die mit dem Assistant durchgeführt werden, tragen dazu bei, welche Anzeigen wir ausspielen." Auf myactivity.google.com  könnten Nutzer den Verlauf oder einzelne Suchanfragen nachträglich löschen.

Missverständnisse werden in Kauf genommen

Dass die Geräte mitunter auf falsche Signalwörter reagieren, ist zu einem gewissen Grad eine bewusste Entscheidung der Hersteller. Wie das Technikportal "ZDNet" hier sehr anschaulich beschreibt , sind die Mikrofone in den Lautsprechern immer aktiv. Schnappen sie ein Geräusch auf, dessen Schallwellen denen des Aktivierungsbegriffs ähnlich genug sind, aktivieren sie die virtuellen Assistenten und damit die Datenübertragung zu den Servern der Anbieter.

Wie eindeutig die Wellenform ist, hängt von mehreren Faktoren ab: von der Nähe des Sprechers zu den Mikrofonen, von den Umgebungsgeräuschen, vom Akzent und der Lautstärke der Nutzer zum Beispiel.

Die Hersteller müssen eine Schwelle für die Eindeutigkeit der Wellenform festlegen, ab der sie ihre Assistenten aktivieren. Liegt sie zu hoch, reagiert das Gerät möglicherweise nur selten auf das richtige Aktivierungswort - einfach, weil die Nutzer zu weit entfernt sind, zu undeutlich sprechen oder sie die anderen Geräusche im Raum nicht genug übertönen. Liegt die Schwelle niedrig, reicht es, ein Signal zu erzeugen, das dem des eigentlichen Aktivierungswortes ähnlich ist.

Die niedrige Schwelle entspricht dem Gedanken der Hersteller, ihre Sprachsysteme lieber zu oft als zu selten anspringen zu lassen, weil letzteres für die Nutzer frustrierender wäre. Anders ausgedrückt: "Okay, Kuchen" statt "Okay, Google" ist kein Fehler, sondern ein Feature.

Fotostrecke

Die besten Siri-Sprüche: "Miezekatze, Miezekatze, Miezekatze"

Die Wiedergabe wurde unterbrochen.