Google-Managerin Valerie Nygaard demonstriert ein Gespräch mit Google Duplex in Mountain View.
Foto: Marcio Jose Sanchez/ APGoogle Software Duplex war der große Knaller auf der Entwicklerkonferenz I/O im Mai. Das Unternehmen demonstrierte, wie Duplex telefonisch einen Frisörtermin buchte und in einem Restaurant einen Tisch bestellte - ohne, dass die Menschen am anderen Ende der Leitung zu bemerken schienen, dass sie mit einem Computer sprachen. Solche Demonstrationen verschwinden bei vielen Unternehmen nach der öffentlichkeitswirksamen Erstaufführung schnell wieder in der Schublade. Bei Google ist das anders.
In New York City und im kalifornischen Mountain View lud Google diese Woche mehrere US-Journalisten zum Ausprobieren von Duplex ein. Nebenbei wollte das Unternehmen klarstellen, dass es auf die Kritik nach der I/O reagiert hat.
Denn so beeindruckend Duplex damals aus technischer Sicht war, so fragwürdig erschien die Vorführung aus ethischer Sicht. Zu keinem Zeitpunkt hatte Duplex seinen Gesprächspartnern signalisiert, dass es ein Computerprogramm ist und das Gespräch für seinen Nutzer aufzeichnet.
Fragwürdiges Täuschungsmanöver
Im Gegenteil, mit dem einen oder anderen eingestreuten "hm" und "äh" sollte Duplex sogar besonders menschlich klingen. Google, so wirkte es auf Beobachter, hatte für den Applaus des Publikums riskiert, mit einem Täuschungsmanöver das Misstrauen von Menschen in technische Neuerungen zu vergrößern. Wenn Duplex sich in den Gesprächen zu erkennen gegeben haben sollte, hatte Google das für die I/O herausgeschnitten.
Bei den neuen Tests in New York und Mountain View lief es anders. Jedes Gespräch der Reporter, die in die Rolle von Restaurantmitarbeitern schlüpften und Anrufe entgegen nahmen, begann Duplex mit den Sätzen "Hi, ich möchte einen Tisch reservieren. Ich bin Googles automatischer Buchungsdienst, ich nehme das Gespräch also auf."
So testeten die Reporter Duplex
Über die weiteren Verläufe der Gespräche waren die Journalisten unterschiedlicher Meinung. Ron Amadeo von "Ars Technica" zeigte sich tief beeindruckt von Duplex. Die Software habe sich höflich ausgedrückt, Rückfragen verstanden, widersprüchliche Angaben bemerkt und eine Uhrzeit mit ihm ausgehandelt, nachdem er sagte, zur ursprünglich gewünschten Zeit sei kein Tisch mehr frei.
Die verschiedenen Stimmen der Software - männlich, weiblich, jung, näselnd - seien sehr überzeugend gewesen, obwohl sie noch nicht einmal alles beinhalteten, was Google tatsächlich könne. Die Technik wäre eigentlich auch in der Lage, zum Beispiel Atemgeräusche zu machen und damit noch natürlicher zu klingen. Nur wenn Duplex einen Namen buchstabierte oder eine Telefonnummer aufsagte, habe es roboterhaft geklungen. Und einige Stimmen hätten eher wie ein Teenager geklungen, der eine Pizza bestellt wie ein professioneller Assistent.
Auch Richard Nieva von "Cnet" fand die "Flexibilität der Software beeindruckend". Nur einige Pausen seien vielleicht eine Millisekunde zu lang gewesen. Auf seine Versuche, neben der Reservierung auch ein Gespräch über Sport anzufangen, habe Duplex immer nur mit der Wiederholung seiner eigentlichen Aufgabe reagiert.
Sonderwünsche bringen Duplex aus dem Konzept
Kurt Wagner von "Recode" war nicht ganz so begeistert. Er ließ Duplex wissen, es gebe für den gewünschten Tag keine freien Tische mehr, und nach einer Rückfrage leitete die Software ihn zu einem menschlichen Assistenten von Google weiter, um das Gespräch fortzusetzen.
Lauren Goode von "Wired" versuchte als Restaurantmitarbeiterin erfolgreich, Duplex aus dem Konzept zu bringen, mit Fragen nach Allergien und einem Stuhl für Kleinkinder zum Beispiel. Ein Mitarbeiter aus dem Google-Callcenter musste einspringen und das Gespräch zu Ende führen. Allerdings glaubte Goode zunächst, auch dabei mit einem Computer zu sprechen. Duplex hatte es also geschafft, auch sie selbst zu verwirren - die Reporterin konnte eine menschliche von einer synthetischen Stimme nicht mehr unterscheiden.
Nick Fox von Google und die Erkennungsfloskel von Duplex
Foto: Marcio Jose Sanchez/ APGoogle-Manager Nick Fox sagte bei dem Termin in New York: "Wir sind noch ziemlich weit davon entfernt, Duplex als Produkt einzuführen." Die Software befinde sich noch in einem sehr frühen Entwicklungsstadium. "Wir reden darüber viel früher, als wir normalerweise über ein Produkt reden."
Die nächste Stufe wird ein Test mit ausgewählten Google-Nutzern und Restaurants und Frisörsalons, irgendwann "in den kommenden Wochen". Was sich vorerst also nicht ändert, ist die Beschränkung auf diese zwei Szenarien. Eine künstliche Intelligenz von Google, die am Telefon lange, komplexe Gespräche über alle möglichen Themen führen kann, wird es in absehbarer Zeit nicht geben.
SPIEGEL+-Zugang wird gerade auf einem anderen Gerät genutzt
SPIEGEL+ kann nur auf einem Gerät zur selben Zeit genutzt werden.
Klicken Sie auf den Button, spielen wir den Hinweis auf dem anderen Gerät aus und Sie können SPIEGEL+ weiter nutzen.
Die große Bühne: Normalerweise treten im Shoreline Amphitheatre Bands wie Coldplay und The Cure auf. Nun hielt Google dort sein jährliches Programmierertreffen i/o ab - und das Gelände wurde zum Konferenzpark umgebaut.
Unterhaltsam einsteigen: Um die Wartezeit auf die große Keynote am ersten Tag etwas unterhaltsamer zu gestalten, treten zum Beispiel diese Elektro-Musiker auf.
Die Keynote selbst dauert dann fast zwei Stunden. Google-Chef Sundar Pichai sprach unter anderem über Möglichkeiten, mit künstlicher Intelligenz medizinische Diagnosen zu verbessern.
Schon morgens um sieben Uhr warten Hunderte Entwickler in der Morgensonne auf den Einlass, der erst um acht Uhr beginnt. Auch wenn es sonnig ist, liegen die Temperaturen zu dieser Zeit nur bei zehn Grad Celsius.
Für manche Vorträge holte Google sich prominente Unterstützung: IT-Professor John Hennessy etwa wurde wie ein Popstar gefeiert.
Google-Karre: Auf dem Freigelände wurden unter anderem Fahrzeuge mit Android Auto gezeigt. Der riesige Dodge Ram verdeckt einen viel kleineren und viel moderneren Volvo XC40.
Langeweile soll es auf der i/o nicht geben. Zu den vielfachen Entspannungsangeboten gehören Tischtennisplatten und Kicker (in den USA auch "Foosball" genannt).
Um die Vorträge bei erträglichen Temperaturen abhalten zu können, pumpen riesige Klimaanlagen kühle Luft in die Zeltkonstruktionen.
Übergröße: Diese vielfach vergrößerte Version eines Google Home Max - das ist ein WLAN-Lautsprecher - ist nicht einfach nur ein Hingucker. Auf der Rückseite befindet sich eine Tür, im Innenraum kann man Googles Smart Speaker Probe hören.
Einfach mal ausspannen: Ab der Mittagzeit lassen sich viele Besucher vom warmen Wetter zum Entspannen verführen.
Diese Papierblume ist Teil einer Schatzsuche. Über das gesamte Gelände waren Aufgaben und Hinweise verteilt. Wer die richtige Lösung fand, bekam einen TV-Stick geschenkt.
Man könnte meinen, diese Besucher würden für einen wichtigen Vortrag anstehen. Tatsächlich wollen sie sich nur alle ein Eis holen.
Überall sind auch verschiedenste Android-Figuren verteilt. So wie diese aus Buchsbaum.
Eine Legowand als eine Art Kunstprojekt: Hier kann sich jeder Legosteine nehmen und zu beliebigen Figuren zusammenbauen.
Manche Teilnehmer lassen ihrer Kreativität dabei freien Lauf. So wie jener, der dieses kleine Auto an die Wand baute.
Sehen Sie auch, was diese Wippe von anderen Spielplatzwippen unterscheidet? Genau: das USB-Kabel.
Selbst wenn einfach nur ein paar kleine Holzbalken auf den Rasen gelegt werden, machen die Besucher daraus nicht einfach Türme, sondern Türme mit Gesicht und Armen.
Allgegenwärtig sind auf der Google i/o solche Snack-Stationen. Es scheint, man habe die Befürchtung, irgendjemand könnte auch nur ansatzweise Hunger empfinden.
Auch die Google-Tochter Waymo war mit ihren selbstfahrenden Autos vertreten, ließ ihre Wagen aber nur stehen, nicht fahren.
Das Motto der Veranstaltung als Graffito.
Über das gesamte Gelände verteilt stehen solche Zelte. Im Inneren werden Google-Projekte vorgstellt.
Ein typisches Bild auf der i/o: Entwickler verbringen die Zeit zwischen zwei Terminen miteinander an ihren Notebooks.
Auch so etwas gibt es auf der Google i/o zu sehen: Die zweite Version der Googles-Prozessoren TPU. Das Kürzel steht für Tensor Prozessing Unit. Die Chips sind speziell für KI-Aufgaben entwickelt worden. Die eigentlichen Chips sind unter den großen Luftkühlern verborgen.
Die neuste Version von Googles Chips für künstliche Intelligenz heißt TPU v3. Diese Prozessoren werden so heiß, dass sie flüssig gekühlt werden müssen.
Hier ist kein herkömmliches Autorennspiel zu sehen: Das Modellauto wird von einer KI über die Strecke gesteuert.
Die Testgeräte: Insgesamt elf verschiedene Produkte, die mit Amazons Alexa oder dem Google Assistant arbeiten, haben wir getestet.
Amazon Echo: Das neue Modell klingt etwas besser als der Ur-Echo und hat verbesserte Mikrofone in der Kopfplatte.
Neu ist am aktuellen Echo auch, dass man die Außenhülle abnehmen kann. Viel zu sehen ist von der Technik auch dann nicht, nur die Membran und der Diffusor des Lautsprechers sind zu erkennen.
Wer mag, kann nun auch nachträglich den Look seines Echo verändern. Die Wechselhüllen aus Kunststoff kosten bei Amazon 20 bis 30 Euro.
Auf Knopfdruck lässt sich das Mikrofon abschalten, was durch rotes Licht signalisiert wird. Laut Amazon wird die Verbindung zwischen Mikro und Elektronik dabei physisch getrennt.
Amazon Echo Plus: Die Röhre ist fast doppelt so hoch wie der Echo und klingt auch deutlich besser. Vor allem aber enthält die Plus-Version einen Smarthome-Hub, der manche anderen Hubs überflüssig machen kann.
Praktisch: Beide Echo-Lautsprecher haben einen Miniklinkenausgang, an den man beispielsweise einen weiteren Aktivlautsprecher oder Kopfhörer anschließen kann.
Amazon Echo Dot: Der smarte Lautsprecher für Pragmatiker klingt furchtbar, kann aber ansonsten alles, was seine großen Brüder auch können.
Und genau wie die übrigen Echos lässt sich auch beim Echo Dot das Mikrofon auf Tastendruck abschalten.
Amazon Echo Show: In den USA gibt es dieses Modell schon länger, seit Ende November 2017 ist es auch in Deutschland erhältlich. Mit 220 Euro ist er der teuerste Echo von Amazon.
Auf dem 7-Zoll-Bildschirm lassen sich auch Filme und Serien aus dem Amazon-Videodienst anschauen. Die Bildqualität ist dabei in Ordnung, wegen der geringen Auflösung von 1024 x 600 Punkten aber nicht gerade begeisternd.
Auch Musik kann über den Echo Show abgespielt werden, samt CD-Covern und Texteinblendungen.
Für Videochats ist eine Kamera eingebaut. Anrufen kann man damit aber nur andere Echo-Show-Geräte oder Smartphones, auf denen die Alexa-App läuft.
Eine Alternative zu den Echo-Lautsprechern sind der Fire TV und der Fire TV Stick von Amazon. In erster Linie bringen sie Streamingdienste auf den Fernseher. Sie können aber auch Alexa nutzen.
Anders als die Lautsprecher warten die TV-Sticks nicht auf ein Aktivierungswort. Stattdessen wird das in die Fernbedienung integrierte Mikrofon nur aktiviert, wenn man die Mikrofontaste drückt.
Ein Testlauf mit Alexa auf dem TV zeigte allerdings, dass Amazons künstliche Intelligenz mit ihren Antworten auch mal ziemlich daneben liegen kann. So wie bei dieser Frage nach dem Schauspieler Charles Bronson.
Besser kam Alexa auf dem Fernseher mit Fragen nach Sportereignissen klar.
Auch einige Amazon-Tablets lassen sich für Alexa nutzen, beispielsweise das Fire HD 10. In den Einstellungen des Geräts kann man festlegen, dass es auf das Aktivierungswort Alexa hört. So taugt es ebenso als Steuerungszentrale für Smarthome-Geräte wie ein Echo.
Der "WLAN-Multiroom-Lautsprecher mit Alexa Voice Service" von Auvisio sieht dem Google Home verblüffend ähnlich, nutzt aber, der Name verrät es, Amazons Alexa. Als einziges Gerät im Test horcht er nicht auf ein Aktivierungswort, sondern startet die Spracherkennung generell nur, wenn man die Mikrofontaste drückt.
Die Stromversorgung erfolgt per USB, weitere Lautsprecher oder Kopfhörer können über eine Audiobuchse angeschlossen werden. Angesichts der dürftigen Klangqualität scheint das auch sinnvoll.
Der beste Sound im Test: Als einziger smarter Lautsprecher kann der Sonos One klanglich überzeugen. Zwei davon ergeben ein schönes Stereo-Paar, das mit 458 Euro nicht sehr billig ist.
Auf der Oberseite des Sonos One sind mehrere Bedienelemente für Lautstärke und Wiedergabesteuerung angebracht, die per Touch bedient werden. Auch das Mikro lässt sich hier abschalten.
Mit dem Google Home hat Google das Konzept des Amazon Echo für seine Dienste adaptiert. Dementsprechend liegt der Fokus hier auf der Bereitstellung von Google-Diensten.
Der einzige physische Schalter dient dazu, das Mikrofon abzuschalten. Der schräge Deckel hingegen ist berührungssensitiv, er dient beispielsweise zur Regelung der Lautstärke.
Der Home Mini ist Googles Gegenstück zu Amazons Echo Dot, also eine um große Lautsprecher abgespeckte Version eines smarten Lautsprechers. Klanglich darf man auch hier nicht viel erwarten.
Zwar ist der Google Home Mini etwas größer als Amazons Echo Dot, mit seinem Textilüberzug lässt er sich aber oft besser in ein Wohnumfeld integrieren. Über Sensorfelder lässt sich auch hier die Lautstärke regeln.
Etwas umständlich ist es, das Mikrofon zu deaktivieren. Dazu muss ein Schalter an der Unterseite verschoben werden.
Deutlich größer als Googles Home Mini ist der TicHome Mini der chinesischen Firma Mobvoi. Statt Sensortasten gibt es hier Drucktasten. Alles ist etwas klobiger gebaut.
Als einziger Smart-Speaker im Test kann der TicHome Mini mit unter die Dusche genommen werden, ohne dass er Schaden nimmt. Für die Dusche reicht die Klangqualität auch gerade mal aus.
Wie viele Sony Produkte zeichnet sich auch dieser Lautsprecher durch eine ungemein langweilige Bezeichnung aus: Als "kabelloser Lautsprecher mit integriertem Google Assistant" steht der LF-S50G beim Hersteller im Katalog. Sein herausstechendes Merkmal: Eine digitale Zeitanzeige, deren Helligkeit glücklicherweise regelbar ist.
Auf der Oberseite sind Sensoren eingebaut, die eine berührungslose Steuerung durch Gesten ermöglichen sollen. Im Test haben die allerdings nicht zuverlässig reagiert.
Auf der Unterseite befindet sich eine Taste zum Steuern der Helligkeit der Zeitanzeige (links) sowie eine Hold-Taste, mit der die Gestensteuerung für drei Minuten abgeschaltet wird.
Auf der Rückseite des Sony-Geräts findet man die Stumm-Taste für das Mikrofon und eine Taste, über die man Bluetooth-Geräte verbinden kann.
Im Bluetooth-Modus lässt sich Musik dann direkt vom Handy auf den Lautsprecher streamen, auch wenn kein WLAN verfügbar ist.
Melden Sie sich an und diskutieren Sie mit
Anmelden