Nach Wirbel um Sprachassistent Google Duplex gibt sich jetzt zu erkennen

"Hi, ich bin Googles automatischer Buchungsdienst": Die Software Duplex klingt wie ein Mensch und erledigt Reservierungen am Telefon. Beim Test mit Reportern zeigte Google nun eine wichtige Neuerung.

Google-Managerin Valerie Nygaard demonstriert ein Gespräch mit Google Duplex in Mountain View.
AP

Google-Managerin Valerie Nygaard demonstriert ein Gespräch mit Google Duplex in Mountain View.


Google Software Duplex war der große Knaller auf der Entwicklerkonferenz I/O im Mai. Das Unternehmen demonstrierte, wie Duplex telefonisch einen Frisörtermin buchte und in einem Restaurant einen Tisch bestellte - ohne, dass die Menschen am anderen Ende der Leitung zu bemerken schienen, dass sie mit einem Computer sprachen. Solche Demonstrationen verschwinden bei vielen Unternehmen nach der öffentlichkeitswirksamen Erstaufführung schnell wieder in der Schublade. Bei Google ist das anders.

In New York City und im kalifornischen Mountain View lud Google diese Woche mehrere US-Journalisten zum Ausprobieren von Duplex ein. Nebenbei wollte das Unternehmen klarstellen, dass es auf die Kritik nach der I/O reagiert hat.

Denn so beeindruckend Duplex damals aus technischer Sicht war, so fragwürdig erschien die Vorführung aus ethischer Sicht. Zu keinem Zeitpunkt hatte Duplex seinen Gesprächspartnern signalisiert, dass es ein Computerprogramm ist und das Gespräch für seinen Nutzer aufzeichnet.

Fragwürdiges Täuschungsmanöver

Im Gegenteil, mit dem einen oder anderen eingestreuten "hm" und "äh" sollte Duplex sogar besonders menschlich klingen. Google, so wirkte es auf Beobachter, hatte für den Applaus des Publikums riskiert, mit einem Täuschungsmanöver das Misstrauen von Menschen in technische Neuerungen zu vergrößern. Wenn Duplex sich in den Gesprächen zu erkennen gegeben haben sollte, hatte Google das für die I/O herausgeschnitten.

Fotostrecke

25  Bilder
Google i/o 2018: Das Festival der Nerds

Bei den neuen Tests in New York und Mountain View lief es anders. Jedes Gespräch der Reporter, die in die Rolle von Restaurantmitarbeitern schlüpften und Anrufe entgegen nahmen, begann Duplex mit den Sätzen "Hi, ich möchte einen Tisch reservieren. Ich bin Googles automatischer Buchungsdienst, ich nehme das Gespräch also auf."

So testeten die Reporter Duplex

Über die weiteren Verläufe der Gespräche waren die Journalisten unterschiedlicher Meinung. Ron Amadeo von "Ars Technica" zeigte sich tief beeindruckt von Duplex. Die Software habe sich höflich ausgedrückt, Rückfragen verstanden, widersprüchliche Angaben bemerkt und eine Uhrzeit mit ihm ausgehandelt, nachdem er sagte, zur ursprünglich gewünschten Zeit sei kein Tisch mehr frei.

Die verschiedenen Stimmen der Software - männlich, weiblich, jung, näselnd - seien sehr überzeugend gewesen, obwohl sie noch nicht einmal alles beinhalteten, was Google tatsächlich könne. Die Technik wäre eigentlich auch in der Lage, zum Beispiel Atemgeräusche zu machen und damit noch natürlicher zu klingen. Nur wenn Duplex einen Namen buchstabierte oder eine Telefonnummer aufsagte, habe es roboterhaft geklungen. Und einige Stimmen hätten eher wie ein Teenager geklungen, der eine Pizza bestellt wie ein professioneller Assistent.

Auch Richard Nieva von "Cnet" fand die "Flexibilität der Software beeindruckend". Nur einige Pausen seien vielleicht eine Millisekunde zu lang gewesen. Auf seine Versuche, neben der Reservierung auch ein Gespräch über Sport anzufangen, habe Duplex immer nur mit der Wiederholung seiner eigentlichen Aufgabe reagiert.

Fotostrecke

34  Bilder
Smarte Lautsprecher im Test: Gadgets mit Alexa und Google Assistant im Vergleich

Sonderwünsche bringen Duplex aus dem Konzept

Kurt Wagner von "Recode" war nicht ganz so begeistert. Er ließ Duplex wissen, es gebe für den gewünschten Tag keine freien Tische mehr, und nach einer Rückfrage leitete die Software ihn zu einem menschlichen Assistenten von Google weiter, um das Gespräch fortzusetzen.

Lauren Goode von "Wired" versuchte als Restaurantmitarbeiterin erfolgreich, Duplex aus dem Konzept zu bringen, mit Fragen nach Allergien und einem Stuhl für Kleinkinder zum Beispiel. Ein Mitarbeiter aus dem Google-Callcenter musste einspringen und das Gespräch zu Ende führen. Allerdings glaubte Goode zunächst, auch dabei mit einem Computer zu sprechen. Duplex hatte es also geschafft, auch sie selbst zu verwirren - die Reporterin konnte eine menschliche von einer synthetischen Stimme nicht mehr unterscheiden.

Nick Fox von Google und die Erkennungsfloskel von Duplex
AP

Nick Fox von Google und die Erkennungsfloskel von Duplex

Google-Manager Nick Fox sagte bei dem Termin in New York: "Wir sind noch ziemlich weit davon entfernt, Duplex als Produkt einzuführen." Die Software befinde sich noch in einem sehr frühen Entwicklungsstadium. "Wir reden darüber viel früher, als wir normalerweise über ein Produkt reden."

Die nächste Stufe wird ein Test mit ausgewählten Google-Nutzern und Restaurants und Frisörsalons, irgendwann "in den kommenden Wochen". Was sich vorerst also nicht ändert, ist die Beschränkung auf diese zwei Szenarien. Eine künstliche Intelligenz von Google, die am Telefon lange, komplexe Gespräche über alle möglichen Themen führen kann, wird es in absehbarer Zeit nicht geben.

pbe

Mehr zum Thema


insgesamt 3 Beiträge
Alle Kommentare öffnen
Seite 1
quark2@mailinator.com 28.06.2018
1.
Ich sehe es kommen, daß wir ein Menschenrecht auf Erreichbarkeit eines Menschen haben. So wie das im Moment läuft, wird es immer aufwändiger, bis zu einer Person vorzudringen, die tatsächlich weiß, wovon sie spricht und die befugt ist, selbstständige Entscheidungen zu treffen. Bei vielen Firmen kommt man gar nicht mehr in Kontakt, wenn man nicht irgendwelche magischen Zahlen (Kundennummer, Bestellnummer, etc.) kennt. Bei eBay z.B. findet man unter "Kontakt" nur eine Liste von Topics, die man kommunizieren kann. Was da nicht paßt ... geht vermutlich per Briefpost ... Irre. Insofern ... schön, daß es geht, mit der KI, aber wenn die Menschen wegrationalisiert werden, steht man ggf. im Regen.
fehleinschätzung 28.06.2018
2. Callcenter sind auch nicht das gelbe vom Ei
bei der hohen Anzahl kompetenzbefreiter Mitarbeiter könnte ein standardisiertes Programm die FAQ bearbeiten und die reduzierten Mitarbeiter könnten höherqualifiziert werden, um die echten Probleme zu lösen. .
larsmach 29.06.2018
3. Universelle Sprachschnittstellen ...die Bombe der Automatisierung!
Viel wird diskutiert... am Thema vorbei! - Mustererkennungsbasierte Sprachschnittstellen sind sehr viel weiter als angenommen, und die Entwicklung verläuft exponentiell: Sobald Maschinen und Experten-Datenbanken so reden können wie Menschen, sind die meisten Berufe - auch die mit Qualifikation - Vergangenheit! Das Bemühen um Freiheit erreicht einen neuen Höhepunkt, seit aus Knochen erste geschnitzte Pfeilspitzen Freizeit für Höhlenmalerei ließen. Der Mensch wird zum Assistenten sprechender Baukräne degradiert (die werden Sicherheitsvorkehrungen, Lastdiagramme etc. immer perfekt kennen und mit uns Laien reden wie erfahrene Kollegen), er wird immer perfekte Diagnosen im Gespräch mit geduldigen Medizincomputern erhalten (ein Mustererkennungssystem hat dieses Jahr erstmals Dermatologen bei zielsicheren Hautkrebsdiagnosen geschlagen!), und - ja! - es wird vorkommen, dass Maschinen und Datenbanken mit derselben Sprachschnittstelle miteinander kommunizieren: Denn sie ist universell! Anders als Menschen werden Computer sich bei der telefonischen Bestellung vieler Pizzen oder Schrauben dann wohl auf ein Datenprotokoll einigen, welches für die weitere Übermittlung viel effektiver sein wird... das ist aber nichts besonderes! Wir haben heute Fahrzeuge, Maschinen und (Kommunikations-)Geräte, die viel mehr können für uns nötig: Viele Funktionen haben wir noch nie gebraucht! Doch es ist billiger, einfach alles einzubauen, wenn Massenfertigung die Produkte dadurch billig macht. Ein Überfluss an Potenzial! In Japan arbeitet man daran, diesen Ansatz auch auf Roboter zu übertragen: Kein teuer entwickelter Roboter zum Einräumen von Supermarktregalen oder nur zum Rasenmähen, sondern ein oder wenige Modelle, die viel mehr können als der jeweilige Benutzer braucht, die dafür jedoch billiger sind! "Programmierbar" werden sie dank Sprachschnittstellen dann durch einfache Gespräche sein: Wie menschliche Kollegen oder Hausdiener! Heute werden Aufgaben oft nur deshalb nicht automatisiert, weil Menschen billiger sind als (noch zu sehr spezialisierte) Maschinen oder Zertifizierungen vollautomatischer Betriebsmodi: Z.B. Zeitarbeiter mit Niedriglöhnen vor Regalen im o.g. Supermarkt oder Piloten, deren Flugzeuge nur dann automatisch anfliegen und landen, wenn sie als Menschen dies im Nebel nicht können. Der Mensch ist (noch) billiger als viele Maschinen - doch das ändert sich seit Jahrzehnten (siehe Industrieroboter, autom. Fertigungsmaschinen!) und heute mit wachsender Geschwindigkeit! - Am Ende ist die Frage, ob Regierungen und Gesellschaften überrascht vom Erfolg auf der Suche nach Freiheit mit hektischem Aktionismus reagieren werden, wenn ihre Bruttoinlandsprodukte großteils ohne den Faktor Mensch entstehen (keine Sozialabgaben, keine Krankenversicherungsbeiträge, keine Umsatzsteuern auf Konsum, da Roboter keine Hawaii-Hemden kaufen) ...somit ist Google Duplex ein gutes Beispiel für den Irrsinn, Konsequenzen nicht zu erkennen und zu diskutieren, bevor sie mit brachialer Gewalt zuschlagen!
Alle Kommentare öffnen
Seite 1

© SPIEGEL ONLINE 2018
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH


TOP
Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.