Debatte um Sprachassistenten Wie arbeitet jemand, der Siri-Aufnahmen auswertet?

Die gängige Praxis von Firmen wie Google, Apple und Amazon, Aufzeichnungen der Sprachassistenten von Menschen prüfen zu lassen, sorgt für Diskussionen. Hier erzählt ein solcher Prüfer von seinem Job - und davon, was er hört.

Wenn Siri mit einem Befehl wie "Code eingeben" nichts anfangen kann, weil die Software das deutsche Wort "Kot" versteht, wird nachgebessert - das ist der Job von Ulrich Kaufmann
DPA

Wenn Siri mit einem Befehl wie "Code eingeben" nichts anfangen kann, weil die Software das deutsche Wort "Kot" versteht, wird nachgebessert - das ist der Job von Ulrich Kaufmann

Von


"Ich glaube nicht, dass das anonymisiert werden muss", schreibt Ulrich Kaufmann per Mail. "Ich erzähle ja nichts, was als Internum zu betrachten ist." Wir haben uns trotzdem entschieden, seinen echten Namen zu seinem Schutz nicht zu nennen, denn Kaufmann arbeitet in einem Bereich, über den im Moment viel diskutiert wird: Er wertet Aufzeichnungen von Apples Sprachassistent Siri aus.

Neben Apple haben auch Google, Amazon und Microsoft eingeräumt, dass sie Spracheingaben ihrer Nutzer von meist externen Dienstleistern auswerten lassen. Dabei geht es darum, zu kontrollieren, ob die Spracherkennungssoftware der Firmen Wörter und Sätze korrekt erkennt und interpretiert. Genau das ist auch die Arbeit, für die Kaufmann eingestellt wurde.

Seinen Arbeitsalltag beschreibt er so: "Ich sitze jeden Tag in einem Großraumbüro mit Kopfhörern vor dem Computer und höre mir Sprachaufzeichnungen an. Ist das, was ich höre, nicht verständlich, wird es als solches kategorisiert." Er verzeichne auch, wenn etwas zufällig oder in einer anderen als der eingestellten Sprache aufgenommen wurde oder wenn ein Teil abgeschnitten wurde. "Wenn alles okay ist, schaue ich mir an, was die Software, zuständig für die schriftliche Erfassung und Wiedergabe, daraus gemacht hat."

Bis zu 1600 Aufnahmen pro Schicht

Mit seinem Job sei er zufrieden, sagt er, seit zehn Monaten mache er das nun schon. Das Dienstleistungsunternehmen bezeichnet er als fairen Arbeitgeber, "der gerade seinen Personalstamm ausbaut und feste Arbeitsverträge vergibt." Das sei ungewöhnlich. "Auch sonst geht man dort eher respektvoll mit uns um."

Dafür werde allerdings auch Leistung verlangt: "Ich schaffe in sechs bis sieben Stunden zwischen 1200 und 1600 Aufnahmen." Kaufmann muss also drei bis fünf Aufnahmen pro Minute bearbeiten. Vieles davon ist Kleinkram: "Das meiste, was man so hört, sind kurze Befehle: 'Mach das Licht im Wohnzimmer auf 50 Prozent', 'Mach die Garage auf', 'Google Tiaprofensäure', "Führe mich in die Bäckerstraße 125 in Buxtehude', 'Spiel GZSZ', 'Geh auf YouTube'."

Wenn mal etwas schiefgeht

Manchmal bekommt er dabei auch Amüsantes zu hören: "Die Kinder sind das Beste. Sie blödeln mit Siri rum, was man in unserer Software schnell als 'unverständlich' wegdrücken kann. Oder sie stellen richtige Fragen: Was bedeutet Metronom? Wo ist Thailand? Was heißt 'Ich liebe dich' auf Chinesisch? Oder sie kommunizieren mit ihren Freunden, wollen was Digitales spielen, Musik hören. Und die ganz Kleinen kommunizieren direkt mit Siri."

Natürlich höre er, so Kaufmann, auch immer wieder Dinge, die Nutzer Siri offensichtlich gar nicht anvertrauen wollten: "Siri kann sich durchaus zufällig aktivieren, was nicht so oft passiert, aber doch häufig. Man sagt 'Hey, der Schiri war gestern krank' oder 'Diese Ringel da aus Teig' und schon aktiviert sich Siri". Das komme vor allem dann vor, wenn die Nutzer mit Akzent oder im Dialekt sprächen.

Die Reaktionen auf solche Fehlauslösungen seien allerdings auch sehr unterschiedlich: "Oft lachen sich die Leute kaputt, wenn sie merken, dass Siri sich aus Versehen eingeschaltet hat. Manche Männer beschimpfen sie dann. Meist aber wohl nur scherzhaft. Vielleicht, um Stress abzubauen." Manche würden sich aber auch richtig ärgern. Solchem Ärger aber könne man eben nur mit seiner Arbeit begegnen: Indem er Fehler entdecke und korrigiere, könne Siri immer besser werden.

Manche Nutzer gehen aber offenbar auch sehr sorglos mit Siri um, würden der Software "auch ganze Kreditkartenangaben, mit Nummern, Ablaufdatum, Sicherheitsnummer und Namen" anvertrauen. Auch habe er schon ärztliche Diagnosen, Berichte von OPs gehört oder Anwälte, die Siri ihre Schriftsätze diktieren.

Aufnahmen ohne Kontext

Den Vorwurf, er und seine Kollegen hörten Siri-Nutzer quasi ab, weist Kaufmann aber vehement von sich. Er wisse er ja nicht, wer was gesagt hat, alles sei "strikt anonym". Doch er sagt auch: "Alles Menschliche kommt bei Siri an, im Guten wie im Schlechten, sozusagen." Weinende Kinder oder Dirty Talk - Siri bekommt demnach viel zu hören.

Oft sei in den Proben aber nicht einmal zu erkennen, um was es in den Aufnahmen geht. Die Software, mit der er arbeiten müsse, spiele ihm einfach eine Aufzeichnung nach der anderen vor. "Die Einträge kommen komplett ohne Kontext und sind meist kurz."

Seine Aufgabe sei es dann, die korrekten Namen von Songs, Interpreten und Webseiten, die Siri möglicherweise falsch erkannt hat, herauszufinden. Meist würden er und seine Kollegen dafür einfach bei Google nachschauen. Als Beispiel nennt er den Satz "Und du musst noch den Code eingeben", den Siri zunächst als "Und du muss doch den Kot eingeben" interpretiert hat. Diesen Fehler habe er korrigiert. Seither kann Apples künstliche Intelligenz das Wort Code auch im Deutschen so interpretieren, wie es gemeint ist.

"Warum eigentlich jetzt dieser Aufschrei?"

Angesichts der vielen Berichte zu dem Thema, die jetzt in den Medien auftauchen, fragt Kaufmann: "Warum eigentlich jetzt dieser Aufschrei? Das Ganze gibt es seit Langem, man wusste das doch. Wir sind hier Hunderte, aus allen möglichen Ländern und Sprachen." Er habe jedenfalls "keine Möglichkeit, die Daten der Personen zu erfahren, deren Sprachaufnahmen ich anhöre."

Konkret beschäftigt ihn aber noch mehr, wie es mit seinem Job jetzt weitergeht. Schließlich hat Apple angekündigt, von Siri angefertigte Sprachaufnahmen seiner Nutzer vorerst nicht mehr von Auftragnehmern auswerten lassen. Der Konzern will seine Nutzer künftig ausdrücklich um eine Erlaubnis zum nachträglichen Anhören von Mitschnitten durch Mitarbeiter bitten. Dafür ist aber ein Softwareupdate nötig, das gerade entwickelt wird.

"Ich habe vorerst ein bezahltes langes Wochenende vor mir, nach dem wir alle bis auf Weiteres nach Hause geschickt werden", beschreibt er seine Situation. Er hoffe jedenfalls, dass Apple seine Ankündigung bald wahrmacht, die Nutzer künftig zu fragen, ob ihre Sprachaufzeichnungen analysiert werden dürfen. "Dann geht es hier weiter, hoffe ich. Sonst bin ich wieder mal arbeitslos."



insgesamt 18 Beiträge
Alle Kommentare öffnen
Seite 1
Nervenkostüm 08.08.2019
1. Selber schuld
Schöne Diskussion. Bevor hier allerdings Siri und Konsorten oder etwa eine internetfähige Kaffeemaschinen einziehen, geht die Sonne eher viereckig auf. Das Problem muss also leider draußen bleiben und gibt es daher hier nicht. Und wenn es sein muss, suchen wir und bis zuletzt nicht-internetfähige Maschinen auf den Flohmärkten. Was soll der ganze Quatsch also? Wer dumm genug ist, so was anzuschaffen, ist nichts als selber schuld. Das seine Ansprüche auf Datenschutz und was auch immer ignoriert werden, ist dabei so selbstverständlich, wie die Gesetze die dazu nicht eingehalten werden.
mablü 08.08.2019
2.
Von allen Bedenken und Problemen mit Datenschutz ist das hier wohl das geringste Problem. Kann den Aufschrei absolut nicht nachvollziehen. Sommerloch im deutschen Beschwerdekontingent?
Referendumm 08.08.2019
3. Interview? Nur ne Fingerübung?
Was bitteschön sollen wir Leser mit so einem weichgespülten Bericht anfangen? Das wir alle "ach der Ärmste" denken und dem "Ulrich Kaufmann" ganz fest die Daumen drücken, damit er nicht schon wieder arbeitslos wird? Hoffen, dass demnächst alle Nutzer zustimmen werden? Also ein bissl mehr Kritik hätte ich mir ja schon gewünscht. Schon allein an der (wohl) Tatsache, dass "Ulrich Kaufmann" & Co. 1200 und 1600 Aufnahmen/sechs bis sieben Stunden schafft bzw. schaffen muss. Aha, dann soll dabei auch noch Qualität herum kommen? Was passiert denn mit Aufnahmen - SPON berichtete mal kurz darüber - die strafrechtliche Inhalte oder sogar Angriffe gegen eine Person beinhalten? Klickt man / "Ulrich Kaufmann" die auch einfach weg und macht sich dadurch selber strafbar? Was passiert denn mit all diesen Aufnahmen? Werden die anschließend gelöscht? Falls ja, ab welchem Zeitpunkt. Was passiert denn mit Aufnahmen, wo Kreditkartennummern etc. oder ggf. auch PIN und TAN genannt sind? Keine Info an die Betroffenen, dass vielleicht zu unterlassen? So ein Bericht sollte schon viel mehr sein, als ein bissl auf die Tränendrüse zu drücken. Thema komplett verfehlt – sorry.
Nonvaio01 08.08.2019
4. es wird nichts ignoriert
Zitat von NervenkostümSchöne Diskussion. Bevor hier allerdings Siri und Konsorten oder etwa eine internetfähige Kaffeemaschinen einziehen, geht die Sonne eher viereckig auf. Das Problem muss also leider draußen bleiben und gibt es daher hier nicht. Und wenn es sein muss, suchen wir und bis zuletzt nicht-internetfähige Maschinen auf den Flohmärkten. Was soll der ganze Quatsch also? Wer dumm genug ist, so was anzuschaffen, ist nichts als selber schuld. Das seine Ansprüche auf Datenschutz und was auch immer ignoriert werden, ist dabei so selbstverständlich, wie die Gesetze die dazu nicht eingehalten werden.
wie im bericht steht, gibt es keinen bezug zu dem nutzer. Es geht nur um fehler beseitigung. ich selber hab son teil auch nicht, aber nur weil ich dafuer keine verwendung habe, so gross ist mein Haus nicht..;-)
zeichenkette 08.08.2019
5. Sturm im Wasserglas?
Man kann sich sehr wohl fragen, ob die Übertragung an Server für Sprachassistenten datenschutzrechtlich nicht bedenklich ist, aber dass Menschen da (anonym) reinhören zum Korrigieren ist ja wohl völlig irrelevant.
Alle Kommentare öffnen
Seite 1

© SPIEGEL ONLINE 2019
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung


TOP
Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.