»Personal Voice« Apple will iPhones mit der Stimme ihrer Besitzer sprechen lassen

Mithilfe künstlicher Intelligenz sollen Menschen mit eingeschränkter Sprechfähigkeit künftig Apple-Gadgets für sich sprechen lassen. Verschiedene Sicherheitsmechanismen sollen Missbrauch verhindern.
iPhones mit der eigenen Stimme sprechen lassen: Personal Voice soll es ermöglichen

iPhones mit der eigenen Stimme sprechen lassen: Personal Voice soll es ermöglichen

Foto: Apple

Was wäre, wenn das iPhone statt mit Siris Stimme mit der seiner Eigentümerin oder seines Eigentümers sprechen könnte? Genau das hat Apple am Dienstagabend angekündigt. Eine neue Funktion namens »Personal Voice« soll es ermöglichen, die eigenen Stimme zu synthetisieren und fortan mit den Geräten des kalifornischen Herstellers zu nutzen. Der Sprachsynthesizer ist dabei nur eine von etlichen neuen Funktionen, mit denen iPhones, iPads und Macs Menschen unterstützen sollen, die mit kognitiven, visuellen, auditiven oder motorischen Einschränkungen leben.

Personal Voice ist speziell für Anwenderinnen und Anwender gedacht, bei denen die Gefahr besteht, dass sie ihre Sprachfähigkeit verlieren. Zu den Krankheiten, in deren Verlauf eine solche Einschränkung entstehen kann, gehört die Amyotrophe Lateralsklerose (ALS), an der etwa der Physiker Stephen Hawking erkrankt war. Eine Schädigung der Stimmbänder gehört aber auch zu den Risiken von Schilddrüsenoperationen, von denen in Deutschland pro Jahr 56.000 durchgeführt werden . Grundsätzlich aber steht die neue Funktion jedem Nutzer und jeder Nutzerin zur Verfügung. Die einzige Voraussetzung ist ein iPhone, iPad oder Mac mit einem Apple-Chip.

Bedienungshilfen für Menschen mit kognitiven Einschränkungen auf iPad und iPhone

Bedienungshilfen für Menschen mit kognitiven Einschränkungen auf iPad und iPhone

Foto: Apple

Kriminelle nutzen ähnliche Technologie offenbar schon

Genutzt werden kann die synthetische Stimme dann beispielsweise mit der ebenfalls am Dienstag angekündigten Funktion »Live Speech«. Die soll es bei Telefonaten und Facetime-Gesprächen ermöglichen, den Text, den man sagen will, auf einer Tastatur einzugeben und dann von einer künstlichen Stimme aufsagen zu lassen. Damit es dabei nicht immer zu Verzögerungen kommt, sollen sich oft verwendete Phrasen abspeichern und per Knopfdruck abrufen lassen.

Die Technik regt natürlich Befürchtungen an, sie könne missbräuchlich verwendet werden, etwa für Scherzanrufe oder gar Telefonbetrug. Erst vor wenigen Tagen hat der SPIEGEL berichtet, dass Kriminelle offenbar schon öffentlich verfügbare Tools nutzen, um aus kurzen Sprachaufzeichnungen synthetische Stimmen bestimmter Menschen zu erzeugen. Diese könnten von den Tätern etwa genutzt werden, um ihre Opfer mit vermeintlichen Hilferufen von angeblich in Not geratenen Bekannten oder Verwandten zur Übergabe größerer Geldsummen zu verleiten.

Um solchem Missbrauch vorzubeugen, hat Apple die Synthese einer Stimme mit mehreren Hürden versehen. Während etwa dem Vall-E-Sprachsynthesizer des durch ChatGPT bekannten KI-Unternehmens OpenAI schon eine drei Sekunden gesprochene Sprache ausreichen sollen, um eine Stimme zu digitalisieren, dauert dieser Vorgang bei Apple 15 Minuten. Innerhalb dieser Zeitspanne müssen die Anwender mehrere Sätze nachsprechen, die das System aus einem Datensatz von 150 Sätzen zufällig auswählt und in zufälliger Reihenfolge abfragt, erklärt eine Apple-Sprecherin dem SPIEGEL.

Cloud-Synchronisierung nur auf ausdrücklichen Wunsch

Zudem erfolge der gesamte Trainingsprozess, also die maschinelle Arbeit zur Synthetisierung, direkt auf dem jeweiligen Gerät. Nur wenn die Anwenderin oder der Anwender dies ausdrücklich selbst auswählt, könne die derart synthetisierte Stimme über Apples iCloud an weitere Apple-Geräte des Besitzers oder der Besitzerin weitergegeben und auf diesen genutzt werden. Die Datenübertragung erfolge dabei Ende-zu-Ende verschlüsselt.

Wer sich zur Zielgruppe von Personal Voice zählt – oder die neue Funktion einfach nur neugierig ausprobieren möchte – muss allerdings noch Geduld aufbringen. Die Veröffentlichung von Apples Sprachsynthesizer ist erst für Ende des Jahres geplant – und zunächst auch nur auf Englisch. Wann eine deutsche Sprachversion folgen wird, ist derzeit noch nicht abzusehen.

mak
Die Wiedergabe wurde unterbrochen.
Playlist
Speichern Sie Audioinhalte in Ihrer Playlist, um sie später zu hören oder offline abzuspielen. Zusätzlich können Sie Ihre Playlist über alle Geräte mit der SPIEGEL-App synchronisieren, auf denen Sie mit Ihrem Konto angemeldet sind.
Jetzt anmelden
Sie haben noch kein SPIEGEL-Konto? Jetzt registrieren
Merkliste
Speichern Sie Ihre Lieblingsartikel in der persönlichen Merkliste, um sie später zu lesen und einfach wiederzufinden.
Jetzt anmelden
Sie haben noch kein SPIEGEL-Konto? Jetzt registrieren
Mehrfachnutzung erkannt
Bitte beachten Sie: Die zeitgleiche Nutzung von SPIEGEL+-Inhalten ist auf ein Gerät beschränkt. Wir behalten uns vor, die Mehrfachnutzung zukünftig technisch zu unterbinden.
Sie möchten SPIEGEL+ auf mehreren Geräten zeitgleich nutzen? Zu unseren Angeboten