Stimmensoftware Der Mann, der Stumme zum Sprechen bringt

Wenn die Krankheit ihre Stimme raubt, müssen ALS- oder Kehlkopfkrebskranke mühselig mit fremdartig klingenden Roboterlauten kommunizieren. Ein Physiker hat jetzt eine Software entwickelt, mit der man seine eigene Stimme bewahren kann - im Computer.

Von


"Ich bin Jörg Immendorff." Prägnant ertönt die Stimme des berühmten Malers in der Wohnung in Oldenburg. Genauer gesagt: aus dem kleinen Computerlautsprecher Eduardo Mendels.

"Was möchten Sie, dass er sagen soll?", fragt Mendel, während seine Hände reglos über der Laptoptastatur warten.

Mendel tippt, und Immendorffs Stimme sagt: "Ich lese jede Woche den SPIEGEL."

Es klingt sehr echt und ist fast schon gruselig, denn die Stimme gehört einem Toten. Daher zeigt Mendel einem nur sehr ungern dieses Beispiel. Aber es beweist eindrucksvoll, was das Programm kann, das er geschrieben hat: Es verleiht einem Computer eine menschliche Stimme. Jede beliebige.

Immendorff starb vor mehr als einem Jahr an Amyotropher Lateralsklerose (ALS). Zwar behielt er seine Stimme bis zuletzt und brauchte Mendels Software nicht. Aber nicht jeder ALS-Patient hat dieses Glück. Bei dieser Krankheit gehen nach und nach die Verbindungen zwischen Nerven und Muskeln zugrunde, bis die Patienten in aller Regel vollständig gelähmt sind - und oft auch nicht mehr sprechen können.

Wie im Falle des berühmten Physikers Stephen Hawking. Seit Jahren tippt er nur mit einem Wangenmuskel Worte zusammen, die von einem Sprachcomputer ausgegeben werden. Die Roboterstimme mag mittlerweile Hawkings Markenzeichen geworden sein und zum Bild eines genialen Physikers passen. Im Alltag eines ALS-Patienten wirkt sie auf die Umwelt eher befremdlich - auf Freunde, auf Angehörige und nicht zuletzt auf den Patienten selbst.

ALS ist eine teuflische Krankheit - der Körper wird nach und nach zum Gefängnis für den Geist, der - anders als bei Alzheimer oder Altersdemenz - in der Regel unbeeinträchtigt bleibt. Der Kranke erlebt also bei vollem Bewusstsein mit, wie er langsam in seinem eigenen gelähmten Körper vollständig eingesperrt wird.

Vom Teilchenphysiker zum Linguisten

Eduardo Mendel ist eigentlich Physiker und beschäftigt sich mit Quantenfeldtheorie. Gluonen, Bosonen, Fermionen - Einheiten, aus der die Materie besteht, das ist eigentlich sein täglich Brot.

Aber die kleinsten Teilchen liegen nun seit Jahren auf Eis. Als im Jahr 2000 das Schicksal zuschlug, ein guter Freund Mendels an Kehlkopfkrebs erkrankte und seine Stimme verlor, nahm Mendels Leben eine Abzweigung. Wie andere Patienten hätte er einen teuren Apparat bekommen, in den man Text eintippt - und eine Roboterstimme am anderen Ende für einen spricht. Diese Roboterstimme, erzählt Mendel, war einfach nicht zu ertragen, und die wollte er seinem Freund ersparen.

Könnte man nicht dem Computer beibringen, mit der eigenen Stimme zu sprechen, fragte er sich. Es musste doch so eine Software geben, die die Stimme nachbildet. Aber es gab keine solche Software.

Also machte sich Mendel, der programmieren kann, an die Arbeit.

Seitdem widmet er nahezu seine gesamte Zeit der Entwicklung der Stimmen-Software. Mit Erfolg: Nach mehr als fünf Jahren Entwicklungsarbeit hat er es endlich geschafft. Eduardo Mendel hat ein Programm geschrieben, das einem Computer jede beliebige menschliche Stimme verleiht.

3000 Silben für eine Stimme

1,70 Meter groß, blaues Hemd, Brille, gewellte Haare und ein eigenartiger Akzent - Eduardo Mendel ist Chilene und eine heitere Erscheinung. Ein typischer Wissenschaftler, leicht zerstreut, die kindliche Sicht auf die Welt und das Wundern darüber hat er sich bewahrt. Ständig zückt er Zettel, macht Skizzen, erklärt, schweift ab und kommt wieder zurück aufs eigentliche Thema.

"Wussten Sie, dass das Wort 'Persönlichkeit' vom lateinischen Wort 'personare' stammt? Das bedeutet durchklingen", sagt Mendel mit seiner eher sanften Stimme.

Doch wie macht man das - einem Computer eine menschliche Stimme geben? Ganz einfach - der Elementarteilchenphysiker zerlegt sie in ihre kleinsten Teilchen: Silben, Diphtonge - Doppellaute aus zwei Vokalen wie eu, ei, au - und in Phoneme, die bedeutungstragenden Laute einer Sprache. "Ich habe irgendwann herausgefunden, dass 3000 Silben reichen, um etwa 95 Prozent aller deutschen Worte nachzubilden", erklärt Mendel. Die aber muss er erst mal bekommen. Wenn Mendel also eine Stimme im Computer nachbilden will, muss der Sprecher erst einmal eine sieben Seiten lange Liste von Wörtern ins Mikro einlesen:

Eine - werden - über - haben - oder - wurde - Prozent - hatte - geben ...

So beginnt die dreistündige Aufnahmesession der eingelesenen Wörter, mit der Mendel die Stimme konservieren will. Das ist anstrengend, selbst für einen gesunden Menschen. Aber umso mehr für einen Kranken, für den das Sprechen zum Kraftakt geworden ist.

Irgendwann ist es zu spät

5000 Menschen erkranken jedes Jahr an ALS und Kehlkopfkrebs, erzählt Mendel. 2000 davon werden ihre Stimme wahrscheinlich verlieren. "Und wir erreichen noch nicht einmal ein Prozent aller Betroffenen", sagt er traurig.

Das kritische Zeitfenster beginnt vom Zeitpunkt der Diagnose an, sich langsam, aber stetig zu schließen. Der Verlust der Stimme ist schleichend, der Patient spricht immer schlechter - bis es irgendwann zu spät ist und man ihn nicht mehr verstehen kann. Dann kann auch Mendel nicht mehr helfen. Dabei hätten nur drei Stunden Tonaufnahme für rund 600 Euro an Arbeitsaufwand seine Stimme bewahren können. Mendel empfiehlt daher, die Aufnahme auf jeden Fall zu machen - selbst wenn man die Software später dann doch nicht brauchen sollte.

Eine Stimme zu computerisieren, ist viel Arbeit. Nach der Aufnahme werden die Wörter mit einem Audio-Schneideprogramm am Computer in ihre 3000 Einzelteile zerlegt - in Handarbeit. Ein mühseliger Prozess, der insgesamt 65 Arbeitsstunden erfordert. Und am Ende erhält man ein Programm, in das man beliebige Wörter eintippt, die nicht aufgenommen wurden und die von der Software blitzschnell aus den 3000 Stimm-Atomen zusammengesetzt werden (siehe Audio-Beispiele).

Die eigene Stimme auf dem iPod?

Das Erstellen einer Stimme im Computer kostet 3200 Euro, inklusive der 600 Euro für die Aufnahme. Nur etwa die Hälfte der Krankenkassen übernimmt die Kosten. Begründung: Es gebe ja bereits kommerzielle Software, die den Kranken ein Mindestmaß an Kommunikation erlaube. "Was das für einen psychologischen Unterschied macht, ob man mit einer Roboterstimme oder seiner eigenen spricht, begreifen einige leider nicht", sagt Mendel frustriert. Aber er hofft, dass es zukünftig mehr werden. Manche Patienten klagen auch schon um die Kostenübernahme vor Gericht.

Mit computerisierten menschlichen Stimmen könnte man so allerlei anfangen: Hörbücher auf dem iPod hören - gelesen von der Stimme des Liebsten. Oder Schabernack treiben mit der Stimme Angela Merkels oder anderen Prominenten. Oder einfach nur Telefonbanking oder die Bahnsteigdurchsagen sympathischer machen.

An einer kommerziellen Nutzung seiner Software hat Mendel aber kein Interesse. "Ich will, dass dieses Programm den Kranken zugute kommt", sagt er. Und diesmal hört sich seine Stimme ziemlich durchklingend an.



© SPIEGEL ONLINE 2008
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH


Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.