Evolution Computer rekonstruiert Wörter aus Ursprache
Wie lautet der gemeinsame Ursprung von Wörtern aus verschiedenen Sprachen? Forscher beantworten derartige Fragen jetzt mit Software. Erste Tests mit mehr als 600 Sprachen aus dem Pazifikraum verlaufen vielversprechend.
Berlin - Die gemeinsame Wurzel einer Sprachgruppe zu finden, ist keine leichte Aufgabe. Nur selten stehen Linguisten umfangreiche schriftliche Aufzeichnungen wie etwa beim Latein zur Verfügung. Die Rekonstruktion einer Ursprache, auch Protosprache genannt, ist daher in der Regel mühevolle Handarbeit.
Alexandre Bouchard-Côté von der University of British Columbia in Vancouver (Kanada) hat nun gemeinsam mit Kollegen eine neue Methode entwickelt, die statistische Methoden nutzt. Es ist nicht der erste Versuch, den Ursprung von Wörtern per Software zu finden - aber wohl der bislang erfolgversprechendste.
Im Fachblatt "Proceedings of the National Academy of Sciences" beschreiben die Wissenschaftler ihr Verfahren, das sie mit Wörtern aus diversen austronesischen Sprachen getestet haben. Diese werden von rund 300 Millionen Menschen im Pazifikraum gesprochen.
"Eine Menge Arbeit am Schreibtisch ersparen"
Als Input nutzten die Forscher mehr als 142.000 Wörter aus 637 Sprachen. Das Wort Vogel heißt beispielsweise auf Fidschianisch manumanu, in der ausgestorbenen Pazeh-Sprache der Insel Taiwan aiam, in der Melanau-Sprache manuk und in der Sprache Abaknon manok. Als gemeinsamen Ursprung dieser Wörter ermittelte der Algorithmus qayam. Auf dasselbe Wort waren Linguisten auf dem herkömmlichen Weg ohne Computerhilfe auch gekommen. 85 Prozent aller per Algorithmus rekonstruierten Ursprungswörter stimmten mit den Begriffen überein, die Linguisten in jahrelanger, mühevoller Arbeit gefunden hatten, schreiben Bouchard-Côté und seine Kollegen.
Die Software nutzt als Input lange Wörterlisten aus Hunderten von Sprachen gekoppelt mit deren Bedeutung. Hinzu kommen Ausspracheregeln und der Sprachstammbaum, der die Verwandtschaft der Sprachen beschreibt. Am Computer werden dann Wahrscheinlichkeiten für mögliche Klangveränderungen von Wörtern, wie sie im Laufe der Sprachevolution geschehen, berechnet. Auf diese Weise kann das Programm aus heutigen Wörtern das wahrscheinliche gemeinsame Ursprungswort der austronesischen Sprachfamilie ableiten.
Mit der Trefferquote von 85 Prozent sind die Forscher noch nicht zufrieden: "Unser System nutzt nur einen Teil der Informationen, die ein Linguist berücksichtigt", sagte Bouchard-Côté der Webseite des Wissenschaftsmagazins "Nature". Die Ungenauigkeiten könnten durch Verbesserungen des Modells aber wahrscheinlich beseitigt werden.
Don Ringe, Linguist von der University of Pennsylvania in Philadelphia sagte: "Mit dieser Methode kann man sich offenbar eine Menge Arbeit am Schreibtisch ersparen." Die bisher erreichte Trefferquote sei aber noch zu niedrig.
hda