Geni.com gehört zu den ganz großen Internetangeboten auf dem Genealogie-Markt. Dahinter steht kein wissenschaftliches Projekt, sondern eine typische Social-Media-Seite: Vor allem Nordamerikaner und Europäer auf der Suche nach ihren familiären Wurzeln füttern Geni mit den Daten ihrer Familien.

Rund elf Millionen aktive Mitglieder trugen so Daten zusammen - derzeit sind dort rund 120 Millionen Datensätze erfasst, die bis zu elf Generationen, also bis ins 17. Jahrhundert zurückreichen. Aus fragmentarischen Informationen von Einzelnen entstand so ein Netzwerk verwandtschaftlicher Beziehungen, das Jahrhunderte und Grenzen überschreitet.

Aber wie verlässlich sind solche Informationen? Wie stehen sie im Verhältnis zu Daten, die mit anderen Methoden erhoben wurden? Spiegeln sie sich darin oder widersprechen sie sich? Und was kann man mit solchen Daten anfangen? Lassen sie sich überhaupt nutzen, um Forschungsfragen der Wissenschaften zu beantworten?

Solche Fragen trieben das interdisziplinäre Forschungsteam um Joanna Kaplanis um: Ihre Antworten veröffentlichte die Gruppe in der aktuellen Ausgabe des Fachmagazins "Science".

Ein Stammbaum unbekannten Ausmaßes

In einem ersten Schritt bereiteten die Forscher die Datenbasis von Geni auf und bereinigten und verdichteten den Datensatz mit mathematischen Methoden zu Stammbäumen. Was dabei zum Vorschein kam: Die verwandtschaftlichen Beziehungen von 86 Millionen Individuen, darunter eine direkte Abstammungslinie, die über zahlreiche Generationen zurückverfolgt und 13 Millionen "Familienmitglieder" umfasst.

Im zweiten Schritt überprüften sie Verlässlichkeit und Nutzbarkeit der Daten, indem sie konkreten Fragen nachgingen.

Zum Beispiel der, was es tatsächlich bedeutet, ein Gen zu tragen, das mit Langlebigkeit verbunden wird. Genetiker glauben, dass sich so ein genetisches Privileg sehr deutlich in der tatsächlichen Lebensdauer auswirke. Die im Geni-Datensatz erfassten Lebensdaten, deren Verlässlichkeit die Forscher auch durch den Vergleich mit einem offiziellen Sterberegister abglichen, sprach eine andere Sprache: Knappe fünf Jahre verlängert eine günstige genetische Ausstattung demnach das Leben.

Ein Irrglaube endet

Weit weniger als gedacht, und daraus könne man Schlüsse ziehen, meint Studien-Ko-Autor Yaniv Erlich: "Andere Studien haben gezeigt, dass Rauchen zehn Jahre Lebenszeit kosten kann. Das heißt, dass Lebensentscheidungen und Lebensstile sich für uns weit stärker auswirken als unsere Gene."

In den Daten zeigen sich aber auch zahlreiche andere Informationen. Sie dokumentieren Migrationsbewegungen genauso wie die erhöhte Sterblichkeit unter Männern zur Zeit der Weltkriege. Mitunter widerlegen sie Erwartungen und liefern neue Erkenntnisse: So entkräften die Geni-Daten die These, dass es das Aufkommen von Motorfahrzeugen gewesen sei, das zu einer stärkeren Durchmischung unseres Genoms geführt habe. Die Erwartung klang ja logisch: Mit vergrößertem Aktionsradius müsse die genetische Durchmischung wachsen.

Interessante Erkenntnisse über das Heiraten in der Familie

Tatsächlich fanden die Forscher, dass sich die Größe des durchschnittlichen Umkreises, in dem Menschen ihre Lebenspartner fanden, in der Zeit zwischen 1800 und 1850 deutlich von circa 8 auf 19 Kilometer vergrößert hatte.

Das aber hatte nicht den erwarteten Effekt - im Gegenteil: Sie heirateten nach wie vor vorzugsweise entfernte Verwandte. Mit steigender Entfernung stieg sogar die Wahrscheinlichkeit, dass es zur Hochzeit von Cousins und Cousinen vierten Grades kam. Den größeren Aktionsradius nutzte man offenbar, um die erweiterte Familie zusammen zu halten.

Kaplanis und Partner leiten daraus die These ab, dass die messbare Abnahme genetischer Verwandtschaft zwischen Ehepartnern, die heute im Westen festzustellen ist, wohl eher mit einer Veränderung sozialer Akzeptanz einherging.

Im Klartext: Mitte des 19. Jahrhunderts hörte es auf, normal zu sein, einen Cousin oder eine Cousine zu heiraten. Man heiratete stattdessen zunehmend Familien-fern, also "fremd": Dem Genom bekommt das gut.

Was soll das alles?

Hauptziel der Kaplanis-Studie waren Test und Nachweis, dass solche über soziale Plattformen von zahlreichen Menschen zusammengetragenen Datenbasen überhaupt wissenschaftlich nutzbar sind.

Bisher, sagen die Forscher, sei das Zusammentragen von großen Stammbäumen, die ganze Bevölkerungen erfassen, extrem arbeitsaufwendig und kompliziert. Der Geni-Datensatz dokumentiere - zumindest für Nordamerika - dass mit den Mitteln des Social Web valide Datensätze über die Bevölkerungsentwicklung mehrerer Jahrhunderte entstehen können.

Die Millionen von Hobby-Ahnenforschern, die Geni über Jahre gefüttert haben, wird das freuen: Ihre familiäre Datensuche hat damit eine enorme Aufwertung erfahren.