Probleme mit automatischer Umwandlung Forscher benennen menschliche Gene für Microsoft Excel um

Ein Gremium der Human Genome Organisation hat beschlossen, mehr als zwei Dutzend menschlichen Genen neue Namen zu geben. Der Grund dafür schlummert in Microsofts Tabellenkalkulation.
Speicherplatz für Erbinformationen: Vom Computer generierte Darstellung einer DNA-Doppelhelix

Speicherplatz für Erbinformationen: Vom Computer generierte Darstellung einer DNA-Doppelhelix

Foto: imago/ Science Photo Library

In der Genforschung hat man ganz offensichtlich viel mit Zahlen und Daten zu tun. Da ist es naheliegend, dass viele Forscher die Software Excel benutzen, um diese Daten zu verwalten und auszuwerten. Doch eben wegen dieser ubiquitären Vorliebe für Microsofts Tabellenkalkulation mussten jetzt 27 menschliche Gene umbenannt werden.

Das Problem liegt in einer Eigenheit der Microsoft-Software: Sie versucht, Dateneingaben zu interpretieren. Wenn man also beispielsweise in ein Datenfeld einträgt "3NOV20", macht Excel daraus automatisch das Datum 03.11.2020, den Tag der Präsidentschaftswahl in den USA. Während das im Einzelfall noch auffallen mag, sind solche Änderungen schwer nachzuvollziehen, wenn man Dutzende oder Hunderte Datensätze zugleich in die Software importiert und nur einige von Excel verändert werden.

Genau das aber geschieht bei der Genforschung offenbar regelmäßig, wie eine Analyse schon 2016 aufzeigte . Ein Fünftel der damals untersuchten wissenschaftlichen Veröffentlichungen enthielten Fehler, die auf automatische Datenumwandlungen durch Excel zurückzuführen waren und von den Autoren nicht bemerkt worden waren.

Änderung der Richtlinien

Nun berichtet das Tech-Magazin "The Verge", dass das HUGO Gene Nomenclature Committee (HGNC), das zur Human Genome Organisation  gehört, derartige Fehler in Zukunft ausschließen will, indem es diverse Gene so umbenennt, dass die Bezeichnungen Excel-kompatibel werden, beispielsweise also nicht automatisch in Datumsangaben umgewandelt werden. Genau das sei regelmäßig dem Gen mit der Bezeichnung MARCH1 (Membrane Associated Ring-CH-Type Finger 1 ) widerfahren, das Excel ungefragt in die US-Datumsangabe 1-MAR, also 1. März, geändert hat.

In der diese Woche veröffentlichten aktualisierten Richtlinie zur Benennung von Genen  erklärt das HGNC, dass Gen-Symbole, "die sich auf die Handhabung und den Abruf von Daten auswirken", geändert würden. Konkret seien damit alle Bezeichnungen gemeint, "die in Microsoft Excel automatisch in Daten konvertiert wurden". MARCH1 heißt deshalb nun MARCHF1, SEPT1 wurde in SEPTIN1 umbenannt.

Aufklärung verpuffte

Die Maßnahme ist offenbar der letzte Ausweg aus dem Dilemma, den das Gremium gesehen hat. Zuvor hatte das HGNC sich bemüht, mit einem YouTube-Video  auf das Problem hinzuweisen und gleichzeitig zu erklären, wie man die automatische Umwandlung von Genbezeichnungen in Kalenderdaten abschalten kann.

Sonderlich erfolgreich war der Versuch allerdings nicht. Seit der Veröffentlichung im März 2019 ist der Clip bis zum Freitagvormittag erst 371 mal aufgerufen worden. Man kann mutmaßen, dass eine Vielzahl dieser Klicks darauf zurückzuführen sind, dass das Video in dem Artikel von "The Verge" verlinkt ist. Immerhin, zumindest ein Forscher hat es sich angesehen und bedankt sich in der Kommentarspalte brav für die "wertvolle Anleitung".

Ein Problem, so alt wie Excel

Das ebenso ambitionierte wie erfolglose Video zeigt das Kernproblem, mit dem die Wissenschaftler zu kämpfen haben: Jeder glaubt, Excel zu beherrschen, aber kaum jemand beherrscht es wirklich. Microsofts Tabellenkalkulation wurde 1985 erstmals für Apples damals neuen Macintosh veröffentlicht und kam zwei Jahre später als Windows-Version heraus.

Seither ist die Software zwar mehrfach verändert und um neue Funktionen erweitert worden, in den Grundzügen aber ist sie gleich geblieben. Selbst wer noch mit dem Excel-Vorgänger Multiplan unter MS-DOS gearbeitet hat, hätte kein Problem damit, die aktuelle Excel-Version zu benutzen, zumindest in den Grundzügen: Tabellen öffnen, Daten und Formeln eintragen, Ergebnisse ablesen.

So einfach lassen sich Eingaben vor Veränderungen durch Excel schützen

So einfach lassen sich Eingaben vor Veränderungen durch Excel schützen

Foto: Matthias Kremp/ DER SPIEGEL

Die Möglichkeit, der Software die automatische Datenumwandlung abzugewöhnen, indem man ein Datenfeld in Excel als Textfeld definiert, dessen Inhalt von Excel nicht verändert wird, scheint hingegen wenig bekannt zu sein. Dabei ist es einfach: Man markiert mit der Maus das oder die Datenfelder, die man vor Veränderungen schützen will, ruft per Rechtsklick das Kontextmenü auf und wählt dort den Eintrag Zellen formatieren. In dem Fenster, das sich nun öffnet, klickt man auf Text und das war es auch schon. In Microsofts Erklärung zu dieser Funktion heißt es treffend: "Der Zellinhalt wird genauso angezeigt wie eingegeben".

Die Wiedergabe wurde unterbrochen.