KI bewertet Uni-Noten Wie gut ist Ihr Hochschulabschluss?

KI reicht mittlerweile in fast alle Bereiche des Lebens – auch ins Recruiting
Foto: Henrik Sorensen / Digital Vision / Getty ImagesTeure Anzüge, dicke Uhren, viele Reisen, na ja, soweit Corona es zulässt, dazu ein Einstiegsgehalt jenseits des 50.000-Euro-Äquators – viele Studierende träumen davon, nach der Uni direkt als Unternehmensberater einzusteigen. Menschen wie Stephan Butscher können das am Füllstand ihres E-Mail-Postfachs ablesen: Er ist Chief Human Resources Officer bei der Beratungsfirma Simon Kucher & Partners mit weltweit 1400 Mitarbeitenden. Jedes Jahr bekomme er mehrere Tausend Bewerbungen, erzählt Butscher, viel zu viele für zu wenige Stellen.
Grundsätzlich kämen für ihn Absolventen vieler Studiengänge infrage, »im Grunde alle, in denen irgendwo Wirtschaft oder analytisches Arbeiten vorkommt«: BWL, VWL, Wirtschaftsingenieurwesen oder Wirtschaftsinformatik – aber auch Naturwissenschaftler und Psychologinnen würden inzwischen immer öfter genommen. Schwer, da den Überblick zu behalten: Wer ist nun wie gut, wie renommiert ist die Hochschule in dem Studienfach? Ist ein Notendurchschnitt von 2,4 an einer besonders guten Uni besser als eine 1 an einer B-Uni? Oder ist es gerade umgekehrt?
Philipp Seegers, Gründer von CASE
Seit drei Jahren arbeitet Butscher deshalb mit dem sogenannten CASE-Score. Ein nüchterner Prozentwert, der angibt, wie der oder die Absolventin im Vergleich zur Konkurrenz abschneidet: Ein CASE-Score von 14 bedeutet, dass die Bewerberin in ihrem Fach zu den 14 besten Prozent ihres Jahrgangs gehört, deutschlandweit. Also: je niedriger, desto besser.
Welche Rolle spielt künstliche Intelligenz schon jetzt, wenn es darum geht, Jobs zu finden, Kandidaten auszuwählen oder Bewerbungsgespräche zu führen? In einem Themenschwerpunkt haben Journalisten und Coder vom SPIEGEL und dem Bayerischen Rundfunk diese Fragen recherchiert und Chancen und Risiken der neuen Technik beleuchtet. Begleitet wurde das Team von Applied AI vom Unternehmertum (TU München).
Das Team: Lennart Bedford-Strohm, Guido Grigat, Matthias Kremp, Katharina Kulzer, Chris Kurt, Christiane Miethge, Jens Radü, Patricia Stuchlik, Natascha Vostrovsky, Alexander Waldmann
Bewerben mit KI: Die Boss-Maschine – abrufbar in der BR-Mediathek
Entwickelt hat den CASE-Score das Bonner Start-up Candidate Select. Als Datengrundlage dienen Informationen zur Notenverteilung in den verschiedenen Studiengängen der einzelnen deutschen Hochschulen, zurückreichend bis 2004. Diese kombiniert Candidate Select mit den Ergebnissen der Befragungsreihe »Fachkraft 2030« unter Schirmherrschaft der Maastricht University: Seit 2012 haben mehr als 300.000 Studierende an den IQ- und Persönlichkeitstests teilgenommen.
Ein Algorithmus lässt Emotionen außen vor
»Bei vielen tausend verschiedenen Studiengängen ist es unmöglich für einen Menschen, all die wichtigen Kontextinformationen wie Notengebung oder Qualität einigermaßen objektiv zu bewerten«, erklärt Philipp Seegers. Er hat CASE 2016 zusammen mit seinem Partner Jan Bergerhoff gegründet.
Bei der Analyse der Daten setzen die beiden deshalb auf Algorithmen und künstliche Intelligenz. »Unsere Entscheidungen sind von Emotionen geprägt, die schwanken können. Ein Algorithmus macht immer das Gleiche. Dadurch werden die Resultate besser, aber auch reproduzierbar und fair«, sagt Seegers. Konkret bedeutet das: Algorithmen erkennen und sortieren Hochschulen, Studienfächer und Abschlüsse; außerdem optimiert eine KI das CASE-Scoring. »Ziel ist es, dass das Ergebnis unseres Scores im Durchschnitt konstant sein sollte«, erklärt Seegers. Dabei werden nicht Hochschulen in ein Ranking gegossen, sondern konkrete Studienprogramme.
Ein Beispiel: Eine BWL-Studentin mit einer 2,0 im Bachelor an der Universität Rostock gehörte 2013 zu den besten zehn Prozent ihres Jahrgangs. Ganz anders an der Hochschule Konstanz: Mit einem Masterabschluss von 2,0 im Jahr 2016 wäre die Beispielstudentin klar unterdurchschnittlich; 73 Prozent der Studierenden dort hatten eine bessere Note. Der CASE-Score einer 2,0 im Rostocker Bachelor ist also deutlich besser als der einer 2,0 im Konstanzer Master.
Klingt kompliziert? Absolut. Deshalb probieren Sie es selbst einmal aus: In der folgenden Infografik, für die CASE die Daten zur Verfügung gestellt hat, können Sie BWL-Studiengänge an verschiedenen deutschen Hochschulen vergleichen. Angenommene Abschlussnote: 2,0. Im unteren Drittel wird Ihnen je nach Studiengang und Abschlussjahrgang der CASE-Score angezeigt, eingebettet in die Gesamtverteilung. Also los:
Ist das nun gerecht? Die 1,0 im Studienfach X abwerten, nur weil Universität Y den Daten nach weniger streng benotet? Was kann der Studierende dafür? »Das ist alles sehr sensibel und dessen sind wir uns natürlich bewusst«, erklärt Gründer Seegers. Deshalb sei ihm und seinem Team besonders wichtig, saubere Daten zu sammeln, die das System nicht irreleiten, nur weil es in der einen Tabelle »Studium« heißt, in der anderen vielleicht »Hochschulausbildung«, aber das Gleiche gemeint ist. Die KI sei da nur ein Werkzeug von vielen – aber eben unverzichtbar, wenn es um Millionen Informationshäppchen geht, die es zu verarbeiten gilt. »In vielen Anwendungen bedeuten KI-Modelle eine wirkliche Revolution, weil viel bessere Vorhersagen möglich sind.«

Katharina Zweig
Foto: Felix SchmittAber es gibt auch die Gefahr des Overfittings: Das Modell passt hervorragend – aber eben nur für eine bestimmte Stichprobe von Studienabschlüssen. Aber nur im Einzelfall, nicht gleich allgemein.
Katharina Zweig, Leiterin des Algorithm Accountability Lab
Vor zu ausuferndem Vertrauen in künstliche Intelligenz warnt auch Bioinformatikerin Katharina Zweig, die an der Technischen Universität Kaiserslautern das Algorithm Accountability Lab leitet und zur Nachvollziehbarkeit und Regulierung von künstlicher Intelligenz forscht: »Es gibt keinen Nachweis dafür, dass die Technologie es schaffen kann, aus den angeblich vorurteilsbehafteten menschlichen Entscheidungen nur das Gute, Richtige herauszuziehen.« Sie fordert deshalb mehr unabhängige Evaluationen dieser Systeme, bevor man sie einsetzt. Denn KI verbreitet sich, in immer mehr Branchen, immer mehr Funktionen.
CASE-Score hilft bei der Auswahl
Immerhin, auf die Frage, ob der CASE-Score tatsächlich misst, was er soll – nämlich die Qualität von Abschlüssen und damit auch die der Ausbildung von Absolventen – hat Stephan Butscher von Simon Kucher & Partners eine knappe Antwort: ja. »Der CASE-Score ist tatsächlich ein guter Indikator für uns, um Bewerberinnen und Bewerber zu finden, die gut zu uns passen«, sagt der Personaler. Zu Jobinterviews seien in einer umfangreichen Pilotphase auch Kandidaten mit schlechtem CASE-Score eingeladen worden – die hätten aber nach den Gesprächen deutlich seltener ein Angebot erhalten.
Und auch die Karrieren der Junior-Beraterinnen und -Berater, die auf Grundlage ihres guten CASE-Scores eingestellt wurden, seien über die Jahre signifikant besser verlaufen: vom Consultant zum Senior Consultant zum Manager, und das im Eiltempo. »Mitarbeiter, die frisch von der Uni kommen, werden im Schnitt einmal pro Jahr befördert. Bei Top-Performern liegt der Wert eher bei 0,8 Jahren. Und unter diesen Top-Performern sind besonders viele, die auch einen sehr hohen CASE-Score haben«, berichtet Butscher.
Allerdings ist der CASE-Score natürlich nicht das einzige Kriterium, auf das es ankommt. Und dass bald eine KI den gesamten Einstellungsprozess dirigiert, kann sich Butscher gerade in seiner Branche für die nahe Zukunft nicht vorstellen: »Wir suchen Topleute mit sehr vielen unterschiedlichen Fähigkeiten und Eigenschaften. Ohne persönlichen Kontakt und persönliche Gespräche, und zwar auch ziemlich intensive, werden wir da nicht auskommen.«