Xayn aus Berlin Diese Suchmaschine trainiert jeder selbst

Xayn soll eine privatsphärefreundliche Alternative zu Google sein. Die künstliche Intelligenz der deutschen Suchmaschine wird nach dem Tinder-Prinzip individuell geschult. Unsere Autorin hat sie ausprobiert.
Xayn: Internetsuche, die Mitarbeit erfordert

Xayn: Internetsuche, die Mitarbeit erfordert

Foto: Xain

Kann die Internetsuche so einfach werden wie die Partnersuche im Netz? Zumindest kann sie ähnlich aussehen. Das Berliner Start-up Xain hat eine Suchmaschine namens Xayn  auf den Weg gebracht, die es Nutzerinnen und Nutzern ermöglichen soll, ihre Internetsuche zu personalisieren, indem sie nach Tinder-Art Passendes nach rechts und Unpassendes nach links wischen, ohne dass in irgendeiner Cloud irgendwelche personenbezogenen Daten über sie gesammelt werden.

Das klingt zunächst schwer vorstellbar, schließlich ist die Personalisierung von Suchergebnissen nur möglich, wenn wir Informationen über uns und unsere Interessen preisgeben. Das ist einer der Gründe, aus denen manche Google-Alternativen selten treffsicher das finden, wonach wir suchen.

Viele Programmierer beispielsweise kennen dieses Problem: Sie suchen mit Google nach einer bestimmten Programmiersprache wie Ruby und erhalten vor allem Suchergebnisse, die damit nichts zu tun haben – beispielsweise mehr oder minder berühmte Persönlichkeiten namens Ruby oder den Stones-Song »Ruby Tuesday«.

Dagegen hilft nur mühsames Überzeugen der künstlichen Intelligenz (KI) hinter Google, die aus Interaktionen lernt. Doch selbst hier ist die Personalisierung über die Jahre abgeschwächt worden . Hinzu kommt, dass kaum zu überblicken ist, welche Interaktion zu welchem Effekt führt, und dass Google davon lebt, möglichst viel über seine Nutzer zu wissen und dieses Wissen zu monetarisieren, was manche Menschen eben stört.

Passende Ergebnisse nach rechts wischen, den Rest nach links

»Mich hat das persönlich immer geärgert, dass es diesen scheinbaren Trade-off gibt zwischen Usability und Datenschutz«, sagt Leif Lundbæk, Mitgründer von Xain,  »ich leite ein Privacy-Start-Up, aber nutze Google, weil ich keine Zeit habe, ewig zu suchen.« Zusammen mit Kollegen hat er deshalb die Suchmaschine entwickelt, die am heutigen Dienstag für die Öffentlichkeit zugänglich gemacht wird und nach Einschätzung der Gründer die Internetsuche nichts weniger als revolutionieren soll. »Immer wieder sagen Politiker, dass wir in Europa von unserem hohen Datenschutz-Ross runterkommen müssen, wenn wir in Sachen künstlicher Intelligenz anschlussfähig bleiben wollen«, sagt  Lundbæk, »dabei lässt sich das durchaus vereinbaren.«

Die Daten der Nutzerinnen und Nutzer bleiben laut Lundbæk auf deren Geräten, aktuell in der App auf dem Mobiltelefon. Eine Browser-Variante ist geplant, aber noch nicht verfügbar. Die Xayn-KI lernt dann aus diesen Daten auf dem Gerät und passt Suchempfehlungen an. »Wir bringen die KI zu den Daten und nicht die Daten zur KI«, erklärt Lundbæk. Dafür habe das Start-up in aufwendiger Kleinarbeit Modelle angepasst , damit sie auf mobilen Geräten überhaupt funktionieren können. »Googles Modell hat eine Größe von zehn Gigabyte, Google hat dafür einst eine eigene Hardware dafür entwickelt: GPUs«, sagt Lundbæk. Das Modell, das Xayn derzeit verwendet, umfasse lediglich 50 Megabyte.

Die KI im Hintergrund, das System des maschinellen Lernens, besteht aus mehreren Modellen: Das erste erkennt den Kontext eines Artikels. Wer die App öffnet und einen Suchbegriff eingibt, bekommt – wie erste Versuche zeigen – Suchergebnisse vergleichbar mit denen von anderen Suchmaschinen wie etwa DuckDuckGo. Doch dann können Nutzerinnen und Nutzer anfangen, »ihre« KI zu trainieren, indem sie Suchergebnisse nach links schieben, wenn sie nicht passen, oder nach rechts, wenn sie das treffen, wonach sie gesucht haben. Daraus versucht das System, den Kontext zu verstehen, für den sich jemand interessiert.

Das System lernt auch, welche Websites für Nutzerinnen und Nutzer interessant sind, zudem orientiert es sich an der Tageszeit. Schließlich kann es sein, dass jemand beruflich andere Interessen hat als abends auf dem Sofa. Das alles muss zudem schnell gehen, betont Lundbæk: »Keiner will ewig swipen, nach zehn bis 20 Interaktionen muss etwas passieren.«

Trotzdem wird immer auch ein wenig das empfohlen, von dem das System nicht vermutet, dass es die Nutzerin oder der Nutzer gerade sucht. »Das ist wichtig, denn eine KI kann sich ja auch irren«, sagt Lundbæk. Schließlich basiert sie auf Wahrscheinlichkeiten und der Einschätzung, wie sicher sie sich ist, richtig zu liegen. Außerdem kann man die KI auch abschalten und ganz oder teilweise zurücksetzen.

Porsche hat den Begriff Cayenne gekapert

Wie gut funktioniert die neue Suchmaschine nun tatsächlich? Löst sie die Probleme, die ihre Entwickler vorgeben zu lösen? Um die App, die mir von Xain zu Testzwecken vorab zur Verfügung gestellt wurde, zu testen, habe ich mehrfach besetzte Begriffe gesucht.

Die Programmiersprache »Ruby«, die Apache Software Foundation sowie das Java Framework »Apache Cayenne« zum Beispiel scheinen typische Suchprobleme zu sein. Ein Test auf anderen Suchmaschinen liefert für Ruby allerlei Persönlichkeiten, Hotels und Edelsteine sowie die tatsächlich gesuchte Programmiersprache. Apache ist ebenfalls nicht eindeutig (ein Rapper, ein indigener Stamm in den USA; ein Kampfhubschrauber), und Cayenne hat vor allem mit Porsche zu tun. Kann ich die KI von Xayn also darauf trainieren, dass ich mich für Programmieren interessiere, anstatt für Persönlichkeiten, Rapper und Autos?

Vor dem Training zeigt mir Xayn beim Suchbegriff »Apache« ganz oben den Rap-Musiker Apache  207, dann folgen eine Reihe von Software-Ergebnissen sowie jede Menge Fotos eines Kampfhubschraubers. Ich swipe den Rapper und die Hubschrauber nach links, drei Artikel insgesamt. Und vier Hubschrauber-Bilder, drei Musikvideos und zwei Newsartikel über den Rapper. Jetzt geht es in meinen Suchergebnissen nur noch um Software. Erst an Stelle 24 kommen die Ureinwohner.

Doch jetzt nutze ich erst mal aus, dass die KI hoffentlich gelernt hat, dass ich mich für Programmieren interessiere. Ich gebe also »Cayenne« ein – und ernte Porsche pur. Und »Ruby«? Der erste Treffer ist die Übersetzung des Stones-Songs »Ruby Tuesday«. Doch schon der zweite Treffer ist ein Github-Link zu Ruby . Dann kommt eine bunte Mischung aus Programmiersprache, Tanzklubs, Ruby Radio, einem Hotel und Menschen, die Ruby heißen. Ich wische Github nach rechts, fünf andere Treffer nach links. Die Namen tauchen weiterhin auf, eine Lotterie, ein Heilpraktiker. Ich wische alle nach links.

Nun ist mein Suchergebnis dominiert von der Programmiersprache. Gegen Porsche komme ich trotzdem nicht an, wenn ich nach Cayenne suche, auch nicht nach weiteren Trainingsrunden. Der Autobauer hat den Begriff Cayenne im Netz gekapert, ein paar Programmierer kommen nicht dagegen an.

Ich kann mein Training auch rückgängig machen. Bei jedem einzelnen Schritt kann ich mich umentscheiden und auf einen Button tippen, auf dem steht »Would you like to undo the last action?« (Eine deutschsprachige Version ist geplant). Und ich kann meine Such- und Trainingshistorie löschen. Das tue ich als Nächstes, denn ich will noch etwas testen: Was, wenn sich meine Interessen ändern und ich keinen Apache-Coder-Content mehr sehen möchte, sondern die Menschen in Nordamerika, die ich zuvor erfolgreich aus meinem Blickfeld trainiert habe?

Xayn löst nicht alle Probleme heutiger Suchmaschinen

Doch nach dem Zurücksetzen zeigt sich: So wie Porsche die Programmierer beim Begriff Cayenne in den Bodensatz des Internets gedrängt hat, so haben die Open-Source-Anhänger den Apache-Stamm beinahe verschwinden lassen. Ich wische fünf Minuten lang Software-Ergebnisse nach links und drei ganz weit hinten erscheinende Suchergebnisse über den indigenen Stamm nach rechts. Danach bietet mir Xayn neben den Artikeln, die ich bereits markiert habe, immerhin einen neuen über den nordamerikanischen Stamm an. Ansonsten aber Coder-Content.

Das ist trotzdem deutlich besser als eine Suche mit der Google-Alternative Startpage, auf der ich drei komplette Seiten ausschließlich Programmier-Links bekomme, bevor auf der vierten Seite ein Pizzaservice und der Rapper Apache 207 jeweils ein Mal auftauchen. Google hingegen traut mir ein etwas breiteres Interesse zu und schlägt mir schon auf der zweiten Seite auch Rapmusik vor, obwohl ich nie nach Musik google.

Fazit: Die Idee, Nutzerinnen und Nutzer die KI hinter ihrer Suchmaschine selbst trainieren zu lassen, ist gut. Dennoch kämpft Xayn mit den bekannten Problemen des maschinellen Lernens, insbesondere mit einer gewissen Intransparenz algorithmischer Lernwege, die sich nicht so einfach lösen lassen. Der Versuch zeigt: Suchergebnisse lassen sich zumindest ein Stück weit anpassen. Was sich aber offenbar nicht lösen lässt, ist das Problem des »Großes wird im Netz größer und Kleines wird kleiner« – zumindest nicht, wenn Groß und Klein schon weit auseinander liegen. Zudem muss Xain ein anderes Geschäftsmodell zum Laufen bringen als anzeigenfinanzierte Dienste wie Google: Ein kostenpflichtige Pro-Variante von Xayn soll Behörden und Unternehmen künftig helfen, ihre eigenen Dokumente zu durchsuchen.

Die Wiedergabe wurde unterbrochen.