Foto: DER SPIEGEL
Matthias Kremp

Text-zu-Bild-Generator für Office Höhere Mathematik in schön

Matthias Kremp
Ein Netzwelt-Newsletter von Matthias Kremp
Mit einer neuen App soll der KI-Bildgenerator Dall-E 2 in Microsofts Bürosoftware einziehen. Das klingt verlockend, selbst kreativer wird man dadurch aber nicht.

Liebe Leserin, lieber Leser,

kennen Sie Dall-E? Oder vielmehr, Dall-E 2? Falls nicht: Dall-E 2 ist ein sogenannter Bildgenerator, der auf künstlicher Intelligenz (KI) basiert und ungefähr so funktioniert: Man gibt einen Text oder ein paar Stichworte ein, die ungefähr beschreiben, was für ein Bild man erzeugen will. Ich habe der KI heute Morgen beispielsweise diese Aufgabe gestellt: »Eine Tasse Tee, die auf einem Gitarrenverstärker steht.« Eines der vier Ergebnisse, die mir das System Sekunden später lieferte, sehen Sie hier:

Mit Dall-E 2 erzeugtes Bild: Eine Tasse Tee auf einem Gitarrenverstärker

Mit Dall-E 2 erzeugtes Bild: Eine Tasse Tee auf einem Gitarrenverstärker

Foto: Dall-E

Gar nicht so schlecht, nicht wahr? Man sieht jedenfalls, dass sogar ich fotorealistisch wirkende Bilder erzeugen kann. Zumindest, wenn ich von einer KI unterstützt werde. Möglich ist das alles, weil der Forschungsverband OpenAI sein System Ende September für jedermann und -frau freigegeben hat. Mich wunderte dabei vor allem die Geschwindigkeit, mit der das geschah. Schließlich war der KI-Bildgenerator der Öffentlichkeit erst im April präsentiert worden. Anfangs bekamen nur ausgewählte Künstlerinnen und Kreative einen Zugang, später konnte man sich als Betatester bewerben, musste aber begründen, warum man ausgewählt werden sollte. Doch schon bald darauf spielten nach der Freigabe anderthalb Millionen Menschen mit dem System herum. Mit ihren Texteingaben erzeugten sie zwei Millionen Bilder pro Tag.

Jetzt, nur wenige Monate nach seiner ersten öffentlichen Erwähnung, macht Dall-E 2 den nächsten Sprung hin zu mehr Bekanntheit: Das System wird in Microsofts Bürosoftware Microsoft 365 (früher hieß sie Office 365) eingebunden. Das gab der Konzern am Mittwoch bekannt. Die Software wird Microsoft Designer genannt und basiert, so Microsoft-Manager Liat Ben-Zur, auf KI-Technologie, vor allem auf Dall-E 2.

Einladungskarten mit künstlicher Intelligenz: Möglich macht das ein neues Tool namens Microsoft Designer

Einladungskarten mit künstlicher Intelligenz: Möglich macht das ein neues Tool namens Microsoft Designer

Foto: Microsoft

Microsoft kann so etwas machen, weil der Konzern im Jahr 2019 mit einem Investment von einer Milliarde Dollar bei OpenAI eingestiegen ist . Im folgenden Jahr sicherte sich das Unternehmen eine exklusive Lizenz für GPT-3, die, wie es mein Kollege Patrick Beuth ausdrückte, »eloquenteste KI der Welt«. So wie heute Dall-E 2 damit verblüfft, welch wunderbare Kunstwerke es aus Texten erschaffen kann, ist GPT-3 überraschend gut darin, Texte zu schreiben, die, so Patrick, »Sie und ich für das Werk eines Menschen halten würden«.

»Überlassen Sie der KI die Schwerstarbeit«

So ähnlich soll es nun wohl auch mit der Integration von Dall-E 2 in Microsofts Designer-App werden. Mit »minimalem Aufwand« soll man mit der neuen Software »blitzschnell Posts für soziale Medien, Einladungen, digitale Postkarten, Grafiken und mehr« erzeugen können. Wie auf der Dall-E-2-Website gibt man dafür einen Text ein, der beschreibt, was man produzieren möchte. Oder wie Ben-Zur es sagt: »Beginnen Sie mit einer Idee und überlassen Sie der KI die Schwerstarbeit.«

Was darf es sein? So wird das Eingabefeld aussehen

Was darf es sein? So wird das Eingabefeld aussehen

Foto: Microsoft

Und Schwerstarbeit wird es sein, was die KI da im Hintergrund leisten muss. Während Nutzerinnen und Nutzer an ihren Computern Idee in den Designer tippen, rattern irgendwo auf dem Planeten in einem Cloud-Rechenzentrum Hochleistungsrechner los, um deren Wünsche umzusetzen.

Was mich schmunzeln lässt: Die neue App ist laut Microsoft ausgerechnet aus PowerPoint hervorgegangen, einem Tool, dessen Erwähnung bei mir eine regelrechte »PowerPoint-Angst« auslöst, weil ich schon so viele unsäglich langweilige Präsentationen gesehen habe. Um genau das zu verhindern, soll der Designer in Powerpoint nun spannende und zum Inhalt des Vortrags passende grafische Optionen anbieten. Und ebenso soll er Einladungskarten und Social-Media-Posts hervorbringen, die kreativ wirken sollen, die aber, wie es unser Kolumnist Christian Stöcker mal formulierte, letztlich »nur der Output unfassbar komplexer, mit gigantischen Mengen Material trainierter statistischer Modelle« sind. Höhere Mathematik in schick sozusagen. Ich kann es kaum erwarten zu sehen, was für irre Kreationen aus diesem System in Zukunft das Web fluten werden. Vielleicht steht uns sogar die Ablösung der ohnehin kaum noch populären Gifs bevor.

Doch ganz so schnell wird das nicht gehen, denn noch ist der Microsoft Designer kein fertiges Produkt. Wer es ausprobieren möchte, kann sich bei Microsoft für eine kostenlose Vorschauversion mit begrenztem Funktionsumfang anmelden. Wenn die Entwickler des Konzerns das System als fertig erachten, soll es sowohl als kostenlose Version als auch in einer »Premium«-Fassung für Abonnenten veröffentlicht werden. Dass diese Fassung auch so rasch erscheinen wird, wie es Dall-2 von der Präsentation zur allgemeinen Freischaltung geschafft hat, wage ich zu bezweifeln.

Unsere aktuellen Netzwelt-Lesetipps für SPIEGEL.de

  • »Was ist dran an den Vorwürfen gegen BSI-Chef Schönbohm?«  (vier Leseminuten)
    Muss der Präsident des Bundesamts für Sicherheit in der Informationstechnik gehen, weil TV-Entertainer Jan Böhmermann ihn als Russland-nahen »Cyberclown« dargestellt hat? Wir haben uns die bisherige Beweislage näher angesehen.

  • »Das ändert sich durch die USB-C-Pflicht« (fünf Leseminuten)
    Neue Smartphones, Bluetooth-Boxen und Laptops werden in der EU künftig wohl einen USB-C-Anschluss haben müssen. Was bedeutet das für Apples iPhones und fürs kabellose Laden? Die Übersicht von Jörg Breithut.

  • »Eine Uhr für die nächsten 48 Stunden« (fünf Leseminuten)
    Stattliche 999 Euro kostet Apples neue Smartwatch. Ich habe den Armbandcomputer für Ausdauersportler ausführlich getestet und festgestellt, dass er nicht nur sehr anders ist als andere Apple-Uhren, sondern auch von Sofasportlern geliebt werden wird.

Fremdlinks: Drei Tipps aus anderen Medien

  • »Blackouts gegen die Freiheit«  (sechs Leseminuten)
    Ein visuell eindrucksvoller, sehr informativer Artikel des »Tagesspiegel« über die Internetblockaden in Iran.

  • »Die Revolution der Natrium-Akkus wird absehbar«  (15 Leseminuten)
    Vom Westen weitgehend unbeachtet wird in China an einer neuen Akkutechnik gearbeitet, die teure Lithium-Ionen-Akkus ablösen könnte, schreibt »Golem« und wittert einen Umbruch.

  • »#PortfolioDay«  (so viele Leseminuten, wie Sie aushalten)
    Den heutigen Mittwoch hat Twitter zum Tag für Künstlerinnen und Künstler ausgerufen, die ihre Werke der Welt präsentieren wollen. Wer Mangas, Fantasy und Kitsch mag, wird sich eine Sehnenscheidenentzündung scrollen.

Kommen Sie gut durch den Rest der Woche.

Matthias Kremp

Die Wiedergabe wurde unterbrochen.