Künstliche Intelligenz Diese Software verwandelt Worte in Bilder

Eine neue Software erlaubt es, mit der Tastatur Bilder zu erschaffen. Nutzer müssen "WordsEye" nur beschreiben, was sie sehen wollen. Die Software macht daraus dreidimensionale Szenen - mal amüsant, mal unheimlich.

Farbenfrohes Beispiel: "Der rosa Elefant ist auf dem Regenbogen"
wordseye.com

Farbenfrohes Beispiel: "Der rosa Elefant ist auf dem Regenbogen"

Von


Ein rosa Elefant spaziert über einen Regenbogen - wahrscheinlich kann sich jeder zu diesem Satz ein Bild vorstellen. Dieses Bild zu zeichnen, ist dagegen deutlich schwerer. Die neue Browser-Anwendung "WordsEye" kann aber genau das. Aus schlichten Vorgaben wie "ein rosa Elefant auf einem Regenbogen" erschafft "WordsEye" innerhalb von Sekunden eine 3D-Animation.

"Type a picture" lautet der Slogan des Onlineangebots: Tippe ein Bild. Nutzer müssen einfach die Browser-Anwendung öffnen und aufschreiben, was die Software animieren soll - zum Beispiel einen Elefanten, einen Baum, ein Ufo. "WordsEye" kennt den Entwicklern zufolge mehrere Tausend Objekte und versteht etwa 20.000 Wörter, mit denen sich ihre Position, Größe, Ausrichtung und Farbe bestimmen lassen.

Die Browser-Anwendung "WordsEye" verwandelt Worte in 3D-Bilder. Für dieses farbenfrohe Beispiel haben wir der Software folgende Beschreibung auf Englisch vorgelegt: "Der rosa Elefant ist auf dem Regenbogen. Der Elefant schaut nach rechts. Der Boden ist durchsichtig." Die Farbe des Himmels lässt sich per Mausklick ändern.

Ein Blick ins Menü von "WordsEye": Um die "Bremer Stadtmusikanten" aus dem Grimm-Märchen zu erzeugen, braucht es nur wenige Worte. Das generierte 3D-Bild lässt sich beliebig drehen und zoomen. Im Menü auf der rechten Bildschirmseite lassen sich die 3D-Objekte weiter bearbeiten - zum Beispiel kann "WordsEye" mehr als 30 verschiedene Hunderassen darstellen.

Mit diesem Bild erklären die Entwickler, wie die Software Sprache in Bilder umwandelt. Als Vorlage dient der Satz: "Der kleine gestreifte Elefant ist einen Meter vor dem roten Haus." ("The small striped elephant is 3 feet in front of the red house".)

Das vereinfachte Schema zeigt, wie "WordsEye" die Worte aus dem Beispielsatz semantisch auffächert. Eigenschaften wie "klein" und "rot" werden dem Haus und dem Elefanten zugeordnet. Insgesamt erkennt die Software nach Entwicklerangaben etwa 20.000 Vokabeln.

In nächsten Test haben wir eine weitere Märchenszene der Brüder Grimm nachgestellt: Der Wolf und die sieben Geißlein. Dabei ist es etwas knifflig, die richtigen Worte zur Anordnung der Figuren zu finden. Sie lauten: "The wolf is 5 feet in front of the fence. The wolf is facing the fence. The wolf is 4 feet high. The seven goats are 3 feet behind the fence. The fence is 300 feet wide. The fence is 3 feet high."

Erkennen Sie dieses Märchenmotiv? Es soll Aschenputtel darstellen, die für ihre böse Stiefmutter Linsen vom Boden auflesen muss. Die Begrenztheit von "WordsEye" macht erfinderisch: Die Software kennt zwar keine Linsen, kann auf Befehl aber "12 kleine grüne Kugeln" darstellen.

Die befremdliche Wirkung der 3D-Animationen inspiriert viele Nutzer zu surrealen Motiven. Hier hat ein Nutzer das bekannte Werk "La trahison des images" von René Magritte erweitert. Fertige Bilder lassen sich auf Wunsch mit Filtern und Sprechblasen versehen.

In diesem Beispiel hat ein Nutzer den David von Michelangelo auf Schachbrettfliesen gestellt. Besonders eignet sich "WordsEye" zum Spiel mit geometrischen Formen und Spiegelungen.

Dieser unnatürlich vergrößerte Hinterkopf erinnert an das Salvador Dalí-Gemälde mit dem sonderbaren Titel "Durchschnittlich atmosphärozephalischer Bürokrat beim Melken einer Schädelharfe".

In diesem Beispiel hat ein Nutzer eine 3D-Version von Pink Floyds Album-Cover zu "The Dark Side of the Moon" erstellt.

Für dieses Bild diente folgender Text als Vorlage: "It is noon. The small white statue. The small white television is 62 inch above the ground. The television is -20 inch on the left of the statue. The ground is silver. The golden bird is left to the Television."

In Bildergalerien auf der "WordsEye"-Webseite lassen sich die Werke anderer Nutzer durchstöbern, kommentieren und als Kopie weiterbearbeiten. Auf Twitter teilen Nutzer ihre Werke unter dem Hashtag #typeapicture.

"Während professionelle 3D-Künstler alles erschaffen können, was sie sich vorstellen, bleibt diese Erfahrung den meisten von uns verwehrt", erklären die Entwickler auf ihrer Webseite. Diese Hürde wollen sie überwinden. Um mit "WordsEye" Kunst, Comics, Grußkarten oder Memes zu erstellen, braucht es keine Vorkenntnisse.

Künstliche Intelligenz erkennt Semantik

Noch ist die Plattform in der Beta-Phase und kann bei Weitem nicht jeden Befehl in ein Bild umsetzen. Die Software versteht nur simple Sätze und kennt fast keine Verben. Es gebe noch vieles, was die Software verwirrt, gesteht Entwickler Bob Coyne in einem Interview mit "The Creators Project".

Nutzer müssten Coyne zufolge ihre Wortwahl anpassen und lernen, innerhalb der Grenzen von "WordsEye" zu denken. Deshalb lassen sich auch nicht einfach Zitate aus Romanen oder Liedern in das Textfeld kopieren. Eine künstliche Intelligenz wertet die Worte semantisch aus und errechnet daraufhin die 3D-Objekte.

Tippt der Nutzer zum Beispiel auf Englisch den Satz: "Der kleine, gestreifte Elefant steht einen Meter vor dem roten Haus", dann kann "WordsEye" die Eigenschaften "klein" und "gestreift" dem Elefanten zuordnen. Entsprechend wird die Software Größe und Textur des Objekts "Elefant" anpassen.

Die Ergebnisse wirken teilweise hölzern, teilweise wie surreale Kunstwerke. Einige Nutzer stellen sogar gezielt Motive von Surrealisten wie René Magritte oder Salvador Dalí nach. Erste Tests und besonders gelungene Werke zeigt unsere Bilderstrecke.

Bei ersten Versuchen fällt es schwer, auf Verben wie "gehen" oder "sitzen" zu verzichten. Auch lassen sich die Objekte nicht verändern: Eine Figur trägt also stets dieselben Kleider, ein Haus hat stets dieselbe Anzahl an Fenstern. In Online-Tutorials erklären die Entwickler, wie Nutzer die besten Worte für ihre Bilder finden.

"WordsEye" als soziales Netzwerk

Am meisten können Anfänger aber von anderen Nutzern lernen. Täglich erscheinen neue Werke in der Bildergalerie, die schönsten davon veröffentlichen die Entwickler via Tumblr. Jeder kann die dazugehörigen Texte kopieren und weiterbearbeiten. So lassen sich schnell neue Formulierungen entdecken, auf die man von alleine wohl eher nicht gekommen wäre.

Wer "WordsEye" testen will, kann sich kostenlos online anmelden. Um die Server zu schonen, sind die Nutzerzahlen noch begrenzt. Interessierte müssen sich eventuell ein paar Tage gedulden, bis ihr Account freigeschaltet wird, wie Firmenchef Gary Zamchick auf Nachfrage mitteilt. In unseren Tests hat die Webseite für einzelne Arbeitsschritte ein paar Sekunden Rechenzeit gebraucht.

Jahrelang sei die Software nur ein Forschungsprojekt gewesen, erklärt Zamchick. Erst im Oktober 2014 wurde "WordsEye" für Nutzer geöffnet und zu einem sozialen Netzwerk mit Kommentarfunktion und Bildergalerien erweitert. "Unser Ziel es ist nun, die Nutzerschaft zu vergrößern", so Zamchick. "Und die Fähigkeiten von WordsEye an natürliche Sprache anzunähern."

Wie das Holodeck bei "Star Trek"

Ob "WordsEye" eines Tages so viel kann wie das Holodeck von "Star Trek"? In der Science-Fiction-Serie lassen sich auf sogenannten Holodecks beliebige Objekte erzeugen - auf Grundlage schlichter Beschreibungen. "Den Vergleich hören wir oft", sagt Zamchick. "Gewiss hat WordsEye ein paar magische Qualitäten des Holodecks. Aber es ist grafisch begrenzt."

Künftig könnte "WordsEye" als Lernprogramm zum Einsatz kommen, mit dem Kinder spielerisch kreatives Schreiben und Englisch üben. Ein erste Studie wurde bereits mit Schülern in den USA durchgeführt (hier als PDF). Auch könnten die schöpferischen Fähigkeiten der Software dabei helfen, Computerspiele und Virtual-Reality-Welten zu entwickeln.



Forum - Diskutieren Sie über diesen Artikel
insgesamt 19 Beiträge
Alle Kommentare öffnen
Seite 1
berndbuttke 22.01.2016
1. Da bleibt einem die Spucke weg.
Es ist immer wieder beeindruckend (oder auch beklemmend), zu sehen, wie weit die KI heute schon ist. Wie lange wird es noch dauern, bis intelligente Roboter die Weltherrschaft übernehmen und den Menschen verdrängen? Maler jedenfalls dürften bald schon überflüssig sein, genauso wie jetzt schon Kaffeeköchinnen. Wie lange wird es noch dauern, bis ich einer Kaffeemaschine einfach nur zu sagen brauche: "Mach mir bitte einen schwarzen Kaffee mit zwei Löffel Zucker!" Ich sage voraus, daß wir auch schon bald eine intelligente Kanzlerin haben werden, die ganz von alleine sagen kann: "Wir schaffen das!"
dschinn1001 22.01.2016
2. Semantik bedeutet auch ...
... man kann feststellen ob jemand taub ist oder ob jemand blind ist und so können auch Software-Lösungen hergestellt werden für Menschen mit Handicap. Die Kehrseite ist auch, dass sich andere Industrie-Bereiche dafuer interessieren. Und dies war schon immer so.
AxelSchudak 23.01.2016
3. künstliche Intelligenz?
Man sollte wirklich mal definieren, was alles "Künstliche intelligenz" ist, und was nur intelligent gemachte Algorithmen. Das hier scheint mir eher unter letzteres zu fallen.
berndbuttke 23.01.2016
4. Wordseye - erleben wir den Aufbruch in ein neues technisches Zeitalter?
Zitat von AxelSchudakMan sollte wirklich mal definieren, was alles "Künstliche intelligenz" ist, und was nur intelligent gemachte Algorithmen. Das hier scheint mir eher unter letzteres zu fallen.
Zuerst mal müßte man definieren, was "Intelligenz" ist. Eine Definition (siehe Wikipedia) lautet: "Fähigkeit zur kreativen Problemlösung". Kann eine mit Algorithmen betriebene Maschine kreativ sein, oder kann sie Kreativität / Intelligenz nur simulieren? Wordseye.com ist übrigens ein hübsches Programm, an dem besonders Kinder viel Freude haben werden. Es erinnert mich an die sprechende Puppe, die ein Bäuerchen macht, wenn man oben Milch reinkippt. Ob die Macher dieses Programms noch die guten alten Menschen sind oder schon neue Wesen, die mit Algorithmen und $-Zeichen gespeist wurden, läßt sich von hier aus natürlich nur schwer beurteilen.
querulant_99 23.01.2016
5.
Zitat von berndbuttkeZuerst mal müßte man definieren, was "Intelligenz" ist. Eine Definition (siehe Wikipedia) lautet: "Fähigkeit zur kreativen Problemlösung". Kann eine mit Algorithmen betriebene Maschine kreativ sein, oder kann sie Kreativität / Intelligenz nur simulieren? Wordseye.com ist übrigens ein hübsches Programm, an dem besonders Kinder viel Freude haben werden. Es erinnert mich an die sprechende Puppe, die ein Bäuerchen macht, wenn man oben Milch reinkippt. Ob die Macher dieses Programms noch die guten alten Menschen sind oder schon neue Wesen, die mit Algorithmen und $-Zeichen gespeist wurden, läßt sich von hier aus natürlich nur schwer beurteilen.
Ist das denn wirklich so entscheidend? Letztendlich ist doch nur das Ergebnis wichtig. Wenn man einem Menschen und einer Maschine dieselbe Aufgabe stellt und das Ergebnis von Juroren bezüglich Kreativität beurteilen lässt, wobei diese natürlich nicht wissen dürfen, welcher Entwurf von einem Computer stammt, und diese mehrheitlich zu dem Ergebnis kommen, dass der maschinelle Entwurf mehr "Pepp" hat, gibt es doch keinen Grund dafür, dem Computer eine gewisse "künstlerische Ader" abzusprechen.
Alle Kommentare öffnen
Seite 1

© SPIEGEL ONLINE 2016
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH


TOP
Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.