Dreidimensionales Weltmodell Microsofts Foto-Flickenteppich soll Google düpieren

Bing Maps: Aus 2D mach 3D
Der Gedanke, dass das Internet ein Raum ist, ist älter als das WWW. Als William Gibson 1982 in seiner Kurzgeschichte "Burning Chrome" zum ersten Mal den Begriff "Cyberspace" verwendete, war die Vorstellung eines weltweiten Datennetzes noch Science Fiction - für Gibson war aber damals schon klar, dass dieser Datenraum sich dem Menschen auch in räumlicher Form würde darstellen müssen. Die "Jockeys" genannten Hacker seiner "Neuromancer"-Trilogie tauchten, schwammen, schwebten durch abstrakte geometrische Repräsentationen des Datenraums, in drei Dimensionen.
Dann kam das Internet. Und es war eine Scheibe.
Bis heute stellt sich das Netz seinen Benutzern in aller Regel zweidimensional dar: als Ergebnisliste, als Textwurst, als Video-Fensterchen, als Foto. Den Cyberspace muss man sich dazudenken, er ist ein abstraktes Konzept. Eine Ausnahme sind virtuelle Welten - zweifellos einer der Gründe, warum "Second Life" vor ein paar Jahren so viel Aufmerksamkeit erregte. Endlich schien da der digitale Raum auch erfahrbar zu werden, so wie ihn Gibson beschrieben hat und später auch Neil Stephenson in "Snow Crash". Doch "Second Life" ist bis heute eine Nische geblieben, ebenso wie andere, stärker zweckgebundene digitale Räume wie "World of Warcraft". Der Großteil des Netzes ist nach wie vor platt, ein Link befördert den Klickenden nicht durch den digitalen Raum, sondern von einer Fläche auf eine andere.
Blaise Aguera y Arcas möchte das ändern. Er sagt das nicht so deutlich, weil er ein zurückhaltender, bescheidener Mann ist. In Wahrheit aber, das merkt man, wenn man mit dem 35-Jährigen spricht, träumt Aguera y Arcas von einem Netz, das dem Auge mehr zu bieten hat als Textwüsten und Vorschaubilder. Um das zu erreichen, hat Microsoft sein Unternehmen und die Bilddaten-Technologie "Seadragon" gekauft.
Aus vielen flachen Fotos wird eine dreidimensionale Darstellung
Als Beispiel nennt er das, was uns ein Supermarkt schon heute bietet: Im Vorbeigehen "filtere ich dort visuell Zehntausende von Objekten. Auf einem Bildschirm, in Textform, wäre das unmöglich". Ihm schwebt eine "Fusion" dessen vor, was wir online gewohnt sind, kombiniert mit "stärker visuellen Ansätzen". Auch in der Web-Suche? "Das kann ich mir gut vorstellen", sagt der freundliche Mann mit dem Vollbart lächelnd und schaut ein bisschen rätselhaft drein.
Ein bisschen berühmt wurde Aguera y Arcas im Jahr 2007. Bei der TED-Konferenz in Kalifornien führte er Microsofts Software "Photosynth" vor: Eine Software, die aus Hunderten oder gar Tausenden Bildern eines bestimmten Ortes oder Objekts ein großes Ganzes zusammenfügen kann. Schon damals führte er auch vor, dass sich aus solchen 2-D-Bildersammlungen pseudo-dreidimensionale Räume erzeugen lassen. Bei TED 2010 war er wieder zu Gast - und zeigte dort am vergangenen Wochenende, dass diese Technik nicht nur funktioniert, sondern dass es offenbar gelungen ist, sie mit Microsofts "Streetview"-Klon zu vermählen.
Die Bilder von Straßen und Häuserfronten, die man von Googles Straßenfotodienst kennt, sollen in Bing nicht einfach nur Bilder sein, sondern Rauminformation enthalten. Aguera y Arcas machte live vor, wie ein männchenförmiger Cursor zunächst an eine, dann an eine andere Häuserfront andockte - und jagte die virtuelle Kamera schließlich mit einem Mausklick eine Straße entlang, um im letzten Moment nach links zu schwenken und eine Fassade am Straßenrand frontal zu zeigen. Man habe der Anwendung "Geometrie" beigebracht, erklärte Aguera y Arcas einem bass erstaunten Publikum, "ein Verständnis des dreidimensionalen Raumes" (siehe Video unten).
"Um innovativ zu sein, muss man das Spiel verändern"
Das gleiche, führte er anschließend vor, geht auch mit Innenräumen. Offenbar marschieren im Augenblick Microsoft-Angestellte mit Fotorucksäcken durch Supermärkte und andere Einrichtungen in den USA, um die Vor-Ort-Ansicht nicht auf den Außenraum zu beschränken.
Fragt man ihn, ob er es langsam leid sei, auf den Wettbewerb mit Google angesprochen zu werden, antwortet Aguera y Arcas Folgendes: "Natürlich hat Bing ein Interesse daran, Marktanteile zu gewinnen. Aber die Metapher 'Google einholen', im Sinne von 'jedes neue Feature auch implementieren' würde ich lieber nicht benutzen. Um wirklich innovativ zu sein, darf man nicht versuchen, den Kontrahenten in seinem Spiel zu schlagen. Man muss das Spiel verändern."
Photosynth ist aber offenbar noch in anderer Form in Bing-Maps integriert worden: Aguera y Arcas führte Beispiele vor, in denen von Nutzern hochgeladene Bilder passgenau in die Straßenansicht des Kartendienstes eingeblendet werden. Einen Lebensmittelmarkt in Seattle konnte man in der normalen Straßenansicht sehen - und anschließend überblendet mit einem Foto vom selben Ort, mit dunklem Himmel und eingeschalteter Leuchtreklame. Beim Publikum kam das gut an - geradezu verblüfft aber waren die Anwesenden Prominenten, Unternehmer und Tech-Experten, als Aguera y Arcas zeigte, dass das gleiche Prinzip auch mit Live-Bewegtbildern funktioniert. Ein paar seiner Kollegen waren zum gleichen Zeitpunkt im besagten Laden und hatten eine Videokamera dabei. Die Bilder dieser Kamera wurden nun live und stets räumlich exakt passend über die Foto-Ansicht gelegt.
Hunderte Fans filmen ein Konzert - Software macht daraus ein 3D-Bild?
Denkt man die Möglichkeiten dieser Technologie weiter, ist man schnell bei einer multimedialen 3-D-Repräsentation der realen Welt: Wer will, könnte etwa einen Spaziergang durch das virtuelle London machen, an der Speakers' Corner ein irgendwann einmal von einem Touristen aufgenommenes Video einer besonders witzigen Apfelkisten-Tirade ansehen, am Leicester-Square die abfotografierten Werke verschiedener Pflastermaler durchblättern.
Oder, noch weiter in eine Zukunft gedacht, in der Bandbreite auch mobil keine Rolle mehr spielt, Rechenleistung keine Hürde mehr darstellt: Ein Livekonzert von Tokio Hotel in der Arena auf Schalke wird von Hunderten von Fans gleichzeitig mit ihren Handys gefilmt und live ins Netz gestreamt - Photosynth macht daraus eine im Netz digital durchfliegbare 3-D-Ansicht aus lauter beweglichen, bewegten Puzzleteilen. Für die Musikbranche wäre so etwas ein Alptraum. Das Internet aber würde durch solche Elemente zu einem dreidimensionalen, sozialen Ort, einem echten Abbild der Welt, überzogen wahlweise mit Echtzeit-Informationen aus der Gegenwart - oder mit Fotos, Filmen, Zusatzinformationen zu bestimmten Themen, aus einem bestimmten Jahrzehnt.
Der Widerpart zu solchen 3D-Datenräumen wären im Idealfall entsprechende Eingabemöglichkeiten - aber auch die gibt es schon. Etwa jene, die Microsoft und Sony gerade für ihre Spielkonsolen basteln, die Nintendos Wii bereits nutzt. Oder wie das noch weitergehende Konzept der Datenmanipulation des US-Unternehmens Oblong, das "Spatial Operating Environment" g-speak (siehe Video unten).
Noch ist das meiste davon Science Fiction - Bings Streetview-Konkurrent etwa ist noch nicht einmal in den USA verfügbar. Vielleicht aber ist William Gibsons "Cyberspace" tatsächlich bereits in greifbarer Nähe.