Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.

Dreidimensionales Weltmodell: Microsofts Foto-Flickenteppich soll Google düpieren

Von

Microsoft hat für seinen Bing-Kartendienst eine verblüffende Technologie entwickelt: Aus fotografierten Straßenzügen werden 3-D-Ansichten, in die sich Bilder und Live-Videos einbinden lassen. Noch ist das Programm im Entwicklungsstadium - doch für Google könnte es gefährlich werden.

Fotostrecke

7  Bilder
Bing Maps: Aus 2D mach 3D
Der Gedanke, dass das Internet ein Raum ist, ist älter als das WWW. Als William Gibson 1982 in seiner Kurzgeschichte "Burning Chrome" zum ersten Mal den Begriff "Cyberspace" verwendete, war die Vorstellung eines weltweiten Datennetzes noch Science Fiction - für Gibson war aber damals schon klar, dass dieser Datenraum sich dem Menschen auch in räumlicher Form würde darstellen müssen. Die "Jockeys" genannten Hacker seiner "Neuromancer"-Trilogie tauchten, schwammen, schwebten durch abstrakte geometrische Repräsentationen des Datenraums, in drei Dimensionen.

Dann kam das Internet. Und es war eine Scheibe.

Bis heute stellt sich das Netz seinen Benutzern in aller Regel zweidimensional dar: als Ergebnisliste, als Textwurst, als Video-Fensterchen, als Foto. Den Cyberspace muss man sich dazudenken, er ist ein abstraktes Konzept. Eine Ausnahme sind virtuelle Welten - zweifellos einer der Gründe, warum "Second Life" vor ein paar Jahren so viel Aufmerksamkeit erregte. Endlich schien da der digitale Raum auch erfahrbar zu werden, so wie ihn Gibson beschrieben hat und später auch Neil Stephenson in "Snow Crash". Doch "Second Life" ist bis heute eine Nische geblieben, ebenso wie andere, stärker zweckgebundene digitale Räume wie "World of Warcraft". Der Großteil des Netzes ist nach wie vor platt, ein Link befördert den Klickenden nicht durch den digitalen Raum, sondern von einer Fläche auf eine andere.

Blaise Aguera y Arcas möchte das ändern. Er sagt das nicht so deutlich, weil er ein zurückhaltender, bescheidener Mann ist. In Wahrheit aber, das merkt man, wenn man mit dem 35-Jährigen spricht, träumt Aguera y Arcas von einem Netz, das dem Auge mehr zu bieten hat als Textwüsten und Vorschaubilder. Um das zu erreichen, hat Microsoft sein Unternehmen und die Bilddaten-Technologie "Seadragon" gekauft.

Aus vielen flachen Fotos wird eine dreidimensionale Darstellung

Als Beispiel nennt er das, was uns ein Supermarkt schon heute bietet: Im Vorbeigehen "filtere ich dort visuell Zehntausende von Objekten. Auf einem Bildschirm, in Textform, wäre das unmöglich". Ihm schwebt eine "Fusion" dessen vor, was wir online gewohnt sind, kombiniert mit "stärker visuellen Ansätzen". Auch in der Web-Suche? "Das kann ich mir gut vorstellen", sagt der freundliche Mann mit dem Vollbart lächelnd und schaut ein bisschen rätselhaft drein.

Ein bisschen berühmt wurde Aguera y Arcas im Jahr 2007. Bei der TED-Konferenz in Kalifornien führte er Microsofts Software "Photosynth" vor: Eine Software, die aus Hunderten oder gar Tausenden Bildern eines bestimmten Ortes oder Objekts ein großes Ganzes zusammenfügen kann. Schon damals führte er auch vor, dass sich aus solchen 2-D-Bildersammlungen pseudo-dreidimensionale Räume erzeugen lassen. Bei TED 2010 war er wieder zu Gast - und zeigte dort am vergangenen Wochenende, dass diese Technik nicht nur funktioniert, sondern dass es offenbar gelungen ist, sie mit Microsofts "Streetview"-Klon zu vermählen.

Die Bilder von Straßen und Häuserfronten, die man von Googles Straßenfotodienst kennt, sollen in Bing nicht einfach nur Bilder sein, sondern Rauminformation enthalten. Aguera y Arcas machte live vor, wie ein männchenförmiger Cursor zunächst an eine, dann an eine andere Häuserfront andockte - und jagte die virtuelle Kamera schließlich mit einem Mausklick eine Straße entlang, um im letzten Moment nach links zu schwenken und eine Fassade am Straßenrand frontal zu zeigen. Man habe der Anwendung "Geometrie" beigebracht, erklärte Aguera y Arcas einem bass erstaunten Publikum, "ein Verständnis des dreidimensionalen Raumes" (siehe Video unten).

"Um innovativ zu sein, muss man das Spiel verändern"

Das gleiche, führte er anschließend vor, geht auch mit Innenräumen. Offenbar marschieren im Augenblick Microsoft-Angestellte mit Fotorucksäcken durch Supermärkte und andere Einrichtungen in den USA, um die Vor-Ort-Ansicht nicht auf den Außenraum zu beschränken.

Fragt man ihn, ob er es langsam leid sei, auf den Wettbewerb mit Google angesprochen zu werden, antwortet Aguera y Arcas Folgendes: "Natürlich hat Bing ein Interesse daran, Marktanteile zu gewinnen. Aber die Metapher 'Google einholen', im Sinne von 'jedes neue Feature auch implementieren' würde ich lieber nicht benutzen. Um wirklich innovativ zu sein, darf man nicht versuchen, den Kontrahenten in seinem Spiel zu schlagen. Man muss das Spiel verändern."

Photosynth ist aber offenbar noch in anderer Form in Bing-Maps integriert worden: Aguera y Arcas führte Beispiele vor, in denen von Nutzern hochgeladene Bilder passgenau in die Straßenansicht des Kartendienstes eingeblendet werden. Einen Lebensmittelmarkt in Seattle konnte man in der normalen Straßenansicht sehen - und anschließend überblendet mit einem Foto vom selben Ort, mit dunklem Himmel und eingeschalteter Leuchtreklame. Beim Publikum kam das gut an - geradezu verblüfft aber waren die Anwesenden Prominenten, Unternehmer und Tech-Experten, als Aguera y Arcas zeigte, dass das gleiche Prinzip auch mit Live-Bewegtbildern funktioniert. Ein paar seiner Kollegen waren zum gleichen Zeitpunkt im besagten Laden und hatten eine Videokamera dabei. Die Bilder dieser Kamera wurden nun live und stets räumlich exakt passend über die Foto-Ansicht gelegt.

Hunderte Fans filmen ein Konzert - Software macht daraus ein 3D-Bild?

Denkt man die Möglichkeiten dieser Technologie weiter, ist man schnell bei einer multimedialen 3-D-Repräsentation der realen Welt: Wer will, könnte etwa einen Spaziergang durch das virtuelle London machen, an der Speakers' Corner ein irgendwann einmal von einem Touristen aufgenommenes Video einer besonders witzigen Apfelkisten-Tirade ansehen, am Leicester-Square die abfotografierten Werke verschiedener Pflastermaler durchblättern.

Oder, noch weiter in eine Zukunft gedacht, in der Bandbreite auch mobil keine Rolle mehr spielt, Rechenleistung keine Hürde mehr darstellt: Ein Livekonzert von Tokio Hotel in der Arena auf Schalke wird von Hunderten von Fans gleichzeitig mit ihren Handys gefilmt und live ins Netz gestreamt - Photosynth macht daraus eine im Netz digital durchfliegbare 3-D-Ansicht aus lauter beweglichen, bewegten Puzzleteilen. Für die Musikbranche wäre so etwas ein Alptraum. Das Internet aber würde durch solche Elemente zu einem dreidimensionalen, sozialen Ort, einem echten Abbild der Welt, überzogen wahlweise mit Echtzeit-Informationen aus der Gegenwart - oder mit Fotos, Filmen, Zusatzinformationen zu bestimmten Themen, aus einem bestimmten Jahrzehnt.

Der Widerpart zu solchen 3D-Datenräumen wären im Idealfall entsprechende Eingabemöglichkeiten - aber auch die gibt es schon. Etwa jene, die Microsoft und Sony gerade für ihre Spielkonsolen basteln, die Nintendos Wii bereits nutzt. Oder wie das noch weitergehende Konzept der Datenmanipulation des US-Unternehmens Oblong, das "Spatial Operating Environment" g-speak (siehe Video unten).

Noch ist das meiste davon Science Fiction - Bings Streetview-Konkurrent etwa ist noch nicht einmal in den USA verfügbar. Vielleicht aber ist William Gibsons "Cyberspace" tatsächlich bereits in greifbarer Nähe.

g-speak overview 1828121108 from john underkoffler on Vimeo.

Diesen Artikel...
Forum - Diskussion über diesen Artikel
insgesamt 11 Beiträge
Alle Kommentare öffnen
    Seite 1    
1. unten durch
SNA 18.02.2010
Zitat von sysopMicrosoft hat für seinen Bing-Kartendienst eine verblüffende Technologie entwickelt: Aus fotografierten Straßenzügen werden 3-D-Ansichten, in die sich Bilder und Live-Videos einbinden lassen. Noch ist das Programm im Entwicklungsstadium - doch für Google könnte es gefährlich werden. http://www.spiegel.de/netzwelt/web/0,1518,678294,00.html
Die IT-Berichterstattung auf SPON wird langsam gaga.
2. Ein Hoch auf Textwürste
knasterkarl 18.02.2010
Was bitte schön ist eine Textwurst? Zitat: "Bis heute stellt sich das Netz seinen Benutzern in aller Regel zweidimensional dar: als Ergebnisliste, als Textwurst, als Video-Fensterchen, als Foto." Dachte eigentlich schon, dass ein Spiegel-Autor Wust von Wurst unterscheiden kann...
3. Google Maps
Philipp M. 18.02.2010
So weit Zurück ist Google da aber auch nicht; hier ein Beispiel das die Navigation durch Bilder bei Google Maps ermöglicht: http://maps.google.de/maps?f=q&source=s_q&hl=de&geocode=&q=M%C3%BCnchen+Odeonsplatz&sll=52.054648,1.174531&sspn=0.009131,0.01929&ie=UTF8&hq=&hnear=Odeonsplatz,+Maxvorstadt+80539+M%C3%BCnchen,+Bayern&ll=48.141973,11.577441&spn=0.001239,0.002411&z=19&lci=com.panoramio.all&layer=c&cbll=48.141973,11.577441&cbp=12,0,,0,5&photoid=po-19783138
4. titel
Websingularität 18.02.2010
Irgendwie hat's meinen letzten Comment nicht angezeigt. Also nochmal: Meine Frage war, wenn ich mit meinem Avatar vor dem Supermarktregal stehe und Dosensuppe kaufe, wer bringt mir dann diese Suppe an die Haustüre? Kann es sein, dass wir die Zukunft über unsere Klone/Roboter steuern, wie ein zweites "Ich" zum Wegwerfen. Dass man unsere Augen als Webcam-(Streetview) verwenden kann, und irgendwann alle anderen Sinneseindrücke in Dateien 'xxxMyPorn.feel' abspeicherbar sind, welche man über Filesharing austauschen und nachempfinden kann? Kurz: Dass auf irgendwelchen Webspace verteilt ein komplettes aber mosaikhaftes Image meines Lebens vorliegt, welches sich über google-Suche zusammenstellen und rekonstruieren lässt. Ist diese Entwicklung nicht etwas exhibitionistisch? Muss man wirklich alles aufzeichnen, alles wissen und abfotographieren?
5. Spannend, wenn auch nicht neu
dieweltsehen 18.02.2010
Zitat von Philipp M.So weit Zurück ist Google da aber auch nicht; hier ein Beispiel das die Navigation durch Bilder bei Google Maps ermöglicht: http://maps.google.de/maps?f=q&source=s_q&hl=de&geocode=&q=M%C3%BCnchen+Odeonsplatz&sll=52.054648,1.174531&sspn=0.009131,0.01929&ie=UTF8&hq=&hnear=Odeonsplatz,+Maxvorstadt+80539+M%C3%BCnchen,+Bayern&ll=48.141973,11.577441&spn=0.001239,0.002411&z=19&lci=com.panoramio.all&layer=c&cbll=48.141973,11.577441&cbp=12,0,,0,5&photoid=po-19783138
Ich schließe mich Philipp M. an: Die vorgestellten Features versprechen einiges, auch wenn man einiges davon schon z.B. bei Google gesehen hat. Ich würde mir wünschen, dass Bing bald die naheliegenden Aufgaben anpackt,vor allem eine benutzerfreudliche GUI. Es ist schon peinlich, wie umständlich die Suchmaske "funktioniert". Auch an den normalen 2D-Karten besteht noch Verbesserungsbedarf: beispielsweise die Schriftplatzierung von Großbritannien (quer über das Land gebogen!) zieht mir als Kartograph die Schuhe aus!
Alle Kommentare öffnen
    Seite 1    
Diskussion geschlossen - lesen Sie die Beiträge! zum Forum...

© SPIEGEL ONLINE 2010
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH




Anzeige
  • Christian Stöcker:
    Spielmacher

    Gespräche mit Pionieren der Gamesbranche.

    Mit Dan Houser ("Grand Theft Auto"), Ken Levine ("Bioshock"), Sid Meier ("Civilization"), Hideo Kojima ("Metal Gear Solid") u.v.a.

    SPIEGEL E-Book; 2,69 Euro.

  • Bei Amazon kaufen.
Der kompakte Nachrichtenüberblick am Morgen: aktuell und meinungsstark. Jeden Morgen (werktags) um 6 Uhr. Bestellen Sie direkt hier: