Semantisches Web Aufräumen im Datenchaos

WWW-Erfinder Tim Berners-Lee wirbt für die Weiterentwicklung des Webs. An die Stelle des Datenchaos, in dem nur Bots wie Google noch fündig werden, soll ein "semantisches Web" treten, in dem die Content-Provider nicht nur Inhalt schaffen, sondern auch Ordnung.


Tim Berners-Lee: Der WWW-Erfinder ist nach wie vor die Schlüsselfigur im World-Wide-Web-Konsortium W3C
AP

Tim Berners-Lee: Der WWW-Erfinder ist nach wie vor die Schlüsselfigur im World-Wide-Web-Konsortium W3C

Daten gibt es im Internet wie Sand am Meer. Für die effektive Suche nach bestimmten Informationen und die sinnvolle Verknüpfung von Daten gibt es aber nicht viel mehr als Google. Einen kühnen Vorstoß in ein neues, intelligenteres Web unternimmt jetzt das internationale World-Wide-Web-Konsortium (W3C), das für die Standards im Netz zuständig ist. Auf Vorträgen in München, Rom, London, Athen und Brüssel werben die W3C-Vordenker für das "semantische Web".

In diesem World Wide Web der Zukunft gibt es keine ungeordneten Text- und Bilderhalden mehr, die von den Google-Robotern und anderen Suchmaschinen umgepflügt werden. Stattdessen sind alle wesentlichen Informationen einer Web-Seite mit Angaben zu ihrer Bedeutung versehen - daher die Bezeichung semantisch (von griechisch "sem" für Bedeutung). Diese Angaben werden als Metadaten bezeichnet, als Informationen über Informationen. Mit Hilfe von Metadaten können Computerprogramme jenseits der Volltextsuche gezielt nach ganz bestimmten Informationen suchen, zum Beispiel nach Namen von Personen. Bisher aber lässt sich im Web bei der Buchstabenfolge "Kohl" nicht sagen, ob das Gemüse oder eine Person dieses Namens gemeint ist.

"Das Web wird sein volles Potenzial erst dann erreichen, wenn es zu einer Umgebung wird, in der Daten nicht nur von Menschen, sondern auch von automatischen Werkzeugen getauscht und verarbeitet werden können", erklären W3C-Direktor Tim Berners-Lee und der W3C-Experte Eric Miller in einem soeben veröffentlichten Beitrag mit dem Titel "Das semantische Web hebt ab".

Demnach sind zwei Schritte erforderlich, um semantische Web-Seiten zu erstellen:

  • Zuerst müssen all jene Daten ausgelagert werden, die nichts mit dem Inhalt zu tun haben, sondern lediglich das Layout definieren - also ob ein Kapitelanfang fett markiert wird und in welcher Schriftart die Überschrift stehen soll. Solche Daten blähen den HTML-Code von Web-Seiten unnötig auf und erschweren ihre Nutzung durch Programme, die im Internet automatisch nach bestimmten Daten suchen, diese erfassen und auswerten. Solche Programme werden als Web-Services bezeichnet.
  • Anschließend müssen alle wesentlichen Daten mit Metadaten unterlegt werden. Erst wenn eine fünfstellige Zahl eindeutig als Postleitzahl gekennzeichnet ist, ist sie für ein Programm nicht mehr eine beliebige Ziffernfolge, sondern eine Information mit einer klaren Bedeutung.

Bausteine des semantischen Webs sind drei Techniken, die weit über HTML hinaus gehen und zusammengehörende Daten miteinander vernetzen: XML (Extensible Markup Language) definiert die Metadaten von Web-Dokumenten, URI (Uniform Resource Identifier) bestimmt auf eindeutige Weise den genauen Ort eines Dokuments im Netz, und RDF (Resource Description Framework) sorgt für die Zusammenführung der Daten. Alle drei Standards werden in W3C-Arbeitsgruppen festgelegt und in Zusammenarbeit mit IT-Unternehmen weiter entwickelt. Auch für das Projekt des semantischen Webs gibt es natürlich bereits eine Abkürzung: SWAD steht für `Semantic Web Advanced Development".

Vor 13 Jahren wurde das World Wide Web am Europäischen Labor für Teilchenphysik (CERN) von Berners-Lee entwickelt. Das semantische Web ist bislang nur ein kleines Pflänzchen, sorgfältig gegossen von seinen Ziehvätern im W3C. Die Vorteile wie eine gezieltere Suche, intelligente Software-Agenten, Web-Services und anderes mehr sind aber so überzeugend, dass mit einer allgemeinen, wenn auch nur sehr allmählichen Ausbreitung des semantischen Webs zu rechnen ist. Berners-Lee und Miller jedenfalls sind voller Euphorie: `Das Aufregendste am semantischen Web ist nicht das, was wir uns alles damit vorstellen können, sondern das, was wir uns jetzt noch gar nicht vorstellen können."

Peter Zschunke, AP



© SPIEGEL ONLINE 2003
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung


TOP
Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.