ThemaNumeratorRSS

Alle Kolumnen

  • Drucken
  • Senden
  • Feedback
 

Numerator Wie Google mit Milliarden Unbekannten rechnet

Google-Algorithmus: Das Page-Rank-Verfahren
Fotos
REUTERS

2. Teil: Ausgerechnet: Der Page Rank für ein Mini-Web aus drei Seiten

Ein simples Beispiel eines Mini-Internets aus drei Web-Seiten verdeutlicht, wie dieses Ranking-System in der Praxis funktioniert. Von der Seite A führt ein Link zu B, von B je einer zu A und C. Von C gibt es nur eine Verknüpfung zu A (siehe Abbildung). Damit erhalten wir folgendes Gleichungssystem:

pA = (1-d)/3 + d(pB/2 + pC)
pB = (1-d)/3 + d(pA)
pC = (1-d)/3 + d(pB/2)

Nun lösen wir das Gleichungssystem und verwenden dabei d=0,15, ein Wert, den Google nach eigenen Angaben in der Ranking-Berechnung nutzt.

pA = 0,2833 + 0,075 pB + 0,15 pC
pB = 0,2833 + 0,15 pA
pC = 0,2833 + 0,075 pB

Setzt man den Ausdruck für pB aus Gleichung zwei in die erste und in die dritte Gleichung ein, und den Ausdruck für pC dann wiederum in die erste, erhält man die Lösung:

pA = 0,355
pB = 0,336
pC = 0,308

Wir haben gesehen, dass bei unserem Mini-Web aus drei Web-Seiten letztlich ein lineares Gleichungssystem mit drei Unbekannten gelöst werden muss. Bei 30 Milliarden Web-Seiten besteht das System aus 30 Milliarden Gleichungen mit 30 Milliarden Unbekannten. Man kann einen solchen Gleichungskoloss übrigens auch als quadratische Matrix darstellen und steckt damit mittendrin in der Matrizenrechnung. Für alle, die damit vertraut sind: Der gesuchte Page Rank entspricht dann dem sogenannten Eigenvektor der Matrix.

Suchmaschinenoptimierung als Geschäftsmodell

Bei der Lösung dieses gigantischen Gleichungssystems nutzt Google ein iteratives Verfahren. Das heißt, dass jeder einzelnen Seite ein mehr oder weniger willkürlicher Page Rank zugewiesen und in die rechte Seite der Gleichungen eingesetzt wird. Daraus erhält man neue Page-Rank-Werte, die wiederum eingesetzt werden, und so weiter. Nach etwa hundert Iterationen kommt man auf diese Weise auch bei Systemen mit Millionen Gleichungen der exakten Lösung sehr nah.

Damit ist aber noch nicht erklärt, wie die Trefferliste einer Google-Anfrage zustande kommt. Der Page Rank einer Seite ist nur einer von mittlerweile 200 bis 300 Faktoren, die in die Berechnung einfließen. Hinzu kommen etwa die Textinhalte der Web-Seite, im HTML-Code steckende Schlüsselwörter (Tags), der Titel der Seite und weitere Kriterien wie beispielsweise der Zeitpunkt der letzten Aktualisierung.

Die Details der Trefferlistenberechnung hält Google geheim, etwa welches Gewicht Schlüsselwörter im Vergleich zum Seitentitel haben. Allerdings können Experten durch den Vergleich von Web-Seiten und Trefferlisten Rückschlüsse auf die aktuelle Kalkulationsmethode ziehen - und damit sogar Geld verdienen. Suchmaschinenoptimierung heißt das Geschäft, bei dem Web-Seiten so lange an den gerade angewandten Google-Algorithmus angepasst werden, bis sie bei Suchanfragen immer möglichst weit oben in der Trefferliste landen. Ein ständiges Katz- und Mausspiel, denn Google betreibt bei seinen Algorithmen ein permanentes Feintuning.

An der eigentlichen Page-Rank-Berechnung hat sich seit dem Start von Google bis heute kaum etwas geändert. Allerdings greift Google mittlerweile in Einzelfällen ein, wenn das Ranking durch sogenannte Linkfarmen massiv manipuliert wird. Das sind Tausende verschiedener Web-Seiten, die mit dem alleinigen Zweck betrieben werden, durch eine Vielzahl von Links zu einigen wenigen Seiten deren Ranking nach oben zu treiben. Wird eine Linkfarm als solche identifiziert, dann bestraft Google die manipulierten Seiten mit einem Page Rank von null - sie sind somit bei Suchanfragen praktisch nicht mehr auffindbar.

Dieser Text ist ein Auszug aus dem Buch "Numerator - Mathematik für jeden", das im Goldmann-Verlag erschienen ist.

Diesen Artikel...
Aus Datenschutzgründen wird Ihre IP-Adresse nur dann gespeichert, wenn Sie angemeldeter und eingeloggter Facebook-Nutzer sind. Wenn Sie mehr zum Thema Datenschutz wissen wollen, klicken Sie auf das i.

Auf anderen Social Networks posten:

  • studiVZ meinVZ schülerVZ
  • deli.cio.us
  • Xing
  • Digg
  • Google Bookmarks
  • reddit
  • Windows Live
News verfolgen

HilfeLassen Sie sich mit kostenlosen Diensten auf dem Laufenden halten:

alles aus der Rubrik Wissenschaft
alles aus der Rubrik Mensch
alles zum Thema Numerator

© SPIEGEL ONLINE 2009
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH



Buchtipp
Holger Dambeck: Numerator
Mathematik für jeden

Anschaulich, spielerisch, praktisch: wie Mathematik unser Leben bestimmt und warum Problemelösen auch ahnungslosen Laien Spaß macht. SPIEGEL-ONLINE-Redakteur Holger Dambeck lädt ein in die faszinierende Welt der Mathematik. Mit einem Vorwort von Albrecht Beutelspacher, dem Gründer des Mathematikums in Gießen.

Goldmann-Verlag; 223 Seiten; 7,95 Euro.

Einfach und bequem: Direkt im SPIEGEL-Shop bestellen.


Mini-Web: Linkpopularität entscheidet über Page Rank
SPIEGEL ONLINE

Mini-Web: Linkpopularität entscheidet über Page Rank






TOP



TOP