Zur Ausgabe
Artikel 131 / 153
Vorheriger Artikel
Nächster Artikel

INTERNET Pfade durch den Info-Dschungel

Mehr als eine Milliarde Seiten umfasst das Internet, täglich kommt eine weitere Million hinzu. Sind die Suchmaschinen von diesem rasanten Wachstum überfordert? Eine neue Generation soll jetzt die Trefferquote erhöhen und sogar Fotos, Musik und fremdsprachige Texte auffinden.
aus DER SPIEGEL 44/2000

Jahr für Jahr verschwinden Kinder, allein in Deutschland sind es 30 000. Die meisten büxen nur kurz aus und kommen bald wieder heim, doch mehr als 800 gelten derzeit als langfristig vermisst. Ängstlich fragen sich ihre Eltern: Leben sie noch? Sind sie womöglich Pornoproduzenten in die Hände gefallen?

Tag für Tag, so will die schottische Firma Actis festgestellt haben, tauchen 20 000 neue Angebote mit pornografischem Material im Internet auf. Was, wenn auf einer dieser Seiten das Bild eines vermissten Kindes zu sehen ist? Lässt es sich aus der Bilderflut herausfiltern und das Opfer so wiederfinden?

An diese Hoffnung klammert sich die Schweizer Kinderhilfs-Organisation Fredi. Und da es unmöglich ist, das Gruselkabinett der Kindernacktfotos Mausklick um Mausklick zu durchforsten, setzt Fredi ein neues Fahndungswerkzeug ein: die erste vollautomatische Bildersuchmaschine der Welt.

Die Software selbst läuft in Kassel. Rund um die Uhr durchstreifen die Hochleistungsrechner der Firma Cobion hinter den Mauern eines gesichtslosen Zweckbaus in einem Industriegebiet die Weiten des Netzes, klicken sich unermüdlich von Website zu Website, schlürfen alltäglich rund 2000 Bilder auf ihre Festplatten.

Drei Techniker sitzen im blauen Dämmerlicht der Kontrollzentrale vor Monitorwänden, die im Halbkreis bis zur Decke ragen. Netzadressen rieseln kolonnenweise über die Bildschirme wie Neuschnee.

Die Cobion-Software kann, was noch vor kurzem als undenkbar galt: Während ihre konventionellen Vorfahren das Internet nach einem Wort durchkämmen, wird die Cobion-Datenbank mit einem eingescannten Passfoto gefüttert. Das Bild wird aufwendig umgerechnet in ein dreidimensionales Modell, die spezifischen Proportionen zwischen Augen, Kinn, Nase und Mund werden mathematisch exakt erfasst. Nach einem mehrstündigen Suchlauf spuckt die Suchmaschine dann Bilder aus, auf denen Menschen zu sehen sind, die dem gesuchten ähneln (siehe Grafik).

»Wir bringen den Rechnern das Sehen bei«, sagt Carsten Werner, 30, unbescheiden. Der Turnschuhunternehmer ist Mitgründer der Firma Cobion, gemeinsam mit zwei weiteren Mathematikern. Er leitet die achtköpfige Abteilung für Software-Entwicklung. Ihr Ziel: eine Suchmaschine, die ein beliebiges Gesicht im Internet auffinden kann, unabhängig von Hintergrund, Beleuchtung oder Aufnahmewinkel.

Ein vermessener Plan, denn schon konventionelle Suchmaschinen stoßen zunehmend an Grenzen. Mehr als anderthalb Milliarden Pages umfasst das Web, tagtäglich schwillt es um über eine weitere Million an - ein menschengemachter Informationsdschungel, der durch seine schiere Größe unbrauchbar zu werden droht.

Eine rapide wachsende Branche lebt davon, Wege durch das Dickicht zu weisen. Als im Mai 1993 der US-Student Matthew Gray den »Wanderer«, die erste automatische Suchsoftware der Welt, durchs Netz streunen ließ, da ahnten weder er noch andere, dass der Grundstein einer Milliardenindustrie gelegt war.

Inzwischen hat »Wanderer« über 3000 Nachfahren hervorgebracht, eine ganze Armada von Suchmaschinen, die das Daten-Chaos zu bändigen versucht; die Suchmaschinensuchmaschine »searchengineguide.com« listet über 3500 verschiedene auf.

Darunter gibt es Suchmaschinen für WAP-Angebote (wapjag.de), für Musik im MP3-Format (www.gnutella.de), Suchmaschinen für Vergessliche (www.amnesi.com), Metasuchmaschinen, die andere Suchmaschinen durchsuchen (metager.de), und Wegweiser fürs »Egosurfen«, dem eitlen Suchen nach Erwähnungen der eigenen Person im Netz (www.egosurf.com).

Am Vorgehen jedoch hat sich in den letzten sieben Jahren nicht allzu viel verändert: Automatische Suchprogramme, »Robots« oder »Spider« genannt, durchforsten das Netz und speichern die gefundenen Seiten auf Zentralrechnern ab. Webkataloge wie Yahoo verwandeln die gefundenen Angebote per Hand in einen Katalog, der nach Schlagworten sortiert ist. Wenn ein Nutzer einen Begriff in die Suchmaske eingibt, durchwühlt ein Suchprogramm die lokale Datenbank und zeigt die Ergebnisse an.

Doch ob diese Technik die anschwellende Datenflut wird bewältigen können, ist zweifelhaft. Selbst renommierten Suchangeboten bleiben drei Viertel aller Angebote schlichtweg verborgen. »Suchmaschinen kann man mit einem Telefonbuch vergleichen, das veraltet ist, populäre Einträge bevorzugt und dessen Seiten zum größten Teil herausgerissen sind«, resümieren die Webforscher Steve Lawrence und Lee Giles vom NEC Research Institute.

Nicht nur verzweifelte Eltern vermisster Kinder, auch orientierungslos im Netz herumirrende Surfer hoffen auf die Suchmaschinen der zweiten Generation.

Gigantische Rechnerparks und spezialisierte Entwicklungsteams sollen dabei helfen. Das Ziel ist, den Nutzern elektronische Assistenten an die Seite zu stellen, die nicht nur Datenbanken durchwühlen, sondern die Informationen darin auch verstehen.

Cobion-Mitgründer Werner zum Beispiel hatte als Testterrain für die Kindersuche zunächst einmal die Suche nach Firmenlogos gewählt: Wo in der Netzwelt taucht mein Markenzeichen auf? Wer missbraucht es und verstößt damit gegen den Markenschutz? - diese Fragen soll die Software beantworten.

Das Logo »Intel inside« etwa, blau umkringelt, soll Kunden garantieren, dass ihr Rechner mit einem Prozessor der Firma Intel läuft, und gehört zu den wertvollsten Markenzeichen der Welt. Bei einem Suchlauf stieß Werners Software auf vielfältige Varianten, darunter auf eine russische Website, die einen Frauenpo mit dem Slogan »Tampax inside« zeigt. Erkannt wurde die Verarschung allein durch die grafische Ähnlichkeit. Seitdem gehört Intel zu Werners Kunden ebenso wie DaimlerChrysler, Bayer und Adidas.

Die Kasseler greifen dabei auf schiere Rechenpower zurück: In ihrer Serverfarm stehen 1000 Rechner in 15 Meter langen Reihen, weitere 400 sind bestellt. Mühsam kühlt die Klimaanlage den Raum auf Zimmertemperatur - ein dröhnender Maschinenraum der Bewusstseinsindustrie, in dem erfahrbar wird, dass die Netzwelt durchaus nicht virtuell ist. Für die meisten Surfer ist eine Suchmaschine kaum mehr als eine saubere Benutzeroberfläche. Doch meist steht hinter ihr ein gewaltiger Maschinenpark.

Für seine Bildersuchmaschine sieht Werner vielfältige Einsatzmöglichkeiten: »Denken Sie an den Lewinsky-Skandal«, sagt er, »plötzlich brauchten die Zeitungen Bilder, auf denen der Präsident und die Praktikantin abgelichtet waren. In nächtelanger Geduldsarbeit mussten Archive durchforstet werden. Jeder wusste: Wer als erster ein Bild von Monica und Bill hervorkramt, wird reich, weil alle das nachdrucken.«

Schon in einem halben Jahr, so Werner, sollen Privatleute diesen Dienst nutzen können und binnen Minuten angezeigt bekommen, wo sie im Internet verewigt sind - oder einer ihrer Doppelgänger. Der Name der geplanten Aktion: »Search your twin« - such deinen Zwilling.

Auch für das Digitalfernsehen der Zukunft hat Werner eine Vision parat: Jeder Nutzer könnte Bilder seiner Lieblingsschauspieler einspeisen in eine Fernsehsuchmaschine und nach dem Suchlauf all die Filme oder Talkshows aufgelistet bekommen, in denen die gesuchten Stars, auftauchen. Außerdem plant Werner den Einsatz seiner Software zu Fahndungszwecken, um im Internet nach Gesichtern von Tätern oder Opfern zu fischen.

Die Suche nach vermissten Kindern gilt dabei durchaus als zwiespältig. Die einen sagen, dass diese Form der Ermittlung in die Hände der Polizei gehöre. Andere kritisieren, dass die meisten Kinderpornobilder von den Eltern selber hergestellt und verkauft werden - ihnen werde man mit der Bilderfahndung im Netz nicht auf die Schliche kommen. »Die Cobion-Technik ist wunderbar«, sagt auch Monika Bruhns von der »Elterninitiative vermisste Kinder«, »aber für die Suche nach Entführungsopfern wird das nicht den entscheidenden Durchbruch bringen.« Auch finde sie es beängstigend, wie leicht man mit so einer Technik Menschen überwachen könnte.

Zudem lässt die Zuverlässigkeit des Cobion-Codes noch zu wünschen übrig. Nicht selten verwechselt die Maschine sogar noch Männer und Frauen. Und wer nach einem Katzengesicht sucht, findet immer auch abstrakte Formen, die erst auf den zweiten Blick an ein Tier erinnern - Computer sehen eben anders als Menschen.

Wenn jedoch die Suchmaschinisten der zweiten Generation diese Hürden einmal überwinden, könnten sie viele alltägliche Arbeitsabläufe der Informationsgesellschaft umkrempeln, vom Fernsehen bis zur Strafverfolgung, vom Fotoalbum bis zum Anrufbeantworter. Sicher ist: Es tut sich etwas in der Branche. »Jeden Monat verschwinden mehr als 20 alte Suchmaschinen und 70 neue kommen dazu«, sagt der Kanadier Bryan Strome, der den Suchmaschinenkatalog searchenginecolossus.com betreibt, mit mehr als 1300 Einträgen. »Wir erleben gerade das goldene Zeitalter der Suchmaschinen.«

Viele Neugründungen sind, wie Cobion, postalphabetisch, kommen also ohne die Tastatur-Eingabe von Wörtern aus: Hifind zum Beispiel, eine Musiksuchmaschine aus Hamburg, sortiert Musik nach Merkmalen, von »Tango« über »sommerlich« bis »traurig«. Demnächst, so der Plan, soll es sogar möglich sein, einen Ohrwurm in ein Mikrofon am heimischen PC zu pfeifen; die Suchmaschine fördert dann ähnlich klingende Lieder oder Plagiate zu Tage (www.hifind.com). Die Produktsuchmaschine der Firma Interprice soll ähnlich funktionieren: Onlineshopper murmeln »Porsche unter 70 000 Mark« in ihr Mikrofon, die Software liest daraufhin Angebote vor (www.interprice.com).

Werden die Suchmaschinen der zweiten Generation damit Bilddokumentare, Archivare und andere Suchspezialisten arbeitslos machen? Darüber gehen die Meinungen der Spezialisten weit auseinander.

»Im Gegenteil«, beteuert der Brite Danny Sullivan, der das elektronische Branchenblatt »Search Engine Watch« herausgibt. Bestes Beispiel dafür sei Yahoo: Der Branchenführer beschäftige mehr als 150 Redakteure, welche Webangebote sichten, bewerten und in die Rubriken des Webkataloges einordnen. Information für Menschen müsse eben von echten Menschen aufbereitet werden.

Für diese These erntet Sullivan bei der wachsenden Truppe der »Informationsstatistiker« nur Spott. Diese wollen Suchmaschinen mit künstlicher Intelligenz ausstatten. Vielleicht bekanntester Vertreter ist Michael Lynch, 34, der mit rein mathematischen Verfahren die Informationssuche automatisiert. Eine billige, abgespeckte Version seiner Software ist im Internet unter dem Namen »Kenjin« kostenlos herunterzuladen (www.kenjin.de).

Lynchs Software läuft permanent im Hintergrund und durchkämmt sämtliche Dokumente, die ein Nutzer bearbeitet, nach Schlagworten. Indiskret und beharrlich beobachtet sie das Verhalten des Nutzers und setzt ein individuelles Suchprofil zusammen. Im Zweifelsfall weiß das Programm automatisch im Voraus, ob der Suchbegriff »Bank« sich eher auf ein Finanzinstitut oder ein Sitzmöbel bezieht. Diese Software wird heute bereits von Großunternehmen wie dem Sender BBC, dem Technikgigant Lucent Technologies und der Supermarktkette Tesco eingesetzt.

Schließlich gibt es noch das kleine Grüppchen der »Semantiker«, die eine Symbiose aus Suchmaschine und Mensch anstreben und Programme entwickeln, die jeden Otto Normalnutzer zu einem geschickten Spezialisten heranbilden sollen, indem sie die Suchbegriffe mit sprachwissenschaftlichen Verfahren analysieren.

In einem ehemaligen Badehaus in Hamburg-Altona wird an einer solchen Lernmaschine gebastelt. Bis spät in die Nacht sitzt eine Gruppe von 14 Linguisten und Dokumentaren zusammen und diskutiert über Worte, in vier Sprachen. Genau genommen sind die Worte ihnen egal, es geht um Bedeutungen.

Früher duschten sich hier die Malocher den Kohlenstaub aus den Haaren, heute wird an Formulierungen gefeilt: »How do you say ,preservative' auf Deutsch?«, fragt ein amerikanischer Mitarbeiter. »Konservierungsmittel«, antwortet der Franzose gegenüber, ein Dritter tippt die beiden Worte in eine Datenbank.

So entsteht das Fundament von »Seruba«, der ersten komplett viersprachigen Suchmaschine der Welt. Wer einen deutschen Begriff eingibt, bekommt auf Wunsch auch Ergebnisse auf Englisch, Französisch oder Spanisch. »Wir bauen die Suchmaschine für das vereinte Europa«, sagt Winfried Schmitz-Esser, 67, der die Pressedatenbank des Verlagshauses Gruner+Jahr aufgebaut hat. Heute ist er Deutschlands vielleicht ältester Start-up-Unternehmer.

Doch eigentlich geht es ihm um mehr: Schmitz-Esser will beweisen, dass eine Suchmaschine das menschliche Denken widerspiegeln muss.

»Wir bauen eine Brücke zwischen dem Geschriebenen und dem Gemeinten«, sagt er, »eine Art digitalen Dokumentar, den man alles fragen kann.« Seruba soll die Gesamtheit des menschlichen Wissens kartieren und so das Internet sortieren.

Nach anderthalb Jahren Arbeit funktioniert der Prototyp bereits leidlich. Gibt man als Suchwort »Krieg« ein, so erscheinen nicht nur Internet-Links zu verwandten Begriffen wie »menschliche Konflikte« oder »Informationskrieg«, sondern auch Themenvorschläge wie »Terrorismus« oder gar »Friedensverhandlung«.

Bis Dezember soll das Team auf 55 Mitarbeiter aufgestockt werden. Rund 400 000 Einstiegsbegriffe von »Aasfresser« bis »Zyste« will Schmitz-Esser mit einem Team in vier Sprachen innerhalb eines Jahres zusammentragen. »Das wird keine Such-, sondern eine Lernmaschine«, verspricht er. Die meisten Suchmaschinen-Nutzer, wüssten schließlich zu Beginn ihrer Anfrage selbst noch gar nicht, was sie genau suchen: »Mit unserer Lernmaschine dagegen suchen sie nicht nur im Netz, sondern auch in ihrem Innern.« HILMAR SCHMUNDT

Zur Ausgabe
Artikel 131 / 153
Vorheriger Artikel
Nächster Artikel
Die Wiedergabe wurde unterbrochen.