• Drucken
  • Senden
  • Feedback
21.10.2005
 

Datenanalyse

Die Lieblingssoftware der Geheimdienste

Von Johannes Klostermeier

Um Unternehmen die Analyse von E-Mails und Textdokumenten zu erleichtern, entwickelte eine britische Firma eine Spezialsoftware, die Bedeutungsmuster erkennen kann. Das Programm wurde zum Liebling der Geheimdienste.

Normale Nutzer kennen den Namen dieser Software-Firma nicht, denn ihre Produkte sind mit durchschnittlich 350.000 Dollar je Installation ausgesprochen teuer. Doch mehr als 1000 Firmenkunden - darunter große Namen wie BP, AstraZeneca, DaimlerChrysler, CNN, General Electric, Siemens, Philip Morris und Nestlé - fanden die Kosten nicht zu hoch. Und seit den Anschlägen am 11. September 2001 verzeichnet das britische Unternehmen Autonomy steigende Nachfrage aus einer unerwarteten Ecke: von Geheimdiensten und anderen Sicherheitsbehörden.

Geheimdienstmitarbeiter: E-Mails und Telefonate in Echtzeit überwachen
Zur Großansicht
2002 United States Secret Service

Geheimdienstmitarbeiter: E-Mails und Telefonate in Echtzeit überwachen

"Geheimdienste wollen Dinge wissen, von denen sie nichts wissen. Und von denen sie nicht wissen, wie sie danach suchen sollen", sagt Ian Black, Managing Director der Autonomy-Tochter Aungate. Tatsächlich kann ihnen dabei geholfen werden: Die Analyse-Software durchsucht automatisch große Mengen unstrukturierter Daten wie E-Mails und Telefongespräche unabhängig von der Sprache und erkennt die Kernaussage des Materials.

Wichtig in diesem Zusammenhang: Nach Schätzungen liegen nur 20 Prozent aller verfügbaren Daten strukturiert in Datenbanken vor, alle anderen sind unstrukturiert und deswegen von normalen Suchroutinen kaum zu erfassen und zu verarbeiten.

Das Herzstück des Programms bildet die Dynamic Reasoning Engine (DRE). Die Technologie mit Big-Brother-Bezug kann die Bedeutung von Texten anhand der Häufigkeit und der Beziehungen der Begriffe zueinander bestimmen. Sie analysiert dabei keine Schlüsselwörter, sondern die in den Daten enthaltenen Konzepte, erstellt Bedeutungsmuster und stellt Verbindungen zwischen den Informationen her.

Theoretische Grundlage dafür ist die Arbeit des englischen Mathematikers und Pastors Thomas Bayes aus dem 18. Jahrhundert über die Verknüpfung von Ereigniswahrscheinlichkeiten. Mittels daraus abgeleiteter komplexer Algorithmen zur Mustererkennung untersuchen "Konzept-Agenten" nach einem vorherigen Training die Daten.

So kann Autonomy erkennen, ob mit dem Wort "Hamburger" ein Norddeutscher, ein Hackfleischbrötchen - oder eine terroristische Zelle gemeint ist. "Die Nachrichtendienste haben 1000 Menschen, die fremde Sprachen beherrschen, doch niemand hat vor dem 11. September nach Begriffen wie Flugzeug und Pilot gesucht", sagt Laura Ramos, Analystin beim Beratungshaus Forrester Research.

Unternehmen mit sensiblen Informationen bietet Autonomy an, E-Mails, Telefonate, Messaging-Systeme und den Webzugang der Mitarbeiter in Echtzeit zu überwachen. "Wenn ein Analyst einer Bank Nachrichten verschicken möchte, können unsere Systeme schon beim Erstellen der Mails prüfen, ob der Empfänger diese Informationen erhalten darf - oder ob diese Nachricht gegen die Compliance-Policy des Arbeitgebers verstößt", sagt Black.

Doch der größte Anwender ist heute das nach den Anschlägen 2001 gegründete Department of Homeland Security der USA. Ende 2002 schloss die Regierung einen Vertrag mit den Briten, deren Software seitdem einen Datenpool der US-Anti-Terror- Einrichtungen auf Schlüsselfiguren, versteckte Botschaften und Trends analysiert. Auch die Polizei in London untersuchte nach den dortigen Terroranschlägen Anfang Juli jeglichen E-Mail-Verkehr auf auffällige Muster, um eine Spur zu den Tätern zu finden.

Mittlerweile sollen etwa 30 Prozent der Autonomy-Umsätze von Nachrichtendiensten stammen. Beim Unternehmen selbst möchte niemand offen über dieses gute Geschäft sprechen - es könne dem guten Ruf schaden, heißt es. "Wir hatten nicht vor, eine Software für Geheimdienste zu entwickeln", sagt ein Mitarbeiter, "aber sie hat nun einmal die einzigartige Fähigkeit, den Sinn von Daten zu verstehen."

© Technology Review, Heise Zeitschriften Verlag, Hannover

Diesen Artikel...

Aus Datenschutzgründen wird Ihre IP-Adresse nur dann gespeichert, wenn Sie angemeldeter und eingeloggter Facebook-Nutzer sind. Wenn Sie mehr zum Thema Datenschutz wissen wollen, klicken Sie auf das i.

Auf anderen Social Networks posten:

  • studiVZ meinVZ schülerVZ
  • deli.cio.us
  • Xing
  • Digg
  • Google Bookmarks
  • reddit
  • Windows Live

News verfolgen

HilfeLassen Sie sich mit kostenlosen Diensten auf dem Laufenden halten:

alles aus der Rubrik Netzwelt
alles aus der Rubrik Tech

© SPIEGEL ONLINE 2005
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH









TOP



TOP