#Big Data

Metadaten für Geheimagent Historix

von , 16.8.13

Metadaten, also Daten über Daten, sind im Zug der NSA-Affäre zunehmend in den Fokus des Interesses geraten. Die ersten Reaktionen aus dem Geheimdienst betonten, dass keine Kommunikationsinhalte gespeichert würden, sondern nur Metadaten. Diese seien ja harmlos. Auch wenn sich dies mittlerweile als Lüge herausgestellt hat, aus Metadaten lassen sich sehr interessante Erkenntnisse gewinnen. Was hingegen Metadaten genau sind, ist schwierig zu definieren. Wie etwa Emin Gün Sirer für die Biologie schön darstellt, sind die Metadaten einer Disziplin häufig die Daten einer anderen.

Metadaten umfassen etwa bei der E-Mail-Kommunikation, wer wann mit wem kommuniziert hat. Auch ohne den Inhalt der Nachrichten zu erfassen, kann man damit erstaunlich gut die Netzwerke einer Gruppe oder eines Menschen analysieren. Es ist immer wieder erstaunlich, wenn man die entsprechenden Tools mal auf sich selbst anwendet. Daraus erkennt man, was technisch möglich ist. Richtige Analysen erfordern natürlich einige technische Kompetenzen, aber es gibt auch Tools, die für Otto Normalanwender zu bedienen sind. Zwei Beispiele:

Musterdaten, Screenshot

Musterdaten, Screenshot

Das Immersion-Projekt des MIT analysiert das eigene Gmail-Postfach und zeigt dabei auf, dass es schon reicht, zu wissen, wer wie häufig mit wem kommuniziert hat, um eine erschreckend genaue Analyse des jeweiligen sozialen Umfeldes zu erhalten.

(Hinweis: Das Tool ist an einer durchaus vertrauenswürdigen Universität angesiedelt, aber trotzdem gibt man jemand anderem Zugriff auf die eigene Mailbox. Alternativ gibt es auch Demo-Daten.)

Musterdaten, Screenshot

Musterdaten, Screenshot

Das eigene soziale Facebook-Netz kann man etwa mit Wolfram Alpha darstellen lassen. Einfach die entsprechende Facebook-App hinzufügen, und schon erhält man ein ebenfalls erschreckend stimmiges Netzwerk seiner Freunde. Man erkennt genau, welche Freunde zusammengehören, welche etwa ehemalige Kommilitonen sind, fein säuberlich nach Haupt- und Nebenfach sortiert, alte Schulfreunde, Arbeitskollegen und sonstige Bekannte. Das sollte jeder einmal machen, um seine eigene Digitalkompetenz zu schärfen – denn wenn die Wolfram App die Daten auslesen kann, dann kann es auch jede andere Facebook-App mit den gleichen Berechtigungen.

Wer selbst Hand anlegen will, kann zu Gephi greifen und die Facebook-Analyse manuell durchführen. Gephi entwickelt sich momentan zu einem der interessantesten Datenanalyse-Programme, und es schadet sicherlich nicht, damit einmal selbst herumzuspielen.

So kritisch dies alles im Kontext der aktuellen NSA-Enthüllungen zu sehen ist, der Historiker in mir freut sich enorm über interessante, neue Methoden.

Wer Mails und Social Networks auswerten kann, kann auch Briefe und Offline-Netzwerke analysieren. Bereits vor einer Weile hat das Stanford-Projekt Mapping the Republic of Letters die Kommunikationsströme frühneuzeitlicher Intellektueller analysiert und dabei erstaunlich interessante Erkenntnisse gewonnen. Die Google Book Ngrams sollten allgemein bekannt sein.

Besonders spaßig ist ein Artikel von Kieran Healy, der als fiktionaler Datenanalyst im Dienst der britischen Krone diese schlimmen steuerverweigernden, terroristischen Separatisten in den nordamerikanischen Kolonien anhand ihrer Mitgliedschaft in diversen Vereinigungen aufdeckt und der Krone dadurch Hinweise auf einige gut vernetzte Aufrührer geben kann. Mit richtiger Datenanalyse wären die USA zu verhindern gewesen!

In dem Sinn unterscheidet sich der Historiker nur wenig vom Geheimagenten. Auch er interessiert sich für politische Umbruchsprozesse, gesellschaftlichen Wandel, die Entscheidungen von Politikern, Machtstrukturen, Netzwerke und die Einstellungen der “normalen” Bevölkerung. Gerade die Digital Humanities mit ihrem Hang zu Big Data sind den modernen Geheimdienstmethoden recht nahe.

Der “herkömmliche” Historiker hingegen verwendet die “alten” Geheimdienstmethoden: Auswertung öffentlicher Quellen wie Zeitungen oder Parlamentsprotokolle, gezielte Beschaffung von Quellen etwa aus Archiven (nur ohne spektakuläre Einbrüche), und natürlich werden auch menschliche Quellen abgeschöpft: Tagebücher, Interviews, persönliche Aufzeichnungen, Schriftwechsel, so etwas nutzen wir gerne – nur auf wilde Schießereien, Abhörkatzen, Martinis und den Sturz fremder Regierungen müssen wir meistens verzichten. Und den verdächtigen Trenchcoat und die Sonnenbrille müssen wir auch im Schließfach der Bibliothek lassen.

Crosspost von Schmalenstroer.net

Zustimmung, Kritik oder Anmerkungen? Kommentare und Diskussionen zu den Beiträgen auf CARTA finden sich auf Twitter und auf Facebook.