Big Data, oder: Davon, den Heuhaufen zu vergrößern in der Hoffnung, die Nadel besser zu finden.

Was tun Firmen, die mehr über Ihre potenziellen Kunden wissen wollen, aber nicht auf die Idee kommen, dass man mit denen sprechen kann (Na toll, jetzt hab ich die Pointe schon wieder direkt am Anfang verraten)? Sie stalken sie, indem sie möglichst viele Daten über sie sammeln.

Vorratsdatenspeicherung fängt keine Verbrecher...

(Falls Sie sich gerade fragen: "Was will er denn jetzt mit Vorratsdaten?" - Bleiben Sie kurz bei mir, ich komme gleich zurück zum Thema.)

Eigentlich ist zur Genüge erwiesen, dass die Vorratsdatenspeicherung Verbrechen weder verhindert noch zur Aufklärung beiträgt. Der letzte Beweis dafür waren die Anschläge in Paris: In Frankreich gibt es Vorratsdatenspeicherung (sogar über 2 Jahre!), außerdem waren die Attentäter schon der Polizei bekannt und sie waren auch schon auf diversen Beobachtungslisten. Dennoch wußte offenbar niemand, was sie vorhatten.

Seltsamerweise verlangen aber dennoch reflexartig alle möglichen Innenminister die Rückkehr zur Vorratsdatenspeicherung. Warum nur?

Aus zwei Gründen:
Erstens, weil sie glauben, sichtbar auf das Geschehene "reagieren" zu müssen, um dem Vorwurf zu entgehen, dass man nichts tue, um die Sicherheit der Bürger zu gewährleisten.

Zweitens, weil man die Gelegenheit nicht vorübergehen lassen will, eine Maßnahme, die keine Mehrheit findet, unter dem Vorwand der Terrorbekämpfung vielleicht doch durchzukriegen. Das klappt ja oft genug, allerdings ist die Vorratsdatenspeicherung inzwischen doch ein paar mal zu oft aus der Schublade gezogen worden und wir brauchen uns nicht allzu große Sorgen machen - ein Taschenspielertrick, der zwei mal gescheitert ist, funktioniert beim dritten mal nur noch schlechter.

...Menschen tun es.

Dass man Verbrechen, Terrorismus, Pädophilie und all die anderen Themen, die gerne zur Begründung der Vorratsdatenspeicherung herhalten müssen, auch und viel besser bekämpfen könnte, wenn man die Anzahl, die Arbeitsbedingungen, die Kompetenz und die Ausstattung von Polizisten verbessert steht in denselben Untersuchungen, die die Wirkungslosigkeit von Datensammlungen zeigen.

Denn Verbrechen werden am effektivsten durch gute Polizeiarbeit, also von Menschen, aufgeklärt.

Worum es bei der Vorratsdatenspeicherung tatsächlich geht, ist Kontrolle von Kommunikation und uns Bürger an den Zustand des kontrolliert werdens zu gewöhnen.

(Womit wir wieder beim Thema wären.)

Die Fähigkeit des Menschen, Zusammenhänge zu verknüpfen und ihre Erfahrungen auf einem Gebiet in viele andere Gebiete zu übertragen ist nicht programmierbar. Anfang der 2000er Jahre erklärte die Wissenschaft, dass die Erschaffung von künstlicher Intelligenz - im Sinne eines sich selbst wahrnehmenden und sich selbst weiterentwickelnden Bewusstseins - in absehbarer Zukunft nicht möglich sein wird, denn was man mit Daten und Funktionen erreichen kann sind lediglich zuvor festgelegte Reaktionen auf zuvor gesammelte und kombinierte Einzelinformationen.

Das ist, was Big Data kann: Daten erfassen und Kombinationen errechnen, um weitere Daten zu generieren.

Klar, das ist schon mal nicht schlecht und man denkt sich jede Menge sinnvolle (und weniger sinnvolle) Berechnungen aus, denen dann sinnvolle (und weniger sinnvolle) Auswertungen folgen. Aber schon beim Finden von Zusammenhängen scheitern Algorithmen kläglich, denn die Interpretation - also das herausfinden von echten Erkenntnissen, die diese Auswertungen in gewinnbringenden Entscheidungen transformieren - liegt schon wieder und alleine beim Menschen.

Also kein Big Data?

Doch, natürlich. Aber mit der richtigen Einordnung: Datenanalysen helfen uns, Zusammenhängen auf die Spur zu kommen, die wir bisher nur vermutet haben. Zum Beispiel ist die Frage beantwortet, warum in den USA Anfang der Achtziger Jahre von einem Tag auf den anderen familiäre Amokläufe aufgehört haben: Der Grund war, dass Blei in Wandfarbe verboten wurde und quasi über Nacht nicht mehr verwendet wurde. Dieses Blei hatte offenbar die Fähigkeit, Hirnschäden hervorzurufen, die Aggressionen verursachten und eine groß angelegte Datenanalyse hat diesen Zusammenhang erst vor kurzer Zeit bestätigen können.

Was man aber auch wissen muss: Die Daten dazu gab es schon lange. Die Frage, warum brutale Familiendramen zurückgegangen sind, stellte man sich auch schon lange. Man suchte aber an den falschen Stellen: In der Psychologie, in der Soziologie, man untersuchte Strahlung, Radiowellen, Krankheitsverbreitungen. Erst als jemand auf die Idee kam, es könnte etwas mit der veränderten Zusammensetzung der weißen Wandfarbe zu tun haben, hat man überhaupt mal die richtigen Daten zuammengebracht und direkt einen 100% schlüssigen Beweis erbracht.

Und genau das ist, was sich zum Beispiel Innenminister von Big Data und Vorratsdaten erhoffen: Daten aller Art auf Halde zu sammeln, um irgendwann in Zukunft eine Idee oder These verifizieren oder einen Zusammenhang nachprüfen zu können, an den man heute noch nicht denkt.

Dass man damit großes Schindluder betreiben kann und dass ich deshalb kein Freund von ungeregelter Datensammelei bin, liegt auf der Hand, das soll aber jetzt nicht das Thema sein. Was ich sagen will, ist:

Für die Kommunikation sind Daten stumpfe Werkzeuge

Das Ziel von Big Data in Unternehmen ist ja nicht, bahnbrechende und neue wissenschaftliche Erkenntnisse zu erreichen oder interessante Theorien zu beweisen. Das Ziel von Unternehmen ist es, Menschen Produkte zu verkaufen.

Dafür werden Profile erstellt und mit allen möglichen Daten angereichert die dazu beitragen, unsere Vorlieben zu ermitteln, herauszufinden wo wir wann anzutreffen sind und uns dann im geeigneten Moment mit der geeigneten Kommunikation ein Produkt anzubieten, das wir dann kaufen.

Zumindest in der Theorie. Das Buzzword dazu heißt "Predictive Analysis".

Die Theorie beinhaltet auch Erklärungen für ein eventuelles Scheitern: Zu wenige Daten oder ein Fehler in der Konfiguration der Auswertung. So ist die Optimierung immer damit verbunden, mehr, vollständigere und bessere Daten zu finden und zu versuchen, die Daten zum Sprechen zu bringen...

...anstatt mit den eigentlichen Menschen zu sprechen, denen man sein Produkt verkaufen möchte.

Wenn man mal ein paar Schritte zurückgeht und sich mal von weitem anschaut, was man da eigentlich tut, stellt sich doch die Frage: Wie seltsam und wie unglaublich aufwändig ist es denn, zu versuchen, dem Auswertungsalgorithmus für eine Datensammlung beizubringen, das Verhalten von Menschen einzuschätzen? Etwas, was Menschen ganz von sich aus jederzeit schneller, besser, exakter und persönlicher tun, sobald sie mit anderen Menschen interagieren? Weil Menschen das ja normalerweise ganz gut von sich aus können und man ihnen nicht erst die entsprechenden Fähigkeiten zur Interpretation beibringen muss.

Was Algorithmen nämlich nicht wissen, und zwar weil diese Information nirgends gespeichert ist: warum jemand etwas tut. Und das ist eben das Problem: Für alles, was ein Mensch tut, hat er einen Grund. So klicke ich ein mal bei Amazon einen Rasenmäher an und schon glauben alle Algorithmen, ich hätte einen Garten. Hab ich aber nicht. Ich habe in einem Text einen Rasenmäher beschreiben wollen und da ich eben keinen Garten habe und absolut keine Ahnung von Gartenarbeit, hab ich mir die Informationen geholt, die ich brauchte, um glaubhaft über die Bedienung eines Rasenmähers schreiben zu können. Welcher Algorithmus hätte das erraten können?

Die Annahme, dass man Einblicke in die Persönlichkeit einzelner Menschen erhält, indem man auf eine wie auch immer große Menge Daten starrt, die man heimlich und weniger heimlich gesammelt, gekauft und erhoben hat indem man Menschen verfolgt, Datenhändler bezahlt und Nutzer bittet oder nötigt, private Informationen preiszugeben ist somit eine sehr teure Illusion.

Sie ist aber nichtsdestotrotz beliebt, denn zum Einen glaubt man, solche Auswertungen seien neutral, exakt und unparteiisch. Was zwei unschlagbare Vorteile bringt (also der Glaube daran, denn neutral ist das freilich nicht. Abgebildet wird im Ergebnis ja auch nur eine zuvor getroffene Annahme): Das Budget ist gerechtfertigt und niemand ist persönlich verantwortlich.

Zum anderen hat man es geschafft, sich wieder nicht direkt mit den Kunden auseinandersetzen zu müssen. Stattdessen bekomme ich immer noch regelmäßig Werbung für Gartengeräte.

--

Ich musste eine Weile überlegen, wo ich das Heuhaufen-Bild gehört habe, das ich in die Überschrift für diesen Artikel verwandelt habe. Inzwischen ist es mit wieder eingefallen: Das war im grundsätzlich immer hörenswerten Podcast Netzpolitik Logbuch.