Die Datafizierung der Welt

Die Datafizierung der Welt

Auszug aus Frederike Kaltheuner, Nele Obermüller »DatenGerechtigkeit«, Seite 16–25

...

Datenschatten

Wir leben in einer Welt, in der fast alles, was wir tun, Daten generiert. Jedes Mal, wenn wir eine Website besuchen, das Handy benutzen, mit EC- oder Kreditkarte zahlen oder eine Kundenkarte verwenden – all dies erzeugt Daten über das, was wir tun, mit wem wir es tun und wo wir es tun. Bereiche des menschlichen Lebens, die vormals unvermessen und unbestimmt waren – wie zwischenmenschliche Beziehungen oder das, was wir tun, wenn wir Langweile haben – werden zunehmend in computerisierte Daten verwandelt und analysiert. Gleichzeitig verwischen die Grenzen zwischen Online und Offline – wenn sie nicht bereits gänzlich verschwunden sind.

Im Allgemeinen sind sich Menschen bewusst, dass ihr vernetztes Leben Unmengen an Daten generiert, dass sie ei­nen Datenschatten haben. Doch nur wenige kennen die unter­schiedlichen Strategien und Mechanismen, mit denen Daten gesammelt, verarbeitet und produziert werden, und die vie­len Möglichkeiten, diese zu verwenden.

Der Teil des Datenschattens, den die meisten Menschen wohl am ehesten überblicken, sind die Informationen, die sie sozusagen bewusst erstellen – wenn sie zum Beispiel ein Foto auf Instagram teilen, eine Amazon-Rezension schreiben oder eine E-Mail verschicken. Wir »sehen« diesen Teil unseres Da­tenschattens, wie wir die Spitze eines Eisbergs sehen. Doch wie bei einem Eisberg liegt unter dieser Spitze ein sehr viel größerer, unsichtbarer Körper. Dieser Datenkörper umfasst auch Informationen über uns, die automatisch gesammelt und erfasst werden: Metadaten, Transaktions- oder Verhaltensdaten. Dazu gehören der Browserverlauf, Standortdaten, Ge­räteinformationen (wie zum Beispiel Gerätekennung, Betriebssystem- oder App-Versionen), Daten darüber, wie man sein Telefon bewegt und ob man es regelmäßig auflädt. Forscher der Princeton Universität haben gezeigt, dass 482 der beliebtesten Webseiten im Netz mithilfe von sogenannten Session-replay Scripts alles, was eine Person auf einer Web­seite tippt oder anklickt, aufzeichnen. Diese vielen Daten werden üblicherweise zu Analyse- und Werbezwecken ge­sammelt, doch Unternehmen machen sie sich immer wie­der sehr geschickt zunutze. So hat eine Werbefirma aus Massachusetts im Auftrag einer christlichen Organisation eine Technik namens »Mobile Geofencing« verwendet, um die Handys von Frauen in Abtreibungskliniken zu identifizie­ren, und diesen Frauen dann, während sie im Warteraum sa­ßen, Anti-Abtreibungs-Werbung auf ihrem Smartphone ge­zeigt. Die offizielle App der spanischen Fußballliga aktivierte Medienberichten zufolge die Handy-Mikrofone der Fans während der Spiele, um unlizenzierte Übertragungen an öf­fentlichen Plätzen, wie Bars und Restaurants, aufzuspüren.

»In einer zunehmend vernetzten Welt generieren wir Daten, während wir arbeiten und uns entspannen, während wir denken und fühlen, uns sportlich betätigen oder schlafen.«

Es ist unglaublich schwierig – wenn nicht unmöglich –, sich vor kommerzieller Überwachung zu schützen. In einer zunehmend vernetzten Welt generieren wir Daten, während wir arbeiten und uns entspannen, während wir denken und fühlen, uns sportlich betätigen oder schlafen. Die meisten Daten, die über uns gesammelt werden, erwecken den An­schein, anonym zu sein. Es wird aber immer leichter, Indivi­duen über unterschiedliche Geräte hinweg zeitlich und räum­lich zu verfolgen, so dass sich mehr und mehr Datenspuren zu einer unverwechselbaren Identität verknüpfen lassen. Diejenigen, die sorgsam darauf achten, was sie online tun, glauben vielleicht, dass Werbetreibende und Unternehmen zumindest keine intimen Details über sie kennen. Doch auch scheinbar bedeutungslose Datenpartikel können, wenn sie kombiniert werden, intime Einblicke preisgeben.

Die Einblicke, die aus Online-Daten gewonnen werden können, sind einen großen Schritt vorangekommen, nach­dem Facebook am 9. Februar 2009 den »Like-Button« (»Ge­fällt mir«) einführte. Wenn eine Facebook-Nutzerin etwas »liked«, fühlt es sich für sie so an, als würde sie lediglich mit ihren Freunden kommunizieren. Und auf der Oberfläche tut sie das auch. Doch es gibt einen weiteren, verborgenen Zweck dieser Funktion. »Likes« zeigen Facebook und werbe­treibenden Unternehmen, dass sich Nutzer wahrscheinlich auch in Zukunft für vergleichbare Inhalte interessieren.

Mehr noch: 2013 zeigten der Psychologe David Stillwell und der Autor des »Gay Faces«-Papers, Michal Kosinski, da­mals beide an der Universität Cambridge, dass man aus Facebook-Likes intime Informationen wie sexuelle Orientierung, ethnische Zugehörigkeit, religiöse und politische Ansichten, Intelligenz, Glücksempfinden oder Drogenkonsum voraussa­gen kann, oder gar, ob man aus einem geschiedenen Eltern­haus kommt. Für ihre Studie sammelten die beiden Forscher Facebook-Daten von 58.000 Teilnehmern, von denen mehrere auch IQ- und Persönlichkeitstests ausfüllten. Diese Daten wurden in einen Algorithmus eingespeist, der Muster und Korrelationen extrahierte. Anhand dieser Korrelationen wur­de zum Beispiel erkennbar, dass die besten Indikatoren für hohe Intelligenz waren, wenn jemand Seiten für »Gewitter­stürme«, »The Colbert Report«, »Science« oder »Curly Fries« geliked hatte. Hinweise auf männliche Homosexualität boten Likes für »Mac Cosmetics« und »Wicked – The Musical«. We­niger als fünf Prozent der Teilnehmer, die als schwul identi­fiziert wurden, hatten Inhalte geliked, die ausdrücklich mit Homosexualität in Verbindung standen. Mit anderen Worten: Obwohl manche dieser Personen vielleicht sogar bewusst In­halte vermieden hatten, die intime Informationen über ihre Sexualität preisgeben würden, ließ sich ihre sexuelle Orientierung aus ihren Likes prognostizieren. Kosinski und Stillwell nannten ihre Studie: »Private traits and attributes are predictable from digital records of human behaviour«.

Das Paper sorgte für erhebliche Aufmerksamkeit, und im Jahr 2015 führten die zwei Forscher eine Folgestudie durch. Diesmal baten sie über eine App namens myPerso­nality insgesamt 86.220 Freiwillige, auf Facebook einen 100-Punkte-Persönlichkeitsfragebogen auszufüllen, wobei die Studienteilnehmer auch Zugang zu ihren Facebook-Likes gewährten. Der Fragebogen erfasste die Persönlichkeit der Probanden anhand des Fünf-Faktoren-Modells, das die Per­sönlichkeit entlang von fünf Eigenschaften (Offenheit, Ge­wissenhaftigkeit, Extraversion, Verträglichkeit und Neuro-tizismus) misst. Dadurch konnten Kosinski und Stillwell fest­stellen, welche Likes besonders häufig mit bestimmten Ei­genschaften korrelierten. So offenbarte zum Beispiel ein Like für »Salvador Dalí« oder »Meditation« ein hohes Maß an Offenheit. Ein Like für den Realitysoap-Star Snooki oder »Tanzen« ging einher mit Extraversion. Nutzer der myPersonality-App erhielten außerdem die Möglichkeit, Freunde und Familienmitglieder zu einer verkürzten Version des Persönlichkeitstests einzuladen, um ihre Persönlichkeit auch von diesen bewerten zu lassen.

Dieses Vorgehen ermöglichte es den Forschern, die Ge­nauigkeit von computergestützten Persönlichkeitsprognosen mit menschlichen Einschätzungen zu vergleichen. Sie stellten fest, dass ihr computerbasiertes Profil nach nur zehn analy­sierten Likes die Persönlichkeit besser vorhersagen konnte als ein Arbeitskollege; dass die Einschätzung anhand von 70 Li­kes genauer war als die eines Freundes oder Mitbewohners; mit 150 Likes war sie besser als die eines Familienmitglieds (Eltern oder Geschwister) und mit 300 sogar treffender als die des Ehepartners. Vor dem Hintergrund, dass ein durchschnittlicher Facebook-Nutzer im Jahr 2015 bereits auf 227 Likes kam (diese Zahl ist seitdem weiter angestiegen), gaben Kosinski und Stillwell ihrer Studie den Titel »Computerbased perso­nality judgments are more accurate than those made by hu­mans«. Wie schon die Studie aus dem Jahre 2013 erregte auch dieses Paper großes Aufsehen und führte zu Schlagzei­len wie »Facebook kennt dich besser als alle anderen«, oder »Facebook kennt dich besser als deine Familie«.

»Sogar unsere Tippmuster auf Tastaturen können dazu verwendet werden, unsere emotionale Verfas­sung einschließlich Selbstvertrauen, Nervosität, Traurigkeit und Müdigkeit zu entschlüsseln.«

Seither wurden viele weitere Möglichkeiten entwickelt, um aus unseren Datenspuren unsere Persönlichkeit, Eigen­schaften und andere Merkmale vorherzusagen. So prognos­tizieren Forscher die Persönlichkeitsstruktur von Menschen aus den von ihnen auf Instagram verwendeten Filtern oder aus ihren Tweets. Sogar unsere Tippmuster auf Tastaturen können dazu verwendet werden, unsere emotionale Verfas­sung einschließlich Selbstvertrauen, Nervosität, Traurigkeit und Müdigkeit zu entschlüsseln. All dies markiert eine grundlegende Veränderung in der Persönlichkeitsbewertung: In der Vergangenheit mussten Psychologen in der Persön­lichkeitsforschung aufwendig nach Teilnehmern suchen, de­ren Zustimmung einholen und ihnen speziell entwickelte Tests zum Ausfüllen aushändigen. Die Teilnehmer waren sich der Tatsache bewusst, dass sie beurteilt wurden, und partizipierten aktiv an dem Experiment. Heutzutage kann unsere Persönlichkeit ohne unsere Beteiligung oder gar ohne unsere Kenntnis prognostiziert werden. Sobald jemand Zu­gang zu einer ausreichenden Menge an Daten und den not­wendigen computergestützten Werkzeugen und Fachkennt­nissen hat, kann dieser aus mehr oder weniger belanglosen Daten intime Merkmale und Eigenschaften vorhersagen. Das heißt, Mobilfunkbetreiber, Vertriebsgesellschaften, Daten­broker und Sicherheitsbehörden können an vertrauliches Wis­sen über ihre Kunden, Wettbewerber oder Bürger gelangen.

Und auch wir können dies tun: Heutzutage kann jeder von uns mithilfe einfach zugänglicher Tools Profile über an­dere erstellen. 2014 wurde das US-amerikanische Start-up CrystalKnows gegründet, das verspricht, »dir zu helfen, dich selbst, deine Mitarbeiter und deine Kunden zu verstehen«. Wie es auf seiner Webseite erklärt, nutzt das Unternehmen »Informationen, die Nutzer freiwillig im Internet veröffent­licht haben«, und beurteilt gemäß des DISC Personality Pro­file Assessments, eines auf Selbstbeschreibung beruhenden Persönlichkeitstests, individuelle Persönlichkeit und Kom­munikationsstil. Hat man die Browsererweiterung instal­liert, zeigt die Software eine ganze Akte über die eigenen LinkedIn- oder Google-Mail-Kontakte. Bei mir selbst gestal­tete sich das folgendermaßen: CrystalKnows glaubt, dass »Frederike dazu neigt, direkt, aufgabenorientiert, schnell und starren Strukturen gegenüber abweisend zu sein«. In Hinblick auf einen meiner Kollegen hieß es: »Wenn du ihn triffst, behandle ihn wie einen Freund. Fange mit Smalltalk und einer persönlichen Unterhaltung an, bevor du zur Sache kommst. Gib ihm Zeit für ein Brainstorming oder dafür, laut zu denken, denn zu viel Struktur im Meeting könnte dazu führen, dass er das Interesse verliert. Schließe mit einer kur­zen, freundlichen Zusammenfassung deiner Hauptargumente und der wichtigsten besprochenen Punkte ab.« Der be­sagte Kollege hat CrystalKnows keinerlei Zustimmung gegeben, ein Profil über ihn zu erstellen. Allerdings fanden sich E-Mails von ihm in meinem Postfach. Ebenso erlaubte mir CrystalKnows Zugriff zu ähnlich ausführlichen Profilen von Menschen, die ich zwar kaum kenne, mit denen ich aber über das Karrierenetzwerk LinkedIn vernetzt bin. Als ich ei­ner Kollegin mein CrystalKnows-Profil zeigte, meinte sie, dass es zwar »grob gezeichnet«, aber »im Großen und Gan­zen richtig« sei.

CrystalKnows ist nur ein Beispiel einer ganzen Reihe von Anbietern, die Persönlichkeitsprofile erstellen. IBMs »Watson Tone Analyzer« wie auch »Analyze Words« erken­nen emotionale Befindlichkeiten und Persönlichkeitszüge anhand von Tweets und anderen öffentlich zugänglichen Texten. VisualDNA, ein britisches, auf Online-Persönlich­keitsquiz spezialisiertes Unternehmen, hat sich unter ande­rem mit einer Versicherungsfirma zusammengeschlossen, um zu ermitteln, welche Klienten Persönlichkeitsmerkmale aufweisen, die auf riskantes Fahrverhalten hindeuten könnten.

»Wir werden durch Datafizierung porös gemacht, wir zerfallen in eine Vielzahl von Profilen, die uns als Konsumenten, Angestellte oder Nutzerinnen verlinken.«

Unsere Daten, unser Selbst

Es ist zweifelhaft, ob ein Datenprofil jemals vollständig das chaotische, gebündelte Durcheinander eines menschlichen Charakters erfassen kann. Dennoch haben die aus Daten­schatten und computergestützten Persönlichkeitsprognosen gewonnenen Profile den augenscheinlichen Vorteil, uns be­rechenbar, identifizierbar und mit anderen vergleichbar erscheinen zu lassen. Das, was nicht messbar ist – eine Per­son –, wird messbar gemacht. Auf diese Weise werden wir durch Datafizierung porös gemacht, wir zerfallen in eine Vielzahl von Profilen, die uns als Konsumenten, Angestellte oder Nutzerinnen verlinken. Für das komplexe, kommerzi­elle Datenökosystem sind die Datenversionen unseres Selbst somit ausgesprochen nützlich.

Wie beschrieben, wird ein Großteil unserer Datenschat­ten produziert und beobachtet und nicht einfach nur gesam­melt. Im öffentlichen Diskurs werden digitale Daten jedoch häufig als »Rohstoffe« begriffen – beispielsweise in dem oft wiederholten Satz: »Daten sind das neue Öl.« Folgt man diesem positivistischen Verständnis, sind Daten anders als Wörter. Wörter müssen ausgewählt und interpretiert werden, sie haben unabhängig von ihrem Kontext keinen absoluten Wert. Die Semiotik gibt uns zu verstehen, dass in der ge­sprochenen Sprache immer eine Lücke zwischen einem Wort (der Signifikant) und dem Objekt, auf das es sich be­zieht (das Signifikat) klafft. Wenn ich sage »Stuhl«, wird der Stuhl, den ich mir vorstelle, sich höchstwahrscheinlich von dem Stuhl unterscheiden, an den jemand anderes denkt. Die Lücke zwischen dem Signifikat und dem Signifikant schafft also Raum für Interpretation. Im Gegensatz dazu werden digitale Daten oft so behandelt, als wären sie der Auslegung gegenüber blind. Wie die Rechtsphilosophin Antoinette Rouvroy argumentiert, tendieren wir im Sinne der positivistischen Perspektive dazu, Daten als eine ob­jektive Repräsentation der tatsächlichen Welt wahrzuneh­men. Wir nehmen an, dass Daten für sich sprechen und dass Big-Data-gestützte Analysen umgekehrt der realen Welt zum Ausdruck verhelfen können – in einer Sprache, die der Worte beraubt und deshalb von Interpretation be­freit ist.

...

In der Praxis funktionieren die Datenspuren, die wir in vernetzten Räumen hinterlassen, beinahe wie Fußabdrücke, denen man folgen kann. Wir werden belauert und gestalkt, wobei die gewonnenen Einsichten häufig als »unheimlich« oder »orwellsch« bezeichnet werden.