Die Datafizierung der Welt

...

Datenschatten

Wir leben in einer Welt, in der fast alles, was wir tun, Daten generiert. Jedes Mal, wenn wir eine Website besuchen, das Handy benutzen, mit EC- oder Kreditkarte zahlen oder eine Kundenkarte verwenden – all dies erzeugt Daten über das, was wir tun, mit wem wir es tun und wo wir es tun. Bereiche des menschlichen Lebens, die vormals unvermessen und unbestimmt waren – wie zwischenmenschliche Beziehungen oder das, was wir tun, wenn wir Langweile haben – werden zunehmend in computerisierte Daten verwandelt und analysiert. Gleichzeitig verwischen die Grenzen zwischen Online und Offline – wenn sie nicht bereits gänzlich verschwunden sind.

Im Allgemeinen sind sich Menschen bewusst, dass ihr vernetztes Leben Unmengen an Daten generiert, dass sie einen Datenschatten haben. Doch nur wenige kennen die unterschiedlichen Strategien und Mechanismen, mit denen Daten gesammelt, verarbeitet und produziert werden, und die vielen Möglichkeiten, diese zu verwenden.

Der Teil des Datenschattens, den die meisten Menschen wohl am ehesten überblicken, sind die Informationen, die sie sozusagen bewusst erstellen – wenn sie zum Beispiel ein Foto auf Instagram teilen, eine Amazon-Rezension schreiben oder eine E-Mail verschicken. Wir »sehen« diesen Teil unseres Datenschattens, wie wir die Spitze eines Eisbergs sehen. Doch wie bei einem Eisberg liegt unter dieser Spitze ein sehr viel größerer, unsichtbarer Körper. Dieser Datenkörper umfasst auch Informationen über uns, die automatisch gesammelt und erfasst werden: Metadaten, Transaktions- oder Verhaltensdaten. Dazu gehören der Browserverlauf, Standortdaten, Geräteinformationen (wie zum Beispiel Gerätekennung, Betriebssystem- oder App-Versionen), Daten darüber, wie man sein Telefon bewegt und ob man es regelmäßig auflädt. Forscher der Princeton Universität haben gezeigt, dass 482 der beliebtesten Webseiten im Netz mithilfe von sogenannten Session-replay Scripts alles, was eine Person auf einer Webseite tippt oder anklickt, aufzeichnen. Diese vielen Daten werden üblicherweise zu Analyse- und Werbezwecken gesammelt, doch Unternehmen machen sie sich immer wieder sehr geschickt zunutze. So hat eine Werbefirma aus Massachusetts im Auftrag einer christlichen Organisation eine Technik namens »Mobile Geofencing« verwendet, um die Handys von Frauen in Abtreibungskliniken zu identifizieren, und diesen Frauen dann, während sie im Warteraum saßen, Anti-Abtreibungs-Werbung auf ihrem Smartphone gezeigt. Die offizielle App der spanischen Fußballliga aktivierte Medienberichten zufolge die Handy-Mikrofone der Fans während der Spiele, um unlizenzierte Übertragungen an öffentlichen Plätzen, wie Bars und Restaurants, aufzuspüren.

»In einer zunehmend vernetzten Welt generieren wir Daten, während wir arbeiten und uns entspannen, während wir denken und fühlen, uns sportlich betätigen oder schlafen.«

Es ist unglaublich schwierig – wenn nicht unmöglich –, sich vor kommerzieller Überwachung zu schützen. In einer zunehmend vernetzten Welt generieren wir Daten, während wir arbeiten und uns entspannen, während wir denken und fühlen, uns sportlich betätigen oder schlafen. Die meisten Daten, die über uns gesammelt werden, erwecken den Anschein, anonym zu sein. Es wird aber immer leichter, Individuen über unterschiedliche Geräte hinweg zeitlich und räumlich zu verfolgen, so dass sich mehr und mehr Datenspuren zu einer unverwechselbaren Identität verknüpfen lassen. Diejenigen, die sorgsam darauf achten, was sie online tun, glauben vielleicht, dass Werbetreibende und Unternehmen zumindest keine intimen Details über sie kennen. Doch auch scheinbar bedeutungslose Datenpartikel können, wenn sie kombiniert werden, intime Einblicke preisgeben.

Die Einblicke, die aus Online-Daten gewonnen werden können, sind einen großen Schritt vorangekommen, nachdem Facebook am 9. Februar 2009 den »Like-Button« (»Gefällt mir«) einführte. Wenn eine Facebook-Nutzerin etwas »liked«, fühlt es sich für sie so an, als würde sie lediglich mit ihren Freunden kommunizieren. Und auf der Oberfläche tut sie das auch. Doch es gibt einen weiteren, verborgenen Zweck dieser Funktion. »Likes« zeigen Facebook und werbetreibenden Unternehmen, dass sich Nutzer wahrscheinlich auch in Zukunft für vergleichbare Inhalte interessieren.

Mehr noch: 2013 zeigten der Psychologe David Stillwell und der Autor des »Gay Faces«-Papers, Michal Kosinski, damals beide an der Universität Cambridge, dass man aus Facebook-Likes intime Informationen wie sexuelle Orientierung, ethnische Zugehörigkeit, religiöse und politische Ansichten, Intelligenz, Glücksempfinden oder Drogenkonsum voraussagen kann, oder gar, ob man aus einem geschiedenen Elternhaus kommt. Für ihre Studie sammelten die beiden Forscher Facebook-Daten von 58.000 Teilnehmern, von denen mehrere auch IQ- und Persönlichkeitstests ausfüllten. Diese Daten wurden in einen Algorithmus eingespeist, der Muster und Korrelationen extrahierte. Anhand dieser Korrelationen wurde zum Beispiel erkennbar, dass die besten Indikatoren für hohe Intelligenz waren, wenn jemand Seiten für »Gewitterstürme«, »The Colbert Report«, »Science« oder »Curly Fries« geliked hatte. Hinweise auf männliche Homosexualität boten Likes für »Mac Cosmetics« und »Wicked – The Musical«. Weniger als fünf Prozent der Teilnehmer, die als schwul identifiziert wurden, hatten Inhalte geliked, die ausdrücklich mit Homosexualität in Verbindung standen. Mit anderen Worten: Obwohl manche dieser Personen vielleicht sogar bewusst Inhalte vermieden hatten, die intime Informationen über ihre Sexualität preisgeben würden, ließ sich ihre sexuelle Orientierung aus ihren Likes prognostizieren. Kosinski und Stillwell nannten ihre Studie: »Private traits and attributes are predictable from digital records of human behaviour«.

Das Paper sorgte für erhebliche Aufmerksamkeit, und im Jahr 2015 führten die zwei Forscher eine Folgestudie durch. Diesmal baten sie über eine App namens myPersonality insgesamt 86.220 Freiwillige, auf Facebook einen 100-Punkte-Persönlichkeitsfragebogen auszufüllen, wobei die Studienteilnehmer auch Zugang zu ihren Facebook-Likes gewährten. Der Fragebogen erfasste die Persönlichkeit der Probanden anhand des Fünf-Faktoren-Modells, das die Persönlichkeit entlang von fünf Eigenschaften (Offenheit, Gewissenhaftigkeit, Extraversion, Verträglichkeit und Neuro-tizismus) misst. Dadurch konnten Kosinski und Stillwell feststellen, welche Likes besonders häufig mit bestimmten Eigenschaften korrelierten. So offenbarte zum Beispiel ein Like für »Salvador Dalí« oder »Meditation« ein hohes Maß an Offenheit. Ein Like für den Realitysoap-Star Snooki oder »Tanzen« ging einher mit Extraversion. Nutzer der myPersonality-App erhielten außerdem die Möglichkeit, Freunde und Familienmitglieder zu einer verkürzten Version des Persönlichkeitstests einzuladen, um ihre Persönlichkeit auch von diesen bewerten zu lassen.

Dieses Vorgehen ermöglichte es den Forschern, die Genauigkeit von computergestützten Persönlichkeitsprognosen mit menschlichen Einschätzungen zu vergleichen. Sie stellten fest, dass ihr computerbasiertes Profil nach nur zehn analysierten Likes die Persönlichkeit besser vorhersagen konnte als ein Arbeitskollege; dass die Einschätzung anhand von 70 Likes genauer war als die eines Freundes oder Mitbewohners; mit 150 Likes war sie besser als die eines Familienmitglieds (Eltern oder Geschwister) und mit 300 sogar treffender als die des Ehepartners. Vor dem Hintergrund, dass ein durchschnittlicher Facebook-Nutzer im Jahr 2015 bereits auf 227 Likes kam (diese Zahl ist seitdem weiter angestiegen), gaben Kosinski und Stillwell ihrer Studie den Titel »Computerbased personality judgments are more accurate than those made by humans«. Wie schon die Studie aus dem Jahre 2013 erregte auch dieses Paper großes Aufsehen und führte zu Schlagzeilen wie »Facebook kennt dich besser als alle anderen«, oder »Facebook kennt dich besser als deine Familie«.

»Sogar unsere Tippmuster auf Tastaturen können dazu verwendet werden, unsere emotionale Verfassung einschließlich Selbstvertrauen, Nervosität, Traurigkeit und Müdigkeit zu entschlüsseln.«

Seither wurden viele weitere Möglichkeiten entwickelt, um aus unseren Datenspuren unsere Persönlichkeit, Eigenschaften und andere Merkmale vorherzusagen. So prognostizieren Forscher die Persönlichkeitsstruktur von Menschen aus den von ihnen auf Instagram verwendeten Filtern oder aus ihren Tweets. Sogar unsere Tippmuster auf Tastaturen können dazu verwendet werden, unsere emotionale Verfassung einschließlich Selbstvertrauen, Nervosität, Traurigkeit und Müdigkeit zu entschlüsseln. All dies markiert eine grundlegende Veränderung in der Persönlichkeitsbewertung: In der Vergangenheit mussten Psychologen in der Persönlichkeitsforschung aufwendig nach Teilnehmern suchen, deren Zustimmung einholen und ihnen speziell entwickelte Tests zum Ausfüllen aushändigen. Die Teilnehmer waren sich der Tatsache bewusst, dass sie beurteilt wurden, und partizipierten aktiv an dem Experiment. Heutzutage kann unsere Persönlichkeit ohne unsere Beteiligung oder gar ohne unsere Kenntnis prognostiziert werden. Sobald jemand Zugang zu einer ausreichenden Menge an Daten und den notwendigen computergestützten Werkzeugen und Fachkenntnissen hat, kann dieser aus mehr oder weniger belanglosen Daten intime Merkmale und Eigenschaften vorhersagen. Das heißt, Mobilfunkbetreiber, Vertriebsgesellschaften, Datenbroker und Sicherheitsbehörden können an vertrauliches Wissen über ihre Kunden, Wettbewerber oder Bürger gelangen.

Und auch wir können dies tun: Heutzutage kann jeder von uns mithilfe einfach zugänglicher Tools Profile über andere erstellen. 2014 wurde das US-amerikanische Start-up CrystalKnows gegründet, das verspricht, »dir zu helfen, dich selbst, deine Mitarbeiter und deine Kunden zu verstehen«. Wie es auf seiner Webseite erklärt, nutzt das Unternehmen »Informationen, die Nutzer freiwillig im Internet veröffentlicht haben«, und beurteilt gemäß des DISC Personality Profile Assessments, eines auf Selbstbeschreibung beruhenden Persönlichkeitstests, individuelle Persönlichkeit und Kommunikationsstil. Hat man die Browsererweiterung installiert, zeigt die Software eine ganze Akte über die eigenen LinkedIn- oder Google-Mail-Kontakte. Bei mir selbst gestaltete sich das folgendermaßen: CrystalKnows glaubt, dass »Frederike dazu neigt, direkt, aufgabenorientiert, schnell und starren Strukturen gegenüber abweisend zu sein«. In Hinblick auf einen meiner Kollegen hieß es: »Wenn du ihn triffst, behandle ihn wie einen Freund. Fange mit Smalltalk und einer persönlichen Unterhaltung an, bevor du zur Sache kommst. Gib ihm Zeit für ein Brainstorming oder dafür, laut zu denken, denn zu viel Struktur im Meeting könnte dazu führen, dass er das Interesse verliert. Schließe mit einer kurzen, freundlichen Zusammenfassung deiner Hauptargumente und der wichtigsten besprochenen Punkte ab.« Der besagte Kollege hat CrystalKnows keinerlei Zustimmung gegeben, ein Profil über ihn zu erstellen. Allerdings fanden sich E-Mails von ihm in meinem Postfach. Ebenso erlaubte mir CrystalKnows Zugriff zu ähnlich ausführlichen Profilen von Menschen, die ich zwar kaum kenne, mit denen ich aber über das Karrierenetzwerk LinkedIn vernetzt bin. Als ich einer Kollegin mein CrystalKnows-Profil zeigte, meinte sie, dass es zwar »grob gezeichnet«, aber »im Großen und Ganzen richtig« sei.

CrystalKnows ist nur ein Beispiel einer ganzen Reihe von Anbietern, die Persönlichkeitsprofile erstellen. IBMs »Watson Tone Analyzer« wie auch »Analyze Words« erkennen emotionale Befindlichkeiten und Persönlichkeitszüge anhand von Tweets und anderen öffentlich zugänglichen Texten. VisualDNA, ein britisches, auf Online-Persönlichkeitsquiz spezialisiertes Unternehmen, hat sich unter anderem mit einer Versicherungsfirma zusammengeschlossen, um zu ermitteln, welche Klienten Persönlichkeitsmerkmale aufweisen, die auf riskantes Fahrverhalten hindeuten könnten.

»Wir werden durch Datafizierung porös gemacht, wir zerfallen in eine Vielzahl von Profilen, die uns als Konsumenten, Angestellte oder Nutzerinnen verlinken.«

Unsere Daten, unser Selbst

Es ist zweifelhaft, ob ein Datenprofil jemals vollständig das chaotische, gebündelte Durcheinander eines menschlichen Charakters erfassen kann. Dennoch haben die aus Datenschatten und computergestützten Persönlichkeitsprognosen gewonnenen Profile den augenscheinlichen Vorteil, uns berechenbar, identifizierbar und mit anderen vergleichbar erscheinen zu lassen. Das, was nicht messbar ist – eine Person –, wird messbar gemacht. Auf diese Weise werden wir durch Datafizierung porös gemacht, wir zerfallen in eine Vielzahl von Profilen, die uns als Konsumenten, Angestellte oder Nutzerinnen verlinken. Für das komplexe, kommerzielle Datenökosystem sind die Datenversionen unseres Selbst somit ausgesprochen nützlich.

Wie beschrieben, wird ein Großteil unserer Datenschatten produziert und beobachtet und nicht einfach nur gesammelt. Im öffentlichen Diskurs werden digitale Daten jedoch häufig als »Rohstoffe« begriffen – beispielsweise in dem oft wiederholten Satz: »Daten sind das neue Öl.« Folgt man diesem positivistischen Verständnis, sind Daten anders als Wörter. Wörter müssen ausgewählt und interpretiert werden, sie haben unabhängig von ihrem Kontext keinen absoluten Wert. Die Semiotik gibt uns zu verstehen, dass in der gesprochenen Sprache immer eine Lücke zwischen einem Wort (der Signifikant) und dem Objekt, auf das es sich bezieht (das Signifikat) klafft. Wenn ich sage »Stuhl«, wird der Stuhl, den ich mir vorstelle, sich höchstwahrscheinlich von dem Stuhl unterscheiden, an den jemand anderes denkt. Die Lücke zwischen dem Signifikat und dem Signifikant schafft also Raum für Interpretation. Im Gegensatz dazu werden digitale Daten oft so behandelt, als wären sie der Auslegung gegenüber blind. Wie die Rechtsphilosophin Antoinette Rouvroy argumentiert, tendieren wir im Sinne der positivistischen Perspektive dazu, Daten als eine objektive Repräsentation der tatsächlichen Welt wahrzunehmen. Wir nehmen an, dass Daten für sich sprechen und dass Big-Data-gestützte Analysen umgekehrt der realen Welt zum Ausdruck verhelfen können – in einer Sprache, die der Worte beraubt und deshalb von Interpretation befreit ist.

...

In der Praxis funktionieren die Datenspuren, die wir in vernetzten Räumen hinterlassen, beinahe wie Fußabdrücke, denen man folgen kann. Wir werden belauert und gestalkt, wobei die gewonnenen Einsichten häufig als »unheimlich« oder »orwellsch« bezeichnet werden.

Die Datafizierung der Welt

Auszug aus Frederike Kaltheuner, Nele Obermüller »DatenGerechtigkeit«, Seite 16–25

Datenschatten

Unsere Daten, unser Selbst

Der Nicolai Newsletter