| Forschungsprojekte | gefördert | Differential Privacy: Ein neuer Ansatz zum Umgang mit Social Big Data
bidt background

Differential Privacy: Ein neuer Ansatz zum Umgang mit Social Big Data

Das Forschungsprojekt untersuchte, wie sich valide statistische Schlussfolgerungen ziehen lassen, ohne die individuelle Privatsphäre zu verletzten. Im Rahmen des Projekts wurde eine Software-Umgebung für die Umsetzung von Differential Privacy entwickelt.

Projektbeschreibung

Das Internet der Dinge (IoT) hat sehr große Datenbanken mit personenbeziehbaren Inhalten entstehen lassen, die die Grundlage für neue Geschäftsmodelle sind: Plattformbetreibende generieren bspw. den größten Teil ihrer Gewinne durch die Auswertung personenbezogener Daten. Neben der Bedrohung durch unkontrollierten Datenabfluss (wie bspw. im Fall von Cambridge Analytica 2018) und Datendiebstahl (den sog. data breaches) stellen diese Big Data Sammlungen und die damit verbundenen Auswertungspraktiken den Datenschutz vor neue Herausforderungen: Im Fokus stehen dabei die individuelle Privatsphäre und der generelle Umgang mit personenbezogenen Daten. Eine neue wissenschaftliche Methode, die Datenschutz, Privatheit und Datenanalysen zusammenbringt ist „Differential Privacy”: Ein Problem klassischer Anonymisierungsansätze personenbezogener Daten ist, dass die Anonymisierung die Person unkenntlich macht, die in den Daten enthaltenden Merkmale und Eigenschaften jedoch beibehält. Bei der Differential Privacy Methode werden hingegen alle personenbezogenen Merkmale und Eigenschaft so verändert, dass die individuelle Privatsphäre gewahrt bleibt und gleichzeitig valide statistische Datenanalysen möglich sind. Prinzipiell kann dies darüber hergestellt werden, dass mit unterschiedlichen mathematischen Verfahren ein Rauschen in statistische Analysen injiziert wird.

Unser Projekt „Differential Privacy: Ein neuer Ansatz zum Umgang mit Social Big Data“ lieferte die erste umfassende Evaluation dieses neuen Ansatzes und damit zentrale Erkenntnisse für die weitere Entwicklung, Steuerung und Umsetzung. Unsere Ergebnisse flossen einerseits in Policy-Paper, wissenschaftliche Veröffentlichungen und die Politikberatung ein. Andererseits wurde eine Lernplattform entwickelt, in der Nutzerinnen und Nutzer das Konzept von Differential Privacy kennenlernen können und über die Hintergründe informiert werden. Basierend auf den Erfahrungen zur Erstellung der Lernplattform schloss das Projekt mit einer Machbarkeitsstudie ab, die überprüft, ob es sinnvoll ist, eine eigene Differential Privacy Plattform aufzubauen, über die wissenschaftliche Daten Forscherinnen und Forscher datenschutzkonform zur Verfügung gestellt werden können. Im Projekt wurde sich dem Thema in vier Arbeitspaketen genähert, um die folgenden Fragen zu beantworten:

  • Was sind die Chancen von Differential Privacy aus technischer und gesellschaftlicher Perspektive?
  • Was sind die Risiken von Differential Privacy für Nutzerinnen und Nutzer, Anwenderinnen und Anwender sowie die Gesellschaft?
  • Wie lässt sich Differential Privacy aus der Software-Engineering-Perspektive praktisch umsetzen und ökonomisch verwerten?

Das Forschungsteam kam zu dem Schluss, dass eine „one-size-fits-all“-Lösung im Umgang mit Social Big Data nicht effektiv ist. Die Forscherinnen und Forscher identifizierten die Aufklärung über Technologien zum Schutz der Privatsphäre als Kernelement. Auf rechtlicher Ebene konnten die Forscherinnen und Forscher zudem neue Metriken und DSGVO-Anforderungen formulieren. Das Projekt zeigte, dass Differential Privacy hohes Potential bietet, in der Anwendung aber viele Hürden aufweist.

Das Projekt wurde zum 28. Februar 2023 abgeschlossen.

Ansprechpartner

Dr. Christoph Egle

Geschäftsführer, bidt

Projektteam

Prof. Dr. Simon Hegelich

Inhaber der Professur für Political Data Science, Hochschule für Politik | Technische Universität München

Fabienne Marco

Wissenschaftliche Mitarbeiterin, Lehrstuhl für Political Data Science der Hochschule für Politik | Technische Universität München

Andree Thieltges M.A.

Wissenschaftliche Mitarbeiter , Lehrstuhl für Political Data Science der Hochschule für Politik | Technische Universität München

Prof. Dr. Florian Matthes

Inhaber, Lehrstuhl für Software Engineering betrieblicher Informationssysteme | Technische Universität München

Oleksandra Klymenko M.Sc.

Wissenschaftliche Mitarbeiterin, Lehrstuhl für Software Engineering betrieblicher Informationssysteme | Technische Universität München

Gonzalo Munilla Garrido M.Sc.

Wissenschaftlicher Mitarbeiter, Lehrstuhl für Software Engineering betrieblicher Informationssysteme | Technische Universität München

Sascha Nägele M.Sc.

Wissenschaftlicher Mitarbeiter, Lehrstuhl für Software Engineering betrieblicher Informationssysteme | Technische Universität München

Prof. Dr. Uwe Baumgarten

Inhaber der Professur für Vernetzte Rechensysteme und Datenschutzbeauftragter, Technische Universität München

Dmitry Prokhorenkov

Wissenschaftlicher Mitarbeiter und Doktorand, Technische Universität München