Datenschutz: Anonymisierung ist der Königsweg
Beim Versuch, personenbezogene Daten DSGVO-konform zu verarbeiten, tut sich oft eine Grauzone auf. Es sei denn, die Daten etwa aus autonomen Fahrzeugen oder vernetztem Verkehr werden erst anonymisiert und dann verarbeitet – wie bei Providentia++.
Wofür werden die Daten verwendet und nicht verwendet?
Wer schon mal unter einer Schilderbrücke hindurch gefahren ist, die mit diversen Kameras und Radaren bestückt ist, wird den hektischen Blick aufs Tacho kennen. Dass es sich hier nicht um Überwachung und eine Geschwindigkeitskontrolle handelt, sondern um Forschung, ist nicht direkt klar. Das Projekt Providentia++ beispielsweise, in dem an der Autobahn A9 Sensorstationen genutzt werden, ist interessiert an Daten des Verkehrs. Diese dienen dazu, die Bewegungen der Fahrzeuge digital abzubilden. Mithilfe eines digitalen Zwillings lässt sich analysieren, wie sich Fahrer mit ihren Fahrzeugen bewegen, wann sie die Spur wechseln und wie sie auf plötzliches Bremsen des Vordermanns reagieren. Mithilfe großer Mengen an Daten ist künstliche Intelligenz in der Lage, Empfehlungen zu geben. Zudem helfen sie Herstellern von digitalen Assistenzsystemen, ihre Systeme zu validieren und noch präziser zu machen.
Was fordert die DSGVO?
Allerdings ist es in der EU grundsätzlich verboten, personenbezogene Daten zu verarbeiten. „In der Datenschutzgrundverordnung (DSGVO) sind die möglichen Wege definiert, wie man zu einer Rechtsgrundlage kommt“, erläutert Prof. Uwe Baumgarten von der TU München. Personenbezogene Daten – so steht es schon in Artikel 5 der DSGVO – müssen „auf rechtmäßige … in einer für die betroffene Person nachvollziehbaren Weise verarbeitet werden“, sie müssen „sachlich richtig … sein“, „eine angemessene Sicherheit der personenbezogenen Daten gewährleisten“ und dürfen nur so lange gespeichert werden, „wie es für die Zwecke, für die sie verarbeitet werden, erforderlich ist“. Zwar zeigt sich hier ein gewisser Interpretationsspielraum. Grundsätzlich gibt es nach Artikel 6 der DSGVO mehrere Bedingungen, die eine Verarbeitung der Daten zulassen: So kann der Betroffene für die Verwendung von persönlichen Bildern oder Daten eine Einwilligung geben. Dann steht ihrer legalen Verarbeitung nichts mehr im Wege. Zum anderen können Daten der Vertragserfüllung dienen. Wer etwa ein Fahrzeug kauft, unterschreibt einen Kaufvertrag. „Sofern es der Vertragserfüllung dient, dürfen die darin enthaltenen, personenbezogenen Daten verarbeitet werden“, sagt Prof. Baumgarten. Bei Werkstattaufenthalten oder Softwareupdates dürfte der Kunde nichts weiter dagegen einwenden. Hinzu kommen ein paar andere Bedingungen, wie „die Erfüllung einer rechtlichen Verpflichtung“ oder „… um lebenswichtige Interessen … zu schützen“. Doch wie sieht es aus, wenn Bilddaten und Videos gesammelt werden? „Der Bereich zwischen möglicher persönlicher Einwilligung und Vertragserfüllung ist oft fließend“, sagt Prof. Baumgarten, „es entsteht eine Grauzone“.
Welche Datenverarbeitung dient der Vertragserfüllung?
Aktuelles Beispiel: US-Autohersteller Tesla, der gerade von Digitalcourage e.V. aufgrund von angeblichen Datenschutzverstößen mit dem Big-Brother-Award „ausgezeichnet“ wurde. Während in den USA personenbezogene Daten verarbeitet werden dürfen, sind die Gesetze in der EU eindeutig in der DSGVO geregelt. Das Dilemma ist hausgemacht, wie der ehemalige Datenschutzbeauftragte des Landes Schleswig-Holstein Thilo Weichert in einer 37-seitigen Analyse schreibt: Demnach wird aus den allgemeinen Geschäftsbedingungen (AGB) nicht klar, ob und wieweit Tesla personenbezogene Daten erhebt. Verbindliche Angaben zur Datenlöschung sind nicht zu finden. Zudem ist unklar, welche Sensordaten Tesla übermittelt und speichert und welche im Auto bleiben und überschrieben werden. Insgesamt benennt der Jurist neun konkrete Gründe, warum Telsa gegen die europäischen Vorgaben des Datenschutzes und des Verbraucherschutzes verstößt. Unter anderem sei Tesla „mitverantwortlich für die nicht erforderliche, umfassende, uneingeschränkte Videoüberwachung und die darauffolgende Verarbeitung sowohl im Fahr- als auch im Parkmodus“ und gebe nicht an, „auf welcher Rechtsgrundlage … die von ihr vorgenommenen Datenverarbeitung basiert“. Eines macht der Fall Tesla klar: Seit weit mehr Daten über Fahrer und Fahrzeug als das Kennzeichen entstehen, wird der Schutz persönlicher Daten immer wichtiger.
Warum ist die Anonymisierung von Daten der sicherste Weg?
„Deshalb sollte die wichtigste Frage doch sein, wie Daten den Personenbezug verlieren“, sagt Prof. Baumgarten von der TU München – etwa durch Anonymisierung. Zumal es kaum möglich sein wird, die vorbeifahrenden Fahrzeuge um eine Erlaubnis zu bitten. In der Architektur von Providentia++ werden die Sensordaten „nah an der Erfassung“ anonymisiert. Daten vom Verkehr werden im ersten Schritt lokal gespeichert, Objekte wie Lkws, Busse und Pkws identifiziert und bereits lokal anonymisiert, bevor sie im nächsten Schritt mit allen verfügbaren Sensordaten fusioniert werden und daraus ein digitaler Zwilling entsteht. „Niemand ist beim autonomen Fahren daran interessiert, wer im Auto sitzt und wo das Auto herkommt oder hinfahren will“, sagt Prof. Baumgarten. Bei Providentia++-Partner Cognition Factory werden nur Daten zu Analysezwecken und Interpretation gespeichert, die keine Rückschlüsse auf datenschutzrelevante Informationen zulassen. Das heißt, dass z.B. die Position eines Fahrzeugs auf einem Bild und die Fahrzeugklasse (Auto, LKW, …), jedoch nicht das Bild des Objekts für einen Zeitraum von hundert Tagen gespeichert wird. Dann verschwinden die Daten wieder von den Servern. Generell sieht die DSGVO allerdings auch die Möglichkeit vor, Daten zu „…wissenschaftlichen oder historischen Forschungszwecken“ zu archivieren (DSGVO, Artikel 89, Absatz 1).
Lassen sich mit anonymisierten Daten noch neuronale Netze trainieren?
Da Daten etwa für das Training von neuronalen Netzen wichtig sind, entsteht hier ein Spannungsfeld. Um Algorithmen für die Erkennung von Fahrzeugen zu trainieren, musste Dr. Claus Lenz von Cognition Factory auf verfügbare Datensätze aus den USA und Asien zurückgreifen, auch wenn die Lkws dort anders aussehen als hier. Nach und nach kamen eigene Daten hinzu. Heute erkennen seine Algorithmen sehr zuverlässig nicht nur Pkws, sondern auch Lkws und Busse. „Algorithmen mit einer großen Menge an Daten zu füttern, verkürzt deren Lernkurve“, sagt Lenz. Je nachdem, mit welcher Methode die Kennzeichen und Personen anonymisiert werden, kann das dazu führen, dass diese Bilder „verrauschen“ und deren Verarbeitung durch Algorithmen dadurch eingeschränkt wird. Einen Ausweg hat das Unternehmen brighter AI gefunden, ein Start-up aus dem Inkubator des Autozulieferers Hella und seit kurzem assoziierter Partner von Providentia++, das personenbezogene Bildinformationen erkennt und durch künstlich generierte Ersatzdaten anonymisiert. „Die Anonymisierung von Kennzeichen und Gesichtern ist sehr natürlich, so dass auch die Algorithmen auf Basis dieser Daten lernen können“, sagt Marian Gläser, Geschäftsführer von brighter AI, der die Technologie unter anderem bereits für Analysen bei der Deutsche Bahn eingesetzt hat. Der Ablauf ist folgender: Personenbezogene Daten werden verschlüsselt einem Server übergeben, in der Cloud anonymisiert und dann erst weiterverarbeitet. Der Ansatz von brighter AI kommt sozusagen Prof. Baumgartens größtem Wunsch zuvor: Dass der Personenbezug aus Bildern herausfällt und neuronale Netze trotzdem lernfähig bleiben.
Bild und Video: brighter AI
WEITERE AKTUELLE THEMEN
Cognition Factory: Kameradaten auswerten und visualisieren
Seit Beginn der Forschungen in Providentia++ am digitalen Zwilling ist KI-Spezialist Cognition Factory GmbH auf die Verarbeitung von Kameradaten fokussiert. Geschäftsführer Dr. Claus Lenz mit seinem Resümee.
Digitaler Echtzeitzwilling des Verkehrs: Serienreif und rund um die Uhr einsetzbar
Konsortialführer TU München hat das Forschungsprojekt für automatisiertes und autonomes Fahren Providentia++ entscheidend vorangebracht. TUM-Projektleiter Venkatnarayanan Lakshminarashiman zieht Bilanz.
Elektrobit: Test Lab auf stationäre Daten münzen
Elektrobit legt nicht zuletzt durch die Fortschritte in Providentia++ die Basis für Big-Data-Auswertungen von Verkehrsdaten. Simon Tiedemann von Elektrobit über die Entwicklungen im Rahmen von P++.