Glossar
SOFTWARE

Open Data

INHALT

Definition und Abgrenzung

Open Data (offene Daten) bezeichnet Daten, die für jedermann für jeden Zweck frei zugänglich, nutzbar, veränderbar und teilbar sind – eingeschränkt höchstens durch Maßnahmen, die Ursprung und Offenheit des Wissens bewahren [1]. Open Data bezieht sich meist auf Informationen des öffentlichen Sektors (engl. Public Sector Information, PSI), also alle „Informationen, die von oder für eine staatliche Institution oder eine öffentliche Einrichtung generiert, erstellt, gesammelt, verarbeitet, gespeichert, bewahrt, verbreitet oder finanziert werden“ [2], und wird in diesem Kontext auch als Open Government Data bezeichnet. Gemäß einem weiten Begriffsverständnis kann sich Open Data auch auf den Zugang zu Daten im Besitz privater Akteure und Unternehmen beziehen.

Geschichte

In der Europäischen Union wurde die erste verbindliche Gesetzgebung zu Open Data im Jahr 2003 verabschiedet: Die Richtlinie 2003/98/EG über die Weiterverwendung von Informationen des öffentlichen Sektors (PSI-Richtlinie) zielte darauf ab, die Veröffentlichung von Informationen des öffentlichen Sektors zwischen den europäischen Mitgliedsstaaten zu harmonisieren und dadurch Barrieren für die Weiterverwendung dieser Informationen abzubauen [1]. Insbesondere verbot die Richtlinie Exklusivverträge bezüglich der Datenbereitstellung öffentlicher Stellen an Dritte (vorbehaltlich spezifischer Ausnahmen), forderte einen generellen diskriminierungsfreien Zugang zu Informationen des öffentlichen Sektors für alle potenziellen Weiterverwender und förderte deren Veröffentlichung auf Onlineportalen, um den Zugang und das Auffinden für Dritte zu erleichtern. Im Jahr 2013 wurde die Richtlinie überarbeitet und ergänzt. Neben weiteren Änderungen betonte die überarbeitete Fassung der Richtlinie insbesondere die Notwendigkeit, Informationen in einem maschinenlesbaren Format bereitzustellen. Zudem wurde eine allgemeine Obergrenze für die Zugangsgebühren zu Open Data in Höhe der Grenzkosten festgeschrieben, die jedoch in Ausnahmenfällen überschritten werden konnte.

Im Rahmen der Initiative zum „Aufbau eines gemeinsamen europäischen Datenraums“ wurde die PSI-Richtlinie im Jahr 2019 erneut überarbeitet und als Richtlinie (EU) 2019/1024 über offene Daten und die Weiterverwendung von Informationen des öffentlichen Sektors (Open-Data-Richtlinie) verabschiedet. Die Neufassung der Richtlinie ist am 16. Juli 2019 in Kraft getreten. Die Umsetzungsfrist für die Mitgliedsstaaten von zwei Jahren endet am 17. Juli 2021. Durch die Richtlinien werden die Mitgliedsstaaten verpflichtet, alle vorhandenen Dokumente (insbesondere auch elektronisch gespeicherte Daten) weiterverwendbar zu machen, es sei denn, dem stehen nationale Vorschriften oder in der Richtlinie geregelte Ausnahmen entgegen [2]. Gegenüber der PSI-Richtlinie schränkt die Open-Data-Richtlinie die Anwendungsfälle, in denen Zugangsgebühren über den Grenzkosten verlangt werden dürfen, weiter ein, erhöht die Transparenzanforderungen für Vereinbarungen zwischen öffentlichen und privaten Institutionen über eine Datennutzung und betont die Notwendigkeit, dynamische Daten in Echtzeit über Application Programming Interfaces (APIs) zugänglich zu machen. Besonderes Augenmerk wurde zudem auf kleine und mittlere Unternehmen (KMUs) gelegt, die möglichst einfach von der Nutzung von Open Data profitieren sollen. Schließlich schreibt die Richtlinie die Festlegung von hochwertigen Datensätzen vor, „deren Weiterverwendung mit wichtigen Vorteilen für die Gesellschaft, die Umwelt und die Wirtschaft verbunden“ sind (Art. 2 (10) der Open-Data-Richtlinie). Aufgrund des besonderen Wertpotenzials dieser Daten sollen diese kostenlos, in einem maschinenlesbaren Format, über APIs und gegebenenfalls als Massen-Download zur Verfügung gestellt werden (Art. 13). Während die Open-Data-Richtlinie sechs thematische Kategorien hochwertiger Datensätze definiert, wird die endgültige Liste der Datensätze von der Europäischen Kommission in zusätzlichen Durchführungsrechtsakten festgelegt. Die deutsche Bundesregierung hat am 10. Februar 2021 den Entwurf des Gesetzes für die Nutzung von Daten des öffentlichen Sektors beschlossen, das die europäische Richtlinie national umsetzen soll.

Anwendung und Beispiele

Open Data wird in vielfältiger Form bereitgestellt und genutzt. Die Bereitstellung und Nutzung öffentlicher Daten soll insbesondere datengetriebene Innovationen ermöglichen, die Wettbewerbsfähigkeit kleiner und mittlerer Unternehmen stärken und gemeinnützige Ziele wie Transparenz und Rechenschaft staatlicher Aktivitäten fördern. Open Data und darin enthaltenen Informationen können dabei unmittelbar staatliche Aktivitäten betreffen, z. B. in Form von Gesetzestexten oder Informationen zu öffentlich-rechtlichen Einrichtungen. Staatliche Stellen erheben jedoch auch Informationen über den Privatsektor wie z. B. demografische Bevölkerungsinformationen oder Unternehmensregister. Schließlich sammelt der öffentliche Sektor zahlreiche Umweltinformationen, die häufig in hoher Qualität und hohem Detailgrad erhoben werden.

In der kommerziellen Verwendung kann Open Data von Unternehmen zum einen unmittelbar als „Endprodukt“ genutzt werden, um einen geschäftlichen Mehrwert zu schaffen. Das heißt, die in den Daten enthaltenen Informationen werden in einem aussagekräftigen Kontext präsentiert oder auf eine Weise visualisiert, die einen Mehrwert für Kunden schafft. Um an die notwendigen Informationen zu gelangen, sammeln Unternehmen typischerweise Daten von ihren Nutzern, scrapen Webinhalte oder sammeln Daten aus Offlinequellen. Open Data stellt eine zusätzliche Quelle für solche Dienste dar. Beispielsweise nutzt die Anwendung HD-Scores Daten der US-Gesundheitsbehörde, um die Öffentlichkeit über die Qualität von Restaurants zu informieren [5]. Ein weiterer prominenter Fall der repräsentativen Nutzung von Informationen auf Basis von OGD ist die Darstellung von Satellitendaten der NASA in den Kartendarstellungen von Google Maps [6]. Darüber hinaus verwendet Google verschiedene andere OGD-Sätze wie Wetter- und Regionaldaten zum Aufbau und zur Anreicherung des Google-Maps-Dienstes [7].

Zum anderen kann Open Data von Unternehmen als „Zwischenerzeugnis“ eingesetzt werden, wenn die Daten als Input für Data-Analytics-Anwendungen und datengestützte Entscheidungsunterstützungssysteme dienen. So kann Open Data Produktivität und Effizienz einer Organisation steigern. Konkret kann Open Data im Kontext von Business Intelligence genutzt werden, um Marktanalysen durchzuführen, Branchenbenchmarks zu erstellen oder Risikomanagementmodelle zu verbessern [8]. Darüber hinaus nutzen Unternehmen Open Data aber auch, um interne Geschäftsprozesse oder die Personalplanung mit Blick auf Nachfragetrends zu optimieren [9]. Im Kontext digitaler Dienste spielen Data-Analytics-Anwendungen eine wichtige Rolle, um neues Wissen abzuleiten und Vorhersagen zu treffen sowie die Dienstqualität durch gezielte Personalisierung und passende Bereitstellung von Inhalten und Werbung zu verbessern. Open Data kann somit zur Entwicklung völlig neuer Produkt- oder Dienstleistungsangebote beitragen und auf diese Weise digitale Innovationen fördern [8]. Darüber hinaus nutzen einige Unternehmen Open Data und darin enthaltene demografische Informationen, um individuelle Diensteangebote und zielgerichtete Werbung besser an Nutzerinteressen anzupassen [10].

Kritik und Probleme​​

Mit Blick auf Open Data wird regelmäßig diskutiert, in welchem Umfang Informationen des öffentlichen Sektors frei zugänglich gemacht werden sollen und unter welchen Bedingungen dies geschehen soll. Fürsprecher eines offenen Datenzugangs argumentieren, dass die Erstellung oder Sammlung der Daten mit öffentlichen Geldern finanziert wurde und daher diese einer möglichst breiten Öffentlichkeit zugänglich sein sollten. Darüber hinaus wird darauf verwiesen, dass Daten als nicht rivales Gut bei der Nutzung nicht aufgebraucht werden und daher der größtmögliche sozioökonomische Wert durch eine möglichst breite und vielfältige Nutzung von Open Data erreicht werden kann. Aus der Idee des Open Government wird zudem abgeleitet, dass staatliche Aktivitäten möglichst transparent und nachvollziehbar sein sollten, was wiederum die Bereitstellung von Open Data bedingt.

Eine offene Bereitstellung von Daten kann im Konflikt zu dem Schutz personenbezogener Daten oder dem Schutz von Geschäftsgeheimnissen stehen, wenn Open Data Informationen über den privaten Sektor beinhalten. Dies ist insbesondere dann der Fall, wenn Daten in besonders feingranularen Einheiten erhoben werden und eine (mittelbare) Identifizierung von Personen oder Organisationen möglich ist. Durch die staatliche Erhebung und Bereitstellung von Open Data kann die Kontrolle des Einzelnen über die Veröffentlichung bestimmter Datensätze eingeschränkt sein. Dabei können indirekte ökonomische Konsequenzen aus der Datennutzung zum Nachteil einzelner Personen führen, auch wenn kein direkter Personenbezug in den Daten enthalten ist.

Mit Blick auf die kostenfreie und diskriminierungsfreie Bereitstellung von Daten wird einerseits argumentiert, dass auf diese Weise ein größtmögliches Maß an Innovation erzeugt werden kann. Andererseits verweisen Kritiker darauf, dass privatwirtschaftliche datengetriebene Innovationen durch Open Data ihrer wirtschaftlichen Absatzmöglichkeiten beraubt werden könnten, wenn eine staatlich subventionierte Datenbereitstellung kommerzielle Angebote unwirtschaftlich macht (Crowding out). Zudem ist eine wirtschaftliche Datennutzung in manchen Anwendungsfällen nur profitabel möglich, wenn Daten exklusiv zugänglich sind oder andere von deren Nutzung ausgeschlossen werden können. Hinsichtlich der Bereitstellung von Open Data wird auch bemängelt, dass diese teilweise nur in schlechter Qualität (insbesondere fehlende Vollständigkeit oder fehlende Aktualität) verfügbar sind, Datensätze schwer auffindbar sind oder fragmentiert über verschiedene Institutionen vorliegen und die Nutzung aufgrund fehlender Metadaten häufig nur eingeschränkt möglich ist. Zugangsgebühren über den Grenzkosten könnten an dieser Stelle Anreize für die Bereitstellung einer höheren Datenqualität schaffen. Schließlich ist fraglich, ob aufgrund von Skalen- und Verbundvorteilen bei der Datennutzung nicht insbesondere bereits dominante und datenmächtige Unternehmen von Open Data profitieren. Dies würde dem Ziel einer Förderung von kleinen und mittleren Unternehmen zuwiderlaufen und könnte die Marktkonzentration in digitalen Märkten weiter steigern.

Forschung und Literatur

Quellen

[1] The Open Definition.

[2] OECD Recommendation of the Council for Enhanced Access and More Effective Use of Public Sector Information.

[3] European legislation on open data.

[4] Open Data und PSI.

[5] HD-Scores.

[6] A Cloud-Free Makeover of Google Maps Courtesy of Landsat 8.

[7] Open Data 500 – Google Maps.

[8] Magalhaes, G., Roseira, C., & Manley, L. (2014). Business models for open government data. In Proceedings of the 8th International Conference on Theory and Practice of Electronic Governance (pp. 365–370).

[9] Hughes-Cromwick, E., & Coronado, J. (2019). The value of US government data to US business decisions. Journal of Economic Perspectives, 33(1), 131–46.

[10] Powers, R., & and Beede, D. (2014). Fostering innovation, creating jobs, driving better decisions: The value of government data. Office of the Chief Economist, Economics and Statistics Administration, US Department of Commerce.

AUTOR
Dr. Daniel Schnurr

Weitere Beiträge

Alle Glossar-Beiträge

NEWSLETTER

Neuigkeiten zur digitalen Transformation

Jetzt abonnieren
2021-07-28T15:25:27+02:00
Nach oben