Daten als Produkte in vernetzten Ökosystemen: vom Data Mesh zum Datenraum

Daten als zusätzliches Asset

Mit der fortschreitenden Digitalisierung werden Daten zunehmend als eigenständige Ressourcen verstanden, die nicht nur transportiert, sondern strukturiert abgelegt werden: von klassischen Datenbanken über Datenplattformen bis zu Ansätzen wie Data Mesh und Data Space. Dabei rückt die Data Governance, mit der zentralen Frage der Kontrolle über die Daten, bei der Technologieentscheidung immer mehr in den Fokus. Diese Entwicklung stellt einen Paradigmenwechsel von Daten als Nebenprodukt technischer Systeme hin zu eigenständigen, wiederverwendbaren Assets dar, deren Nutzung über System-, Domänen- und Organisationsgrenzen hinweg geplant, geregelt und abgesichert werden muss. Dies bedeutet, gerade mit Hinblick auf AI und den AI Act sowie den Data Act, dass im Zusammenspiel von physischen und digitalen Systemen, wie in cyber-physischen Systemen, die Daten, welche verarbeitet werden, robust, interoperabel, sicher, standardisiert und konform sein müssen. Hierbei besteht die große Herausforderung, die Daten für andere sinnvoll nutzbar zu machen.

Von den Daten zum Produkt

Vor allem in der domänenübergreifenden Nutzung der Daten stellen analytische Daten (aufbereitet und strukturiert) den größten Mehrwert dar. Hierfür kommen verschiedene Konzepte von Plattformen, Data Warehouse, Data Lake u. v. m., zur Anwendung. Im Zusammenspiel mit regulativen Anforderungen liefert jedoch der Data Mesh eine interessante Orientierung hin zum (Daten-)Produkt. Der Data-Mesh-Ansatz adressiert die analytischen Daten zunächst aus einer unternehmensinternen Perspektive, gegliedert nach Verantwortlichkeiten, mit internen Anbietern und Konsumenten. Die Verantwortung wird dabei bewusst hin zu den Fachdomänen, z. B. Abteilungen, dezentralisiert. Diese übernehmen die Verantwortung für ihre Daten und stellen diese als Datenprodukte (Data Products) bereit.

Ein Datenprodukt umfasst dabei nicht nur die Daten selbst, sondern explizit auch Metadaten, Schnittstellen, Qualitätsaussagen, Service-Level-Agreements sowie Nutzungs- und Zugriffsrichtlinien. Die technische Dimension zur Bereitstellung der Daten wird damit um organisatorische und regulatorische Aspekte im Unternehmen vereinheitlicht erweitert. Ziel des Data Meshs ist eine skalierbare, domänengetriebene Datenarchitektur, die Autonomie in den Domänen ermöglicht, ohne Governance-Anforderungen, welche unternehmensweit oder spezifisch zum Datenprodukt bestehen können, zu vernachlässigen. Gerade in industriellen Umgebungen mit gewachsenen IT- und OT-Landschaften erlaubt Data Mesh eine schrittweise Integration in bestehende Systeme. Gleichzeitig verschiebt sich der Fokus von reinem Datenzugang hin zu der Frage, unter welchen Bedingungen und Richtlinien Daten genutzt werden dürfen und wie diese Bedingungen systematisch überprüfbar gemacht werden können.

Vom Data Mesh zum Datenraum

Eine Orientierung auf Datenprodukte ermöglicht auch das Teilen der Daten über Unternehmensgrenzen hinaus. Das Konzept Data Mesh ist jedoch nicht standardisiert, und unternehmensübergreifende Zugriffskonzepte sind immer individuelle Lösungen. Hier schaffen Datenräume mit einem gemeinsamen Rahmen Abhilfe, der auf Interoperabilität, Vertrauen und Standardisierung basiert. Die internationale Norm ISO 20151 für Datenräume befindet sich aktuell im Draft-Status. Diese bereitet eine erste Grundlage für weitere folgende Normen und definiert Datenräume als soziotechnische Systeme, in denen Datenanbieter und Datennutzer ihre Kontrolle über Daten behalten, während gleichzeitig eine sichere, transparente und nachvollziehbare Zusammenarbeit ermöglicht wird. Zentrale Bausteine sind standardisierte Identitäten, gemeinsame Semantiken sowie maschinenlesbare Richtlinien, welche Nutzungsrechte, Pflichten und Einschränkungen eindeutig beschreiben. Durch diese verbindlichen Regeln und gemeinsamen Referenzmodelle wird eine vertrauenswürdige, sichere und skalierbare Kooperation ermöglicht. Der Kontext der Daten, wie Quelle, Zweck, Qualität oder regulatorischer Rahmen, wird dabei zu einem integralen Bestandteil der technischen Architektur.

Das Zusammenspiel von Data Mesh, Datenraum und Gaia-X

Die Verbindung von Data Mesh und Data Space führt zu einem integrierten Ansatz, bei dem Datenprodukte als konsistente Informationsträger fungieren, die sowohl intern als auch organisationsübergreifend genutzt werden können. Kontroll- und Datenebene lassen sich damit klar trennen. Während Daten dezentral bei den jeweiligen Akteuren in den Domänen verbleiben, werden Zugriffsentscheidungen, Policy-Validierung und Compliance-Nachweise über gemeinsame Dienste und standardisierte Mechanismen umgesetzt. Nutzungsbedingungen, Rollen und Verpflichtungen werden nicht mehr implizit vereinbart, sondern explizit und maschinenlesbar beschrieben. Dadurch lassen sich Prüfungen automatisieren, Auditierbarkeit sicherstellen und manuelle Abstimmungsprozesse reduzieren.

Insbesondere für bestehende Systeme bedeutet dies, dass sie nicht ersetzt, sondern in einen übergeordneten Governance-Rahmen eingebettet werden können. Wichtig für gemeinsames Verständnis ist nicht zuletzt eine gemeinsame Semantik, sowohl für die Daten und Metadaten als auch für die Formulierung der zugehörigen Regulierungen. Compliance wird damit von einer nachgelagerten Prüfaufgabe zu einer inhärenten Systemeigenschaft. Gaia-X unterstützt hierbei, indem es einen gemeinsamen Rahmen für unternehmensübergreifendes Vertrauen liefert und einen offenen Ansatz, welcher es ermöglicht, eigene Erweiterungen zu schreiben (siehe „Geografische und domänenspezifische Erweiterung des Gaia-X- Frameworks“).

Systeme sollten daher einen größeren Fokus auf Daten als Produkte legen, wobei klare Schnittstellen, definierte Verantwortlichkeiten, standardisierte Semantiken sowie integrierte Sicherheits- und Regelmechanismen Voraussetzung für eine nachhaltige, vertrauenswürdige und rechtskonforme Datennutzung sind.

Porträtfoto Stefan Dumms
Stefan Dumss

Senior Researcher
Posedio GmbH