Ein dedizierter Datenraum für die industrielle Fertigung

Einführung und Motivation

Eine der größten Herausforderungen bei der Entwicklung und Integration von KI-Lösungen im europäischen Fertigungssektor liegt im Umgang mit Daten. Obwohl Produktionsumgebungen große Datenmengen erzeugen, sind diese häufig über isolierte Datensilos verteilt und damit nur eingeschränkt nutzbar. Diese Fragmentierung verhindert nicht nur eine effiziente Nutzung der Daten, sondern erschwert insbesondere das Training von KI-Modellen mit ausreichend großen, konsistenten und repräsentativen Datensätzen.

Neben der reinen Verfügbarkeit spielt auch die Qualität der Daten eine zentrale Rolle. In industriellen Umgebungen sind Bedeutung, Einheiten, Kontext und Herkunft von Datenelementen oft nicht einheitlich beschrieben. Gerade in heterogenen OT-Landschaften, etwa in SCADA- oder Leitsystemen unterschiedlicher Hersteller, variieren Bezeichnungen und Strukturen erheblich. Obwohl identische physikalische Größen erfasst werden, verhindern diese Unterschiede eine direkte Zusammenführung und Weiterverarbeitung der Daten. Für KI-basierte Anwendungen, etwa in der Zustandsüberwachung oder der prädiktiven Wartung, stellt dies eine wesentliche Hürde dar.

Hinzu kommen hohe Anforderungen an Vertrauen, Sicherheit und Datensouveränität. Produktionsdaten sind sensibel und häufig geschäftskritisch. Ein unternehmensübergreifender Austausch setzt daher transparente Governance-Modelle voraus, die klar regeln, wer Daten nutzen darf, unter welchen Bedingungen und zu welchem Zweck. Diese Anforderungen lassen sich mit klassischen, zentralen Plattformansätzen nur unzureichend erfüllen.

Der UNDERPIN Data Space als Lösungsansatz

Der UNDERPIN Data Space adressiert diese Herausforderungen, indem er einen europaweiten Datenraum für die Fertigungsindustrie und das dynamische Asset-Management bereitstellt. Der Datenraum basiert auf den Standards der International Data Spaces Association (IDSA) und Gaia-X und erweitert diese gezielt um domänenspezifische Lösungen für den produzierenden Bereich. Ziel ist es, eine vertrauenswürdige, interoperable Infrastruktur zu schaffen, über die Daten und datenbasierte Dienste souverän genutzt werden können.

Der Datenraum ermöglicht die Integration von KI- und Datendiensten – etwa für prädiktive Wartung oder datengetriebene Zustandsüberwachung –, ohne dass Daten ihre jeweilige organisatorische oder technische Hoheit verlassen müssen. Die Daten verbleiben bei den jeweiligen Akteuren, während Zugriffsrechte, Nutzungsbedingungen und Compliance-Anforderungen über gemeinsame Mechanismen durchgesetzt werden.

Zentrale Komponenten der Data-Space-Plattform

Ein zentrales Element des UNDERPIN Data Space ist das Authority Portal, das als primärer Einstiegspunkt für die Teilnahme am Datenraum dient. Über das Portal können verfügbare Datenassets entdeckt, Vertragsverhandlungen initiiert und administrative Aufgaben durchgeführt werden. Gleichzeitig stellt es eine kontrollierte und transparente Interaktion zwischen den Teilnehmern sicher. Der Betrieb erfolgt containerisiert auf Kubernetes, was Skalierbarkeit, Ausfallsicherheit und Reproduzierbarkeit gewährleistet.

Der Eclipse Dataspace Connector (EDC) bildet die technische Grundlage für den Policy-basierten, souveränen Datenaustausch. Jeder Teilnehmer betreibt einen eigenen Connector und behält damit die volle Kontrolle über seine Daten. Nutzungsbedingungen, die vom Datenanbieter definiert werden, werden während des gesamten Datenaustauschs technisch durchgesetzt.

Für Vertrauen und Governance sorgt die Kombination aus dem Dynamic Attribute Provisioning Service (DAPS), einem zentralen Identity- und Access-Management auf Basis von Keycloak, sowie einer Blockchain-basierten Infrastruktur. DAPS stellt verifizierte Attribute zu Identität, Rollen und Berechtigungen von Teilnehmern und Diensten bereit. Ergänzend ermöglicht das Blockchain-Ledger transparente, nachvollziehbare und revisionssichere Vertragsbeziehungen. Smart Contracts speichern Vertragsbeziehungen zwischen Datenanbieter und Datenbezieher inklusive Regeln, die für den Datenaustausch relevant sind. Somit können einzelne Aspekte des Vertrags mit technischen Mitteln sichergestellt werden, während Audit-Trails eine spätere Überprüfbarkeit sicherstellen.

Semantische Interoperabilität als Schlüssel

Ein wesentlicher Schwerpunkt von UNDERPIN liegt auf der semantischen Interoperabilität. Für eine sinnvolle Zusammenführung und Nutzung von Produktionsdaten reicht es nicht aus, Daten lediglich technisch zugänglich zu machen. Entscheidend ist, dass Daten über gemeinsame Bedeutungen, Strukturen und Referenzmodelle verfügen. Nur so lassen sich Daten aus unterschiedlichen Anlagen, Standorten oder Organisationen für KI-Anwendungen integrieren.

Hierfür stellt UNDERPIN mehrere Dienste bereit, die Metadaten harmonisieren, Daten semantisch integrieren und auffindbar machen. Der Vocabulary Hub fungiert dabei als semantisches Rückgrat des Datenraums. Er verwaltet standardisierte Ontologien und domänenspezifische Vokabulare, die maschinenlesbar bereitgestellt und versioniert werden. Diese dienen als gemeinsame Referenz für die Beschreibung von Datenassets, Diensten und Verträgen.

Die Metadata-Ingester- und Catalog-Crawler-Komponenten erfassen automatisiert Datenasset-Beschreibungen aus den angeschlossenen Connectoren und überführen sie in ein RDF-basiertes Metadatenmodell gemäß IDS-Informationsmodell und DCAT-Erweiterungen. Die Metadaten werden in einer Graphdatenbank gespeichert, die flexible semantische Abfragen sowie Volltext- und Facettensuche ermöglicht. Darauf aufbauend unterstützt der KnowDS-Dienst eine semantische Suche nach relevanten Datenassets, bei der nicht nur Schlagwörter, sondern auch inhaltliche Zusammenhänge berücksichtigt werden.

Anwendungen und Mehrwert für die Fertigung

Auf dieser Basis können KI- und Datendienste nahtlos in den Datenraum integriert werden. Diese Dienste werden beim jeweiligen Anbieter betrieben und über den Datenraum mit den erforderlichen Daten versorgt. Im Rahmen des Projekts wurden exemplarisch mehrere Anwendungen umgesetzt, darunter eine prädiktive Wartung für Kompressoren in Raffinerien sowie für Windturbinen in Windparks. Ziel ist es, Ausfälle frühzeitig zu erkennen, Stillstandszeiten zu reduzieren und die Lebensdauer von Anlagen zu verlängern.

Der UNDERPIN Data Space zeigt damit, wie Datenräume im produzierenden Bereich konkrete Mehrwerte schaffen können: durch bessere Datenqualität, durchgängige Governance und die Möglichkeit, datengetriebene Anwendungen organisationsübergreifend, aber dennoch souverän zu realisieren.

Porträtfoto Robert David
Robert David

Innovation Lead
Graphwise 

Porträtfoto Axel Weißenfeld
Axel Weißenfeld

Scientist im Bereich Data Science & Artificial Intelligence
AIT Austrian Institute of Technology GmbH