Künstliche Intelligenz und Urheberrecht – eine Interessenskollision

Urheberrechtliche Fragen im Zusammenhang mit Künstlicher Intelligenz stellen sich entlang sämtlicher Phasen des Lebenszyklus von KI-Anwendungen. Besonders im Diskurs stehen derzeit generative KI-Modelle, vor allem Large Language Models (LLMs). Der zugrundeliegende Interessenskonflikt ist schnell skizziert: Vereinfacht wollen Rechteinhaber:innen (Urheber:innen, Verlage, Verwertungsgesellschaften usw.) für die Verwendung ihrer Werke entsprechend entlohnt werden. KI-Anbieter:innen und -Nutzer:innen wollen KI-Anwendungen möglichst uneingeschränkt und rechtssicher entwickeln bzw. verwenden.

KI-Training und Urheberrecht aus europäischer Perspektive

Da es im Zuge des KI-Trainings zu Vervielfältigungen (§ 15 UrhG) urheberrechtlich geschützter Trainingsdaten (z. B. Bilder, Texte, Code etc.) kommt (z. B. durch den Download von Daten via Web Scraping sowie durch weitere Speicher- und Ladevorgänge), ist hierfür eine Gestattung durch die Rechteinhaber:innen (Lizenz) oder eine gesetzliche freie Werknutzung (Ausnahme) erforderlich. Da Lizenzen in Anbetracht der Größe der Trainingsdatensätze schwer zu erlangen und teuer sein können, ist relevant, inwieweit KI-Training durch eine freie Werknutzung gedeckt ist und daher ohne Lizenz durchgeführt werden darf. Die relevanteste Ausnahme auf europäischer Ebene ist jene für sogenanntes Text and Data Mining (TDM), die in Österreich in § 42h UrhG umgesetzt ist. Der Anwendungsbereich der Ausnahme unterscheidet zwischen zwei Fällen: TDM zu (nicht kommerziellen) Forschungszwecken (§ 42h Abs. 1 UrhG) und TDM zum „eigenen“ Gebrauch, worunter auch private, berufliche und kommerzielle Zwecke fallen (§ 42h Abs. 6 UrhG).

Nicht endgültig geklärt ist bislang, ob das Training generativer KI aber überhaupt als TDM qualifiziert werden kann und damit unter die Ausnahme fällt. Die rechtswissenschaftliche Literatur spricht sich überwiegend dafür aus, da die Ausnahme weit formuliert ist („um damit Texte und Daten in digitaler Form automatisiert auszuwerten und Informationen unter anderem über Muster, Trends und Korrelationen zu gewinnen“) und auch die KI-Verordnung (Art. 53 Abs. 1 lit. c KI-VO) von der Anwendbarkeit der Ausnahme ausgeht. Jüngst hat das LG München I (42 O 14139/24; nicht rechtskräftig) im Rechtsstreit zwischen OpenAI und der GEMA (deutsche Verwertungsgesellschaft für Werke der Tonkunst) entschieden, dass Vervielfältigungen im Prozess des KI-Trainings (zur Vorbereitung des Trainingskorpus) grundsätzlich als TDM anzusehen sind.

Selbst wenn KI-Training als TDM qualifiziert wird, ist die Zulässigkeit des Trainings von kommerziellen KI-Anwendungen von weiteren Bedingungen abhängig. (1) Zu den verwendeten Werken muss ein rechtmäßiger Zugang bestehen. (2) Die Nutzung ist nur dann ohne Lizenz der Rechteinhaber:innen erlaubt, wenn diese keinen Nutzungsvorbehalt erklärt und so die Ausnahme außer Kraft gesetzt haben (opt out). Wurde ein solcher Vorbehalt erklärt, ist die Einholung einer Lizenz erforderlich. 

Über die genauen Modalitäten eines solchen Vorbehalts wird derzeit noch gestritten. Dem Normtext nach hat der Vorbehalt „ausdrücklich“ und „in angemessener Weise“ zu erfolgen. Bei Online-Werken muss der Vorbehalt zudem „maschinenlesbar“ sein. Zur Maschinenlesbarkeit zeichnet sich derzeit ab, dass das Robots Exclusion Protocol (robots.txt) den Anforderungen genügt. Zudem geht die bisherige deutsche Rechtsprechung davon aus, dass grundsätzlich auch Vorbehalte in natürlicher Sprache (z. B. Erklärungen auf einer Webseite oder in den AGB einer Webseite) maschinenlesbar sein können (OLG Hamburg 10.12.2025, 5 U 104/24; nicht rechtskräftig).

KI-Output und Urheberrecht aus europäischer Perspektive

Wie das Training ist auch der Output von KI-Anwendungen kein urheberrechtsfreier Raum. Die Problematik verdeutlicht sich anhand eines aktuellen Verfahrens vor dem LG München I (42 O 14139/24; nicht rechtskräftig), welches die GEMA gegen OpenAI führt. Das Verfahren: Verschiedene deutschsprachige Liedtexte (unter anderem „In der Weihnachtsbäckerei“ von Rolf Zuckowski) wurden auf einfache Anfragen (z. B. „Wie lautet der Text von [Titel]?“) an den KI-Chatbot ChatGPT exakt oder zumindest weitgehend identisch ausgegeben.

Die Entscheidung des LG München I ist aus zwei Gründen interessant: Zum einen schloss es aus der einfachen Reproduzierbarkeit der Texte darauf, dass diese im Modell „memorisiert“ wurden und daher das Modell selbst als urheberrechtlich relevante Vervielfältigung zu qualifizieren ist. Derartige Memorisierungen sind nach dem Gericht auch nicht mehr von der TDM-Ausnahme gedeckt.

Zum anderen beurteilte das LG München I die Darstellung der Texte im Ausgabetext als urheberrechtlich relevante Handlungen, da die geschützten Werke durch die Ausgabe vervielfältigt werden und es zu einer öffentlichen Zugänglichmachung der Werke an die Nutzer:innen kommt. Es zeichnet sich daher ab, dass auch für die Wiedergabe von Werken im Ausgabetext eines KI-Chatbots eine Lizenz von den Rechteinhaber:innen erforderlich ist.

Ausblick

Zum derzeitigen Stand gehen sowohl das KI-Training als auch die KI-Ausgaben mit urheberrechtlichen Haftungsrisiken einher. Aufgrund der Komplexität der rechtlichen Vorgaben und der fehlenden höchstgerichtlichen Judikatur bestehen aktuell viele offene Fragen, was zu einer gewissen Rechtsunsicherheit für alle Beteiligten führt.

Porträtfoto Philipp Homar
Univ.-Prof. Dr. Philipp Homar

Universitätsprofessor und Vorstand der Abteilung für Informations- und Immaterialgüterrecht
Wirtschaftsuniversität Wien

Porträtfoto Lukas Moormann
Lukas Moormann, LL.M.

Universitätsassistent der Abteilung für Informations- und Immaterialgüterrecht und Doktorand im österreichischen und europäischen Urheberrecht
Wirtschaftsuniversität Wien