Urheberrechtliche Aspekte bei Verwendung von Werken als KI-Trainings- und Inputdaten

15.10.2025

Urheberrechtliche Aspekte bei Verwendung von Werken als KI-Trainings- und Inputdaten

Header für das Thema Digitalrecht. Zu sehen ist der Autor Dr. Jonathan Pukas vor einem blauen Himmel mit weißen Wolken.

von Dr. Jonathan Pukas

Kaum ein Rechtsgebiet steht durch die Entwicklungen im Bereich künstlicher Intelligenz so sehr im Rampenlicht wie das Urheberrecht. Mit dem Aufkommen von Large Language Models und KI-gestützten Chatbots hat es sich zum Taktgeber des Digitalrechts entwickelt. Im Zentrum steht dabei die hochbrisante Frage, ob KI ohne Zustimmung betroffener Rechteinhaber mit deren Werken trainiert werden darf. An diese Kernproblematik knüpfen auch eine Vielzahl weiterer praxisrelevanter Fragen an.

KI-Training grundsätzlich urheberrechtlich erlaubt

Die Zulässigkeit des KI-Trainings mit Werken hängt insbesondere davon ab, ob auf den Sachverhalt eine urheberrechtliche Schrankenbestimmung, also eine gesetzliche Erlaubnis als Ausnahme vom urheberrechtlichen Ausschließlichkeitsrecht, angewendet werden kann. Trotz diverser Unklarheiten im Tatbestand ist das bei § 44b UrhG der Fall: Denn das KI-Training kann unter den Begriff des „Text und Data Mining“ gefasst werden. Die Vervielfältigungen sind daher grundsätzlich zulässig, ohne dass von betroffenen Rechteinhabern individuell eine Erlaubnis eingeholt werden muss. Zum Training genutzte Werke werden darüber hinaus auch nicht urheberrechtlich relevant im KI-Modell gespeichert. Nach dem seit Juni 2021 geltenden Urheberrecht ist das KI-Training mit Werken daher grundsätzlich zustimmungsfrei möglich.
Die gesetzliche Erlaubnis kommt allerdings nur dann zur Anwendung, wenn eine Reihe anderer Voraussetzungen ebenfalls erfüllt sind. Insbesondere darf kein Vorbehalt gegen die Nutzung der Werke abgegeben worden sein. Die Erklärung muss für online veröffentlichte Inhalte in maschinenlesbarer Form erfolgen. Das umfasst auch Vorbehaltserklärungen in natürlicher Sprache. Eine Erklärung „in Code“ ist zwar möglich, aber rechtlich nicht notwendig.

Werke auch als Inputdaten bei der Anwendung von KI nutzbar

Der Schrankentatbestand für Text und Data Mining aus § 44b UrhG umfasst darüber hinaus auch die Verwendung von Werken als Inputdaten für KI-Systeme. Diese werden nicht bei der Entwicklung, sondern bei der Anwendung einer KI als Berechnungsgrundlage zur Erzeugung konkreten Outputs genutzt. Die Freistellung gilt auch für die Verwendung von Werken als Berechnungsgrundlage generativer KI-Systeme.
 
Wichtig ist in diesem Zusammenhang aber, dass die gewährte Freistellung nur die Verwendung der Werke als Input der KI-Systeme umfasst. Davon zu trennen ist die Frage, ob ein generierter KI-Output Teile eines Werks urheberrechtlich relevant wiedergibt und seine Nutzung daher möglicherweise rechtsverletzend ist.
Zudem müssen auch bei der Nutzung von Werken als Inputdaten die übrigen Voraussetzungen des § 44b UrhG beachtet werden. Dies hat unter anderem zur Folge, dass die genutzten Werke auch rechtmäßig zugänglich gewesen sein müssen. Spielt sich die Datenverarbeitung in einem Dreipersonenverhältnis zwischen einem Rechteinhaber, einem Zugangsinhaber zu einer Werkdatenbank – beispielsweise einer Datenbank für wissenschaftliche Fachliteratur – und einem KI-Anwender ab, so folgen aus dieser Tatbestandsvoraussetzung hochkomplexe Fragestellungen. Sie müssen jeweils unter Berücksichtigung der konkreten Umstände des Einzelfalls beantwortet werden.

Es bleiben diverse regulatorische Defizite

Die kontrovers diskutierte und hier nur skizzierte Rechtslage wirft einige regulatorische Defizite auf. Diese machen ein Tätigwerden sowohl des nationalen als auch des europäischen Gesetzgebers notwendig. Eine gute Gelegenheit hierfür wäre die Evaluation der Richtlinie über das Urheberrecht im digitalen Binnenmarkt (RL 2019/790/EU).
 
Hiervon unabhängig könnte der nationale Gesetzgeber aber bereits heute tätig werden und eine gesetzliche Vergütungspflicht für vom KI-Training betroffene Urheber einführen. Diese könnte nach dem Vorbild der für den Ausgleich der Privatkopiefreiheit eingeführten Abgabe auf Geräte und Speichermedien ausgestaltet werden. Die Geschichte um das Urheberrecht im Wandel durch künstliche Intelligenz ist daher „to be continued“.

Dr. Jonathan Pukas ist wissenschaftlicher Mitarbeiter in der IP-Boutique NORDEMANN (Berlin). Seine Forschungsschwerpunkte liegen im Urheberrecht, insbesondere an den Schnittstellen zu Technologieanwendung und -entwicklung, künstlicher Intelligenz sowie zum Recht der Verwertungsgesellschaften. Seine Dissertation Werknutzung und Künstliche Intelligenz. Analyse und Perspektiven der urheberrechtlichen Rahmenbedingungen für die Verwendung von Werken als Trainings- und Inputdaten künstlicher neuronaler Netze ist aktuell im Nomos Verlag erschienen.