Beinahe im Wochentakt macht generative KI große Schritte. Immer beeindruckender wird sie im Generieren von Texten, Bildern und Code. Hitziger werden zugleich auch die Auseinandersetzungen um solche Werkzeuge: Nicht nur der kreative Schaffensprozess, auch ganze Kreativberufe sind möglicherweise im Umbruch. Schließlich speisen sich die Modelle dahinter aus vorhandenem Wissen und Werken dieser Welt. Den KI-Modellen liegt dabei milliardenfach menschlich geschaffene, geistige und kreative Arbeit zugrunde – Zeitungsartikel, wissenschaftliche Aufsätze, Fotos, Videos usw. Dürfen also (kommerzielle) Betreiber Inhalte im Netz einsammeln, um ihre KI-Modelle damit zu trainieren? Seit einiger Zeit ziehen Verlage und Autorinnen und Autoren zur Klärung dieser Frage vor Gericht. Dabei geht es um das Urheberrecht an den Materialien, die in die KI-Modelle durch ihr Training einfließen.
Man muss sich zunächst einmal klarmachen, was mit dem Urheberrecht bezweckt werden soll: Es macht ein Werk (etwa Text, Bild, Film, Musik) zu einem handelbaren Wirtschaftsgut, indem es andere von der Nutzung ausschließt und man Nutzungsrechte gegen eine Vergütung einräumen kann. Es gibt außerdem einen Anspruch auf die Wahrung von Persönlichkeitsrechten, insbesondere dem Verbot der Entstellung von Werken. Zugleich: Der Inspiration und Innovation will das Urheberrecht nicht im Wege stehen. Auch das Wissen, das in einem Werk steckt, ist frei. Genauso wenig will das Urheberrecht verhindern, dass Werke im Stil von bereits Bestehendem geschaffen werden. Denn geschützt sind nur konkrete Werke, niemals aber Stile, Fakten, Theorien. An dieser Stelle die Gesetze zu verändern, wäre ein Bruch mit bisherigen Prinzipien.
Vergleichbarkeit mit analogen Phänomenen
Wie kommt es dennoch dazu, dass das Training von KI-Modellen in Teilen als Diebstahl von geistigem Eigentum bezeichnet wird? Man könnte schließlich auch einen Vergleich darin ziehen, dass Menschen sich durch „Werkgenuss“ inspirieren und das Wissen der Welt aufsaugen. Zumindest rechtstechnisch ist das aber etwas anderes: Wenn Werke massenhaft für das Training von KI-Modellen eingesammelt werden, stellt dies jeweils eine Vervielfältigung dar. Beispielsweise wird im Vorfeld einer Bild-KI das Netz gescraped, d. h., es werden aus vielen Quellen Kopien von Bildern angefertigt, um damit KI-Modelle zu trainieren. Dieses Training erfolgt durch die Verarbeitung großer Datenmengen, die heute möglich ist.
Ob für solche Vervielfältigungen nun Zustimmungen eingeholt werden müssen, ist die Frage, die aktuell sehr umstritten ist. Denn das Urheberrecht macht bestimmte Nutzungshandlungen im Allgemeininteresse nicht von einer individuellen Zustimmung abhängig, sondern stellt sie gesetzlich frei. Dieser Interessenausgleich findet schon lange Anwendung, wenn etwa eine Wissenschaftlerin oder ein Wissenschaftler zur Eigenlektüre einen Aufsatz kopiert, oder als Schallplatten für private Zwecke noch auf Tonband kopiert wurden. Im Kontext von KI-Training wird regelmäßig die sogenannte Text-und-Data-Mining-Erlaubnis (§ 44b UrhG) herangezogen, die nach dem erklärten Willen des Gesetzgebers auch für Innovationen im KI-Bereich geschaffen wurde, und unter der sich das Training von KI-Modellen mit guten Gründen bejahen lässt. So sah es auch im September 2024 das Landgericht Hamburg als erstes Gericht in Deutschland, das sich damit zu befassen hatte (Az. 310 O 227/23). Inwieweit dieser Fall allerdings verallgemeinerungsfähig ist (im genannten Fall ging es um ein Open-Source-Bildmodell), muss sich erst noch zeigen. Letztlich wird in Europa wohl erst der Europäische Gerichtshof Klarheit bringen.
Der Hauptanwendungsfall und die Hauptfrage von (generativer) KI dürfte – viel mehr als die Fälle von Nachahmung oder Stilkopie – sein, dass KI „belesen“ ist, möglichst viel Wissen und Kultur aufgesogen hat, um dies in der Interaktion mit den Anwenderinnen und Anwendern zu verarbeiten und in einer anderen Form wiederzugeben. Das hat – wie oben angesprochen – eigentlich mit Urheberrecht und dem Generieren von Werken nichts zu tun, sondern eher mit Informationsgewinnung und -verarbeitung.
Eine wohl eher nebensächliche Frage lautet schließlich noch, ob KI-geschaffene Werke ein Urheberrecht genießen können. Hier ist sich die Rechtswissenschaft weitgehend einig: Ausschließlich KI-generierte Werke genießen kein Urheberrecht, denn ein Werk setzt eine persönliche geistige Schöpfung voraus. Und diese kann nur durch einen Menschen geschaffen werden. Differenzieren muss man allerdings, wenn die KI nur ein Werkzeug ist und der kreative Beitrag durch den Menschen in den Vordergrund tritt. In diesen Fällen entsteht Urheberrechtsschutz.
Gesellschaftliche Relevanz
Wie man auch zu generativer KI steht – die dahinterliegenden Wertungsfragen sind von großer Bedeutung und es ist zu wünschen, dass Klarheit geschaffen wird. Denn natürlich sind durch diese mächtige Technologie viele Berufsbilder vor gewaltige Herausforderungen gestellt. Dabei ist überhaupt nicht gesagt, dass generative KI automatisch Urhebererinnen und Urhebern schadet. Auch hilft sie vielen Kreativen bei ihrer Arbeit. Das Urheberrecht stellt dabei nur eines von vielen Instrumentarien dar, mit dem die gesellschaftlichen Folgen von generativer KI ausgehandelt und die Voraussetzungen für das Anbieten solcher Tools festgelegt werden können. Vermutlich wird sich die Technologie, die ohnehin schon so potent ist, auch nicht mit den Mitteln des Urheberrechts aufhalten lassen. Erwähnt sei schließlich noch, dass Inhaberinnen und Inhaber von Urheberrechten selbst einen KI-Nutzungsvorbehalt erklären können, der zumindest für kommerzielle KI-Anbieter verbindlich ist.