Auf den ersten Blick scheinen der 1987 verstorbene Künstler Andy Warhol, die Gruppe Kraftwerk und die aktuellen Debatten um Künstliche Intelligenz („KI“) wenig bis gar nichts miteinander zu tun zu haben. Doch wie so häufig trügt der Schein.
LG Hamburg im LAION-Verfahren: Datensammlung auf Kosten von Urheberrechten
Dienstag, 08. Oktober 2024
Es ist noch immer rechtlich nicht vollständig geklärt, ob die Nutzung urheberrechtlich geschützten Contents zum Zwecke des KI-Trainings von der Schrankenregelung für das sogenannte Text and Data Mining (TDM-Schranke) erfasst ist. Das Landgericht Hamburg hat in seinem Urteil vom 27.09.2024 (AZ 310 O 227/23) festgestellt, dass jedenfalls das Herunterladen von urheberrechtlich geschützten Bildern zur Erstellung von Datensätzen, die für KI-Training verwendet werden können, eine nach der Schrankenregelung des § 60d Abs. 1 UrhG zulässige Vervielfältigung darstellen kann. Das KI-Training selbst war hingegen nicht Gegenstand des Urteils.
Sachverhalt
LAION e.V. (Beklagter) ist ein Verein mit der Zwecksetzung, Datensätze, die für das Training sogenannter generativer KI genutzt werden können, kostenfrei öffentlich zur Verfügung zu stellen.
Für die Erstellung solcher Datensätze bediente sich der Beklagte als Ausgangsmaterial öffentlich zugänglichen Datensätzen, welche Hyperlinks zu Bildern, die im Internet frei zugänglich sind, enthielten, nebst einer kurzen Beschreibung des jeweiligen Bildinhaltes. Der Beklagte extrahierte die Hyperlinks und lud die Bilder herunter – darunter auch ein Bild des klagenden Stock-Fotografen von der Seite einer Bildagentur, an welche dieser die Nutzung seines Bildes lizenziert hatte. Anschließend wurden die Übereinstimmungen von Bildinhalt und Bildbeschreibung mittels einer Software verifiziert. Im Falle einer Übereinstimmung wurden Hyperlink und Bildbeschreibung in einen eigenen Datensatz übertragen. So auch in Bezug auf das Bild des Klägers.
Die Bildagentur des Klägers untersagte in ihren Nutzungsbedingungen auf der Homepage das Herunterladen oder die sonstige Verwendung von Inhalten von deren Internetseite durch automatisierte Vorgänge.
Der klagende Stock-Fotograf war der Ansicht, dass das Herunterladen seines Bildes eine unzulässige Vervielfältigung nach § 16 UrhG darstellt.
Die hierzu ergangene Entscheidung des LG Hamburg ist in mehrfacher Hinsicht interessant:
Differenzierung zwischen Datensatz, KI-Training und Verwendung einer KI
Das Urteil kursiert derzeit als „erste“ deutsche gerichtliche Entscheidung über die Verwendung urheberrechtlich geschützter Werke für das Training von KI. Das Gericht stellte allerdings in seinen Entscheidungsgründen ausdrücklich klar, dass es in diesem Fall um die Erstellung eines Datensatzes für KI-Training durch Text und Data Mining geht und gerade nicht um die urheberrechtliche Zulässigkeit des tatsächlichen Trainings einer KI mit diesem Datensatz. Zur besseren Abgrenzung:
Ganz generell ist für die urheberrechtliche Beurteilung zwingend zwischen (1) der Erstellung des Trainingsdatensatzes (wie im vorliegenden Fall), (2) dem eigentlichen Training der KI mit diesem Datensatz und (3) der finalen Verwendung der KI zu differenzieren.
Die konkrete Verwendungsmöglichkeit eines Datensatzes ist bei seiner Erstellung noch nicht sicher absehbar und mithin nicht rechtssicher feststellbar, sodass es auf die bloße Absicht einer späteren Verwendung zu KI-Trainingszwecken nicht ankommt.
Schrankenregelung des § 60d UrhG greift
Nach Auffassung des Gerichts ist das Herunterladen eines Bildes für den anschließenden Verifikationsprozess im konkreten Fall eine zulässige Nutzung: Die Analyse, welche den Vergleich von Bildinhalt und Bildbeschreibung sowie die Datensammlung zur Ermittlung von Korrelationen (Match oder No-Match) umfasst, sei als Text und Data Mining zu qualifizieren, zu dessen Zweck die Vervielfältigung zulässig sei. Darüber hinaus ziele die Datensammlung auf – wenn auch zukünftigen – Erkenntnisgewinn ab und diene ebenfalls wissenschaftlichen Zwecken: Trotz der geplanten Bereitstellung von Datensätzen an private Unternehmen sei der LAION e.V. nach Auffassung des Gerichts als Forschungsorganisation gemäß § 60d Abs. 2 UrhG zu qualifizieren.
Der Kläger, der insoweit beweispflichtig ist, konnte nach Auffassung des Gerichts keinen ausreichenden Nachweis für das Vorliegen des Ausschlusstatbestandes nach § 60d Abs. 2 S. 3 UrhG erbringen, der besagt, dass die Schrankenregelung nicht greift, wenn ein privates Unternehmen einen bestimmenden Einfluss und privilegierten Zugang zu den Ergebnissen der Forschungsorganisation hat.
Da der LAION e.V. die Datensätze kostenfrei und öffentlich zugänglich macht, sei nach Auffassung des Gerichts von einer nicht-kommerziellen Zweckverfolgung auszugehen, unabhängig davon, ob diese Datensätze später von KI-Unternehmen für kommerzielle Zwecke verwendet würden.
Ausführungen zur Maschinenlesbarkeit von Nutzungsvorbehalten (§ 44b UrhG Abs. 3)
Die Vervielfältigung für das Text und Data Mining auch rechtmäßig zugänglicher Werke ist unzulässig, wenn der Rechteinhaber sich die Nutzung in „maschinenlesbarer Form“ vorbehält. Was hierunter zu verstehen ist, war bislang unklar. Insofern bringt das Urteil etwas Klarheit: Das Gericht neigt dazu, auch in natürlicher Sprache verfasste Nutzungsvorbehalte – wie sie auf der Website der Bildagentur vorhanden waren – als ausreichend anzusehen, insbesondere, da es davon ausgeht, dass eine KI-Anwendung in der Lage sein muss, solche Vorbehalte zu erkennen. Es legt den Terminus „maschinenlesbar“ damit weit aus.
Fazit und Ausblick
Das Urteil bezieht sich nicht auf die urheberrechtliche Zulässigkeit von KI-Training, sondern lediglich auf die Erstellung von Datensätzen, die für das Training von KI verwendet werden können.
Das Urteil betrifft Regelungen aus dem UrhG, die dem Unionsrecht entspringen, sodass dem Urteil wohl europaweite Bedeutung zukommen wird.
Mit seinem Obiter Dictum zur Maschinenlesbarkeit von Nutzungsvorbehalten stellt sich das Gericht gegen die derzeit herrschende Literaturauffassung. Die Auslegung des Gerichts, dass ein Nutzungsvorbehalt in natürlicher Sprache für die Maschinenlesbarkeit ausreichend ist, ist urheberfreundlich. Zusätzliche technische Vorkehrungen wären demnach nicht erforderlich, um diese Voraussetzung zu erfüllen.
Man darf gespannt sein, wie es weitergeht: Die Parteien haben zu erkennen gegeben, den Rechtsstreit durch die Instanzen treiben zu wollen, wobei die Frage nach der Auslegung der einzelnen Schrankenregelungen bis zum EuGH getragen werden kann.
ein Beitrag von Dr. Katharina Garbers-von Boehm, LL.M. und Betim Neziraj