
US-Gericht verneint Fair Use für KI-Training eines (nicht-generativen) Konkurrenzproduktes

Fachanwältin für Urheber- und Medienrecht Profil ansehen
Am 11. Februar 2025 hat das US-Bezirksgericht in Delaware ein sogenanntes Summary Judgement im Fall Thomson Reuters gegen Ross Intelligence (No. 1:20-cv-613-SB) abgegeben. Mittels eines Summary Judgements teilt ein Gericht seine vorläufige Rechtsmeinung zu den rechtlichen Fragen eines Falles mit (unabhängig von einer noch folgenden Beweiserhebung). Richter Stephanos Bibas entschied, dass das Training eines KI-Systems mit urheberrechtlich geschützten Inhalten in diesem Fall nicht durch die Fair-Use-Doktrin gedeckt ist. Die Entscheidung ist besonders relevant, da sie die erste in derzeit etwa 39 anhängigen KI-bezogenen Urheberrechtsverfahren in den USA ist, die sich ausdrücklich mit der Fair-Use-Problematik im Kontext von KI-Training auseinandersetzt.
Der Fall Thomson Reuters gegen Ross Intelligence
Im Mittelpunkt des Verfahrens stand zunächst die Frage, ob die sog. „Headnotes“ (juristische Zusammenfassungen in Leitsätzen) von Westlaw, einer Thomson Reuters gehörenden juristischen Datenbank überhaupt urheberrechtlich geschützt seien. Dies hatte Judge Bibas in einer ersten Entscheidung zu diesem Fall im September 2023 in Zweifel gezogen, da die Headnotes auf urheberrechtlich nicht geschützten Urteilen basierten. Hier vollzog Judge Bibas eine 180 Grad Wende, und kam nun zu der Auffassung, dass bereits ein minimaler Grad an Kreativität – „a spark of creativity“ – für einen Schutz ausreichend sei.
Im Weiteren war zu klären, ob Ross Intelligence diese „Headnotes“ sowie das Key-Number-System, verwenden durfte, um sein eigenes KI-basiertes juristisches Recherchetool zu trainieren. Ross hatte, nachdem Thomson Reuters eine Lizenzierung abgelehnt hatte, über einen Drittanbieter namens LegalEase rund 25.000 „Bulk Memos“ erstellen lassen, die aus Westlaw-Headnotes abgeleitet waren. Diese Daten wurden verwendet, um Ross‘ KI-Suchmaschine zu trainieren, die als Konkurrenzprodukt zu Westlaw konzipiert war. Die ungenehmigte Nutzung würde darüber hinaus einen potenziellen Lizenzmarkt für Trainingsdaten beeinträchtigen.
Das Gericht prüfte die vier zentralen Faktoren der Fair-Use-Doktrin („1: Nutzungszweck/Transformative Nutzung“, „2: Werknatur“, „3: Umfang“, „4: Marktbeeinträchtigung“) und kam zu dem Schluss, dass Ross‘ Nutzung nicht als „fair use“ einzustufen sei. Besonders entscheidend waren dabei der kommerzielle Charakter der Nutzung für ein konkurrierendes Angebot und die fehlende „Transformativität“, da das KI-System von Ross im Wesentlichen denselben Zweck erfüllte wie das Produkt von Thomson Reuters, nämlich bestehende Gerichtsurteile zu finden und bereitzustellen.
Keine generative KI – ein wichtiger Unterschied
Ein entscheidender Aspekt des Urteils liegt in der ausdrücklichen Betonung durch Richter Bibas, dass die Entscheidung nur für nicht-generative KI gilt. Im Gegensatz zu modernen generativen KI-Systemen wie ChatGPT, DALL-E oder Midjourney, die aus Trainingsdaten lernen und (überwiegend) neue Inhalte erzeugen können, gab Ross‘ System lediglich bestehende Gerichtsurteile wieder, die für die Nutzeranfrage relevant waren.
Richter Bibas schreibt dazu in seiner Urteilsbegründung: „Ross nutzte die Headnotes, um die Entwicklung eines konkurrierenden Rechtsrecherchetools zu erleichtern. Ross‘ Nutzung ist also nicht transformativ. Da sich die KI-Landschaft schnell verändert, möchte ich die Leser darauf hinweisen, dass ich mich heute nur mit nicht-generativer KI befasse.“
Warum könnten Fälle zu generativer KI anders ausgehen?
Im Zusammenhang mit dem Training von generativer KI könnten die Fair-Use-Faktoren anders bewertet werden, insbesondere hinsichtlich des ersten Faktors und hier der „Transformativität“ der Nutzung. Generative KI-Systeme erzeugen Inhalte, die sich von den Trainingsdaten unterscheiden können und (potenziell) vielfältige Einsatzbereiche haben. OpenAI und andere Anbieter argumentieren, dass ihre Systeme die Trainingsdaten in einer Weise transformieren, die weit über das bloße Abrufen hinausgeht – sie schaffen etwas Neues, das in dieser Form nicht in den Trainingsdaten existierte. Zudem würden bei generativer KI die ursprünglichen Werke nicht direkt im Output erscheinen, und die Auswirkungen auf den potenziellen Markt könnten weniger direkt sein als bei einem Konkurrenzprodukt wie im Fall von Ross.
In diesem Zusammenhang wird es sehr auf den betrachteten Markt ankommen. Bildgeneratoren, wie StableDiffusion, die in direkter Konkurrenz zu Bildagenturen, wie Getty Images, stehen, könnten hier durchaus als kommerzielle Konkurrenzprodukte anzusehen sein. Der Fall Getty Images v. Stability AI wird ebenfalls vor dem Bezirksgericht in Delaware ausgetragen.
Lizenzmarkt für KI-Training
Interessant ist hier vor allem, dass das Gericht innerhalb des vierten Faktors („Marktbeeinträchtigung“), der als wichtigster Faktor eingestuft wurden, anerkannte, dass die Lizenzierung von Daten für ein Training (juristischer) KI ein potenzieller Markt für Thomson Reuters gewesen sei. Dieses Argument ließe sich möglicherweise jedoch auch auf Fälle der generativen KI übertragen. Auch die Betreiber von generativen KI-Systemen schließen derzeit Lizenzverträge für Trainingsdaten – nicht nur im Bildbereich. Es mag daher Zufall gewesen sein, dass Meta einige Tage nach der Entscheidung Thomson vs Ross, bekannt gab, sein KI-Trainings-Lizenzprogramm für Verlage zunächst einzustellen.
Rechtslage in Deutschland: TDM statt Fair Use
Während in den USA die Fair-Use-Doktrin im Mittelpunkt der rechtlichen Bewertung steht, kennt das deutsche Urheberrecht ein solches Konzept nicht. Stattdessen gibt es in Deutschland spezifische Schrankenregelungen des Urheberrechts, insbesondere die sogenannte „Text- und Data Mining (TDM)“-Schranke der §§ 44b, 60d UrhG.
Die deutsche Diskussion dreht sich daher hauptsächlich um die Frage, ob und inwieweit diese TDM-Schranke ein lizenzfreies KI-Training zulässt. Besonders bei generativer KI argumentieren Rechteinhaber, dass die TDM-Schranke nach Sinn und Zweck nicht für das Zusammenstellen von Trainings-Datensätzen und das Training der KI-Modelle gedacht sei.
Ein prominentes Beispiel sind die Klagen der GEMA, die ein eigenes kostenpflichtiges Lizenzmodell für das KI-Training mit urheberrechtlich geschützten Musikwerken, sowie für die Nutzung von Songtexten etablieren möchte. Anders als in den USA, wo die Fair-Use-Doktrin flexibel angewendet werden kann, sind die deutschen Schrankenregelungen enger gefasst und damit möglicherweise weniger leicht ausdehnbar auf neue technologische Entwicklungen.
Fazit und Ausblick
Das Urteil im Fall Thomson Reuters gegen Ross Intelligence markiert einen wichtigen ersten Schritt in der rechtlichen Bewertung von KI-Training mit urheberrechtlich geschützten Werken, beschränkt sich aber ausdrücklich auf nicht-generative KI-Systeme. Für die zahlreichen anhängigen Verfahren gegen Anbieter generativer KI wie OpenAI, Microsoft, Suno oder Udio bleibt abzuwarten, wie die Gerichte die Fair-Use-Doktrin hier anwenden werden.
Für Unternehmen, die in Deutschland und Europa KI-Technologien entwickeln oder einsetzen, ist zu beachten, dass die rechtlichen Rahmenbedingungen andere sind als in den USA. Die Diskussion um die Anwendbarkeit der TDM-Schranke auf KI-Training ist noch nicht abgeschlossen, und der EU AI Act definiert hier ausdrücklich die Beachtung europäischen Urheberrechts.
Als vorläufiges Fazit lässt sich festhalten: Während das Delaware-Urteil ein starkes Signal gegen die unerlaubte Nutzung urheberrechtlich geschützter Inhalte für das Training konkurrierender KI-Systeme setzt, ist seine Anwendbarkeit auf allgemeine generative KI-Systeme begrenzt. In Deutschland und Europa werden die rechtlichen Rahmenbedingungen durch spezifische Schrankenregelungen bestimmt, die möglicherweise strengere Anforderungen an Hersteller und Anbieter von KI-Systemen stellen als die US-amerikanische Fair-Use-Doktrin.