Apple sieht sich mit einer geplanten Sammelklage vor dem US-Bezirksgericht für den nördlichen Bezirk von Kalifornien konfrontiert, die von den Autoren Grady Hendrix und Jennifer Roberson eingereicht wurde. In der Klage wird dem Unternehmen vorgeworfen, illegal urheberrechtlich geschützte Bücher zum Trainieren seiner Modelle für künstliche Intelligenz verwendet zu haben, darunter auch die für Apple Intelligence verwendeten.
Im Zentrum des Falles steht ein Datensatz namens Books3, der bekanntermaßen Raubkopien aus „Schattenbibliotheken“ wie Bibliotik enthält. Die Autoren behaupten, dass Apple sich durch seine Verbindung zu RedPajama, einem Datensatz, der zum Trainieren von OpenELM, dem Open-Source-Großsprachenmodell des Unternehmens, verwendet wird, auf Books3 verlassen hat. Da OpenELM im Jahr 2024 von Apple öffentlich dokumentiert wurde, argumentieren die Kläger, dass dasselbe Raubkopienmaterial möglicherweise auch zum Trainieren der Foundation Language Models von Apple verwendet wurde.
In der Klage wird hervorgehoben, dass Apple für die Werke der Autoren weder eine Genehmigung eingeholt, noch einen Kredit gewährt oder eine Entschädigung gezahlt hat, obwohl sie diese zum Trainieren von Systemen verwendet haben, die einem potenziell lukrativen Unterfangen zugrunde liegen. Die Kläger behaupten, dass diese Praxis den Markt für ihre Bücher verwässerte und ihnen die Kontrolle über ihr geistiges Eigentum entzog. Sie fordern Schadensersatz, Rückerstattung, Anwaltskosten und sogar die Zerstörung von Apples KI-Modellen, die die raubkopierten Trainingsdaten enthalten.
Dieser Fall folgt auf eine Welle von Klagen gegen Unternehmen, die generative KI entwickeln. Anthropic stimmte kürzlich zu, 1,5 Milliarden US-Dollar in einem Rekordvergleich mit Autoren wegen ähnlicher Ansprüche zu zahlen. Unterdessen hat sich Meta erfolgreich gegen Vorwürfe der Urheberrechtsverletzung gewehrt und ein Gericht entschieden, dass seine Schulungspraktiken unter die Fair-Use-Regelung fallen. Microsoft und OpenAI wurden ebenfalls mit Klagen wegen Missbrauchs urheberrechtlich geschützter Bücher konfrontiert.
Für Apple ist der Zeitpunkt bemerkenswert. Das Unternehmen hat öffentlich seine Bemühungen betont, KI-Systeme verantwortungsvoll zu trainieren, indem es Verlagen Lizenzverträge anbietet und Vereinbarungen mit Inhaltsanbietern wie Shutterstock unterzeichnet. Apple hat sich außerdem verpflichtet, beim Scraping von Daten Website-Beschränkungen wie robots.txt zu respektieren. Trotz dieser Maßnahmen wird in der Klage behauptet, dass das Unternehmen weiterhin von Datensätzen profitiert habe, die mit Raubkopien verknüpft seien.
Der Fall wird testen, wie Gerichte geistige Eigentumsrechte mit den Bedürfnissen der KI-Entwicklung in Einklang bringen. Im weiteren Verlauf des Rechtsstreits könnte das Ergebnis die Zukunft von Apple Intelligence verändern und einen Präzedenzfall dafür schaffen, wie Technologieunternehmen die Datenbeschaffung für das Training ihrer Modelle angehen.
Mehr Lektüre:Meta wird beschuldigt, 81,7 TB an Raubkopien von Büchern zum Trainieren von KI-Modellen verwendet zu haben
(überReuters)
