Apple saksøkte for angivelig å ha brukt piratkopierte bøker for å trene AI-modeller

Apple står overfor et foreslått gruppesøksmål i U.S. District Court for Northern District of California, anlagt av forfatterne Grady Hendrix og Jennifer Roberson. Saken anklager selskapet for ulovlig å bruke opphavsrettsbeskyttede bøker for å trene sine kunstige intelligensmodeller, inkludert de som brukes til Apple Intelligence.

I sentrum av saken er et datasett kalt Books3, som er viden kjent for å inneholde piratkopierte verk fra "skyggebiblioteker" som Bibliotik. Forfatterne hevder at Apple stolte på Books3 gjennom forbindelsen til RedPajama, et datasett som brukes til å trene OpenELM, selskapets store språkmodell med åpen kildekode. Siden OpenELM ble offentlig dokumentert av Apple i 2024, hevder saksøkerne at det samme piratkopierte materialet også kan ha blitt brukt til å trene opp Apples Foundation Language Models.

Søksmålet fremhever at Apple ikke søkte tillatelse, ga kreditt eller betalte kompensasjon for forfatternes verk, til tross for at de brukte dem til å trene opp systemer som underbygger en potensielt lukrativ satsing. Saksøkerne hevder at denne praksisen utvannet markedet for bøkene deres og fratok dem kontroll over deres åndsverk. De søker erstatning, oppreisning, advokatsalærer og til og med ødeleggelse av Apples AI-modeller som inkluderer piratkopierte treningsdata.

Denne saken følger en bølge av søksmål rettet mot selskaper som utvikler generativ kunstig intelligens. Anthropic gikk nylig med på å betale 1,5 milliarder dollar i et rekordoppgjør med forfattere over lignende krav. I mellomtiden har Meta med suksess forsvart seg mot anklager om brudd på opphavsrett, med en rettskjennelse om at treningspraksisen faller under rimelig bruk. Microsoft og OpenAI har også møtt søksmål for misbruk av opphavsrettsbeskyttede bøker.

RELATERT:Meta anklaget for å bruke 81,7 TB med piratkopierte bøker for å trene AI-modeller

For Apple er timingen bemerkelsesverdig. Selskapet har offentlig understreket sin innsats for å trene opp AI-systemer på en ansvarlig måte, inkludert å tilby lisensavtaler til utgivere og signere avtaler med innholdsleverandører som Shutterstock. Apple har også lovet å respektere nettstedrestriksjoner som robots.txt når du skraper data. Til tross for disse tiltakene, hevder søksmålet at selskapet fortsatt hadde fordel av datasett knyttet til piratkopiert materiale.

Saken vil teste hvordan domstolene balanserer immaterielle rettigheter mot behovene til AI-utvikling. Etter hvert som den juridiske kampen utfolder seg, kan utfallet omforme fremtiden til Apple Intelligence og sette en presedens for hvordan teknologiselskaper nærmer seg datainnhenting for opplæring av modellene sine.

(viaReuters)