Norske forfattere kan få litt av pengene når Anthropic blar opp nær 15 milliarder etter å ha brukt bøker til å trene kunstig intelligens. – Dypt problematisk.
Publisert: Publisert:
For mindre enn 10 minutter siden
Kortversjonen
- AI-selskapet Anthropic har inngått et forlik som gir forfattere nær 15 milliarder kroner i kompensasjon etter at selskapet uten tillatelse lastet ned bøkene deres fra piratnettsteder for å trene sine språkmodeller.
- Et av nettstedene ser ut til å inneholde bøker fra en rekke norske forfattere, inkludert blant andre Vigdis Hjorth, Jon Fosse, Herbjørg Wassmo og Karl Ove Knausgård.
- Anthropic står bak tjenesten Claude, som er en konkurrent til ChatGPT.
- Både Forfatterforeningen og Forfatterforbundet er bekymret over AI-selskapers fremgangsmåte rundt opptreningen av kunstig intelligens (AI).
- Det er flere rettssaker på gang både i USA og Europa knyttet til materiale som brukes til språkmodeller.
Oppsummeringen er laget av AI-verktøyet ChatGPT og kvalitetssikret av E24s journalister
Tidligere denne måneden ble det inngått et forlik mellom AI-selskapet Anthropic og forfatterne Andrea Bartz, Charles Graeber og Kirk Johnson.
Anthropic står bak språkmodellen Claude, en konkurrent til ChatGPT.
Selskapet skal etter planen betale ut 1,5 milliarder dollar (14,86 milliarder kroner) pluss rente til forfattere og forlag, etter å ha lastet ned rundt syv millioner bøker fra to piratnettsteder for å trene kunstig intelligens.
– Det kan gjelde en god del norske forfattere, sier leder Bjørn Vatne i Forfatterforeningen til E24.
– Hvis du for eksempel ser på Vigdis Hjorth, så ligger det mange titler av henne i dette settet. Men det vil komme en endelig liste som er søkbar. Vi har bedt medlemmene våre registrere sine krav, sier han.
Forliket er ikke endelig godkjent av dommeren i saken. Det skjer muligens under en rettshøring 25. september, ifølge den amerikanske forfatterforeningen Author's Guild.
Wassmo, Hjorth og Fosse
Nettstedet The Atlantic har laget en søkemotor for verk som er med i en av databasene som skal være brukt til å trene opp AI-modeller, kalt Library Genesis.
Der finner man blant annet en rekke verk på flere språk av forfattere som Jon Fosse, Herbjørg Wassmo, Karl Ove Knausgård, Dag Solstad, Vigdis Hjorth, Ingvar Ambjørnsen, Maja Lunde, Lars Saabye Christensen, Jørn Lier Horst, Anne Holt, Jo Nesbø og mange flere.
– Hvordan ser dere på fremgangsmåten fra Anthropic?
– Vi syns det er dypt problematisk. Det er et soleklart brudd på i hvert fall norsk opphavsrettslov og åndsverklov, sier Vatne.
– Problemet er at de utnytter USAs fair use-praksis, som vi ikke har tilsvarende til her. Den går langt i å tillate denne typen bruk av slikt materiale. Forliket med Anthropic gjelder at selve nedlastingen av bøkene var ulovlig.
Forfatterne og forlagene kan forvente seg rundt 30.000 kroner per tittel som er brukt, oppgir Author's Guild.
– Får dette veldig billig
Også ForfatterforbundetForfatterforbundetForfatterforbundet ble etablert i 2018, delvis som reaksjon på Forfatterforeningens opptakskriterier, som ble oppfattet som strenge, ifølge Store Norske Leksikon vil gjøre sine medlemmer oppmerksomme på at de må registrere krav.
– Så langt vi har forstått er det slik at du kan ha rett på kompensasjon hvis verket ditt er registrert på engelsk og muligens noen andre språk, sier generalsekretær Eystein Hanssen i Forfatterforbundet til E24.
Han er usikker på nivået på kompensasjonen til forfattere for bruken av bøkene deres til å trene opp kunstig intelligens.
– Jeg tror selskapene får dette veldig billig, sier Hanssen.
I Norge forhandler Kopinor med Nasjonalbiblioteket om vederlag for bruk av bøker til å trene kunstig intelligens. Hanssen mener det må gis en form for vederlag for fremtidig bruk og inntjening.
– Det viktige er at man ikke lager avtaler som er endelige og for all fremtid, sier han.
– Symbolsk
Forliket vil trolig kompensere for rundt 500.000 av de syv millioner bøkene Anthropic skal ha lastet ned fra ulike pirat-databaser, ifølge amerikanske Author's Guild.
For å få erstatning må verkene ha vært registrert hos amerikanske patentmyndigheter innen fem år etter de er publisert.
– Det er symbolsk. Men dette er ikke slik det skal håndteres, med å bruke materialet først og så betale etterpå. Det må få andre følger hvis man skal kunne bekjempe dette i fremtiden, sier Vatne i Forfatterforeningen.
Han tror dette bare er starten på rettsoppgjørene rundt opptreningen av kunstig intelligens.
– Det ligger også flere saker i løypen i USA, og det er flere rettssaker i europeiske land som Frankrike og Tyskland. Det er foreløpig et cowboymarked, sier Vatne.
– Kanskje blir dette regulert om fem år, men da sitter de allerede med disse bøkene. Det er fortvilende for forfattere å se at livsverket deres brukes på denne måten, sier han.
– En seier
Det har vært et kappløp om å hente ut data til å trene opp språkmodeller i det siste.
– Det har vært en enorm skraping av innhold på internett og fra en del andre kilder, sier professor i medieinnovasjon og forsker på bruk av generativ kunstig intelligens og sosiale medier ved Universitetet i Oslo, Petter Bae Brandtzæg.
Forliket mellom Anthropic og de tre forfatterne er en av mange rettstvister rundt bruk av bøker og andre kilder til å trene språkmodeller.
– Jeg tenker at dette er en seier for de tre forfatterne som står bak søksmålet. 15 milliarder er ikke en ubetydelig sum, sier Brandtzæg.
Mente kravene var løst
Dommeren i saken mente at bruk av bøker til å trene kunstig intelligens ikke bryter USAs lover, men at Anthropic måtte møte i retten på grunn av bruken av piratkopiert materiale.
Da forliket ble inngått i starten av september sa Anthropic ifølge BBC at det «ville løse saksøkernes gjenstående krav».
– Vi er fortsatt opptatt av å utvikle trygge AI-systemer som hjelper mennesker og organisasjoner med å utvide sine evner, fremme vitenskapelige oppdagelser og løse komplekse problemer, sa juridisk direktør Aparna Stridhar i Anthropic ifølge BBC.