kunstig intelligens

Store Norske Leksikon hevder OpenAI har stjålet artikler 30 millioner ganger

Serverloggene til Store Norske Leksikon (SNL) viser at roboter fra OpenAI har lastet ned artikler fra SNL 30 millioner ganger.

Erik Bolstad er redaktør i Store Norske Leksikon.
Publisert Sist oppdatert

Redaktør i Store Norske Leksikon, Erik Bolstad, bekrefter overfor TV 2 at roboter fra OpenAI skal ha utsatt SNL for et enormt svært og systematisk tyveri.

Store Norske Leksikon består av rundt 200.000 artikler, som alle er skrevet av eksperter og fagfolk, de aller fleste med tilhørighet innenfor universitets- og høgskolesektoren.

Da SNL gikk gjennom serverne sine i sommer, oppdaget de at OpenAI hadde lastet ned enorme mengder av stoffet deres, som er beskyttet av opphavsretten.

Totalt skal artiklene til SNL ha blitt lastet ned 30 millioner ganger.

Har blokkert robotene

Ifølge Erik Bolstad er det ikke bare OpenAI, men også en rekke andre teknologiselskaper, som laster ned artikler fra Store Norske Leksikon.

Men ingen skal være i nærheten av omfanget som OpenAI representerer.

— Det er folk som har lagt ned utrolig mye arbeid og energi for at dette skal være til nytte for allmennheten. Hvis disse artiklene bare blir tatt av en tjeneste som er vår kanskje største konkurrent, og brukes videre uten kildehenvisninger, er det helt umoralsk, sier Bolstad til TV 2.

Han informerer ellers om at SNL har valgt å blokkere robotene til OpenAI og nekte dem å laste ned innholdet.

Svarer ikke på anklagene

OpenAI skriver i en e-post til TV 2 at SNL ikke har nektet å «søke» på sidene deres. Derfor har de fortsatt å besøke leksikonet og lenke tilbake til aktuelle artikler i chatter med brukere.

OpenAI sier også at de overholder SNLs ønske om ikke å trene ChatGPT på innholdet deres.

Teknologigiganten svarer ikke direkte på anklagen om at nedlastingene er et «systematisk tyveri», skriver TV 2.

Rettelse 26. mars, kl 14.30: I en tidligere versjon av denne saken skrev vi at OpenAI skal ha lastet ned alle artiklene i Store norske leksikon 30 millioner ganger, og at det tilsvarte 4700 milliarder A4-ark. Dette var basert på utregninger som TV 2 hadde gjort, men som nå viser seg å være feilaktige. Overfor Digi.no bekrefter Erik Bolstad at det dreier seg totalt 30 millioner nedlastinger.

Powered by Labrador CMS