Sjefredaktør i VG, Gard Steiro, utviklingsredaktør i Dagbladet, Martine Lunder Brenne, teknologidirektør i NRK, Pål Nedregotten og prosjektleder for redaksjonell KI i TV 2, Chris Ronald Hermansen.Foto: Kristine Sterud
NRK blokkerer ChatGPT – derfor vil ikke norske medier gi data til KI
NRK har innført en sperre for at KI-aktører ikke skal kunne trene modellene sine på NRK-innhold.
(PRESSENS HUS, OSLO): For halvannen uke siden bestemte NRK å innføre en sperre som skal hindre KI-aktører som ChatGPT i å bruke NRK-saker til å trene opp sine språkmodeller.
Til Medier24 sier teknologidirektør Pål Nedregotten at det er tre hovedgrunner til det:
Opphavsrett
Transparens
NRKs posisjon
Han forklarer at de ønsker å beskytte sin opphavsrett, og at man må ha en avtale med NRK for å bruke deres innhold.
Når det gjelder transparens mener han at publikum skal kunne stole på informasjonen du får fra NRK.
– Og at ikke den blir videreformidlet gjennom en tredjepart, der vi på mange måter har mistet kontrollen på innholdet.
Det handler også om NRKs posisjon, og at de vil ha leserne og seerne til å oppsøke NRKs platformer direkte.
– NRK skal være det stedet du finner innhold fra NRK. Du skal for eksempel ikke kunne bruke tredjepartstjenester til å spørre hva de viktigste nyhetene fra NRK er, uten å forholde deg til NRK som avsender.
Var en diskusjon
Om norske medier skal dele innhold med kunstig intelligens, var tema for en panelsamtale på Pressens hus i Oslo.
I NRK har det vært en vanskelig diskusjon internt, forteller Nedregotten fra scenen.
– Argumentene mot å sperre handler om at modellene bare blir trent på ikke-redaksjonelt innhold. Og så handler det om samfunnets tilgang til informasjon og faktainformasjon, sier Nedregotten.
I Sverige har SVT landet på det motsatte av NRK.
Norsk innhold allerede brukt
De internasjonale språkmodellene benytter seg av - og bygger modellene sine på store datasett.
Datasett som MC4, OpenWebText og OpenWebText2 inneholder mye norsk, redaksjonelt innhold. Det viser en ny rapport bestilt av Mediebedriftenes Landsforening, Fagpressen, Norsk Journalistlag og Norsk Redaktørforening.
Dermed er det en stor andel norsk innhold som allerede er brukt til å trene opp språkmodeller.
Prosjektleder for redaksjonell KI i TV 2, Chris Ronald Hermansen, er overrasket over omfanget – på tross av at TV 2 har sagt at deres innhold ikke kan brukes.
– De har forsynt seg grovt, uavhengig av hva man har gitt beskjed om tidligere.
VG var blant mediehusene tidlig ute med å innføre sperre.
– Vi vet at mye av innholdet vårt var tilgjengelig før vi sperret, sier Gard Steiro, sjefredaktør i VG.
Utviklingsredaktør i Dagbladet, Martine Lunder Brenne, tror ikke blokkene norske medier setter opp, har så mye å si.
– Vi veit jo ikke i hvor stor grad disse gigantene bryr seg om blokkene. Det overrasker meg ikke at dataene er som de er, sier hun.
Todelt
VG påpeker at de er ikke mot å hjelpe språkmodeller.
– Vi har for eksempel delt alt innholdet vårt med Nasjonalbiblioteket og norske aktører, sier Steiro.
Han sier dilemmaet er todelt: det ene er å la språkmodeller bruke arkivmateriale for å øve seg på det. Da mener han man må få betalt for det for å beskytte opphavsretten.
Det andre er hva som skjer med realtidsdata, at modellene for eksempel lager nyhetsoppdateringer av ting som skjer fortløpende, istedenfor at folk leser nettavisene.
– Frykten er at vi bidrar til å utvikle produkter som overkjører mediene, sier han.
Verken VG eller Dagbladet har konkrete forslag fra teknologigigantene om å kjøpe deres innhold. Lunder Brenne sier man må kunne tenke på mulighetene også.
– Å si at vi vil søke avtaler og muligheter, og at det kan ha en pris, er ikke å være dystopisk.
Har du tips til denne eller andre saker? Kontakt oss på: tips@medier24.no