Utvikler i VG, Oda Leraaen Skjetne, forteller om et av flere KI-verktøy mediehuset bruker i dag.
Verktøyet er så enkelt at det tar en artikkel fra et annet mediehus og lager en sitatsak.
– Noen er veldig redde for at KI skal ta jobben til journalistene. Jeg tror ikke det er noe fare for det, men en del av det vi kaller drittjobben kan vi få KI til å hjelpe til med, sier Skjetne fra scenen.
Hun har selv vært journalist, men er nå KI-utvikler i VG. Hun tegnet et scenario som mulig flere kjenner seg igjen i:
– Mange av dere som er journalister har sikkert sittet på en kveldsvakt eller dagvakt og fått beskjed om å lage en sitatsak når dere egentlig vil bruke tiden til unik journalistikk og egne saker.
– Dette er ting vi må ha i miksen og som leserne vil ha, men det er som regel ikke her vi legger den journalistiske sjela vår, med å sitere andre medier.
Satser på det unike
Hun forteller om prisjektet under KI- og mediedagen 2025 på Pressens Hus.
Foran en fullstappet sal sier hun at VGs tanke er at det vil være en haug med firmaer som lager botter og tjenester som oppsummerer nyheter.
– Vi må satse på det som gjør oss unike. Vi må satse på det som får oss til å skille oss ut. Det er ikke det her, sier hun om sitatsakene.
Oda Leraaen Skjetne, KI-utvikler i VG.Foto: Kent Olsen
For å komme i gang testet de lette og lite etisk vanskelige saker. Resultatet var de så fornøyd med at de intensiverte arbeidet.
Men det gjøres ikke uten kvalitetssikring. Skjetne forteller at de har kvalitetsledd i systemet.
Kjører blindtester
Skjetne understreker viktigheten av å evaluere etter hvert som utviklingen skjer og nye modeller kommer på banen.
– På alle nye KI-botter eller agenter bygger vi evalueringssett som gjør at vi kan skru på verktøyet og se om den gjør det bedre eller dårligere, forklarer hun.
Eksempler på sjekkpunkter er:
Refererer artikkelen til kilden?
Lenker den?
Skriver den for langt eller kort?
Riktig bruk av tegnsetting
– Hvis du lager et datasett med nok artikler, så får du datasett som du kan kjøre for å sjekke om den scorer bra på forskjellige ting, sier hun.
Så er spørsmålet: hvilken språkmodell lager best VG?
For å finne ut av det har VG kjørt flere blindtester der de tester ulike språkmodeller, og lar journalister velge hvilken de synes er best. Både Claude og Gemini er i toppsjiktet da de utførte testene.
– OpenAI sin GPT 4o er dårligst, og det er den alltid når vi tester hvem som skriver best, sier hun.
Har du tips til denne eller andre saker? Kontakt oss på: tips@medier24.no