Første del er en oversikt over status på de ulike datasettene som brukes til trening av språkmodeller og hvilket materiale som inngår i dette. Denne delen er skrevet av Svein Arne Brygfjeld ved Nasjonalbiblioteket (https://ai.nb.no/about-us/).
I del to ser vi på de mulige langsiktige konsekvensene av KI for mediehusene. Dette gjøres gjennom et notat som ser på ulike scenarier og beskrivelser som har vært publisert, diskutert og analysert av forskere, KI-eksperter, bransjeeksperter og mediebransjen selv i løpet av de siste månedene. Notatet er skrevet av Frank Gander.
Siste del undersøker mengde innhold fra medlemmer av MBL og Fagpressen som inngår i de datasettene som er brukt til trening av modellene til Open AI/ChatGPT. Her inngå også en analyse av muligheten for direkte gjengivelse av innholdet som inngår i treningen. Arbeidet er gjort av Peng Liu som arbeider som forsker ved Institutt for datateknologi og informatikk ved NTNU og er tilknyttet NorwAI (https://www.ntnu.no/ansatte/penl)
Last ned rapporten her
Se opptak av frokostmøte om rapporten her