Digitaliserer flere titalls millioner sider for å bevare norsk kulturarv

henrik g bastiansen

ENGASJERT: Professor Henrik G. Bastiansen gir et detaljert innblikk i prosessen som digitaliserer norsk mediehistorie. (Foto: Niclas Bergh Bugge)

Nasjonalbiblioteket har siden 2006 jobbet med å digitalisere hele Norges medie- og kulturarv. Tirsdag var professor Henrik G. Bastiansen på plass i Berte Kanutte-huset på Høgskulen i Volda og ga et innblikk i hvordan denne prosessen går for seg.

VOLDA: Forskningsdagene er godt i gang, og tidlig tirsdag ettermiddag var det foreleser ved Høgskulen i Volda, Henrik G. Bastiansen, som tok til orde. Bastiansen har i en årrekke drevet med forskning på norsk mediehistorie.

Dette foredraget var resultatet av den nyeste forskningen hans, som har hatt fokus på Nasjonalbiblioteket og dets innsats når det kommer til å digitalisere alt som noensinne er publisert i Norge. 

Prosjektet har blitt omtalt som «det største kunnskapsløftet i landets historie» og «et av de mest ambisiøse digitaliseringsprosjekt verden hittil har sett», i tillegg til å ha en anslått prislapp på 500 millioner kroner.

Digitalt sikringsmagasin inni fjellet

– Nasjonalbiblioteket skal bevare materialet i et tusenårsperpektiv, begynner Bastiansen.

GRUNDIG: Tirsdagens foredrag ga oss et grundig overblikk over arbeidet som pågår. (Foto: Niclas Bergh Bugge)

– Med andre ord, dersom man i år 3019 skal undersøke hva norske medier har publisert, skal det teoretisk være mulig å studere nåtiden i detalj.

Når man skal lagre så mye data, kreves enorme mengder lagringskapasitet.

Som en løsning på dette problemet, har Nasjonalbiblioteket laget et sikringsmagasin i fjellet i Rana som utvides etter behov. Der inne finner man harddisker som per i dag kan lagre omkring 20 petabytes med data. 

– I 2017 var mer enn 5 millioner digitale objekter lagret her inne, med ca. 30 prosent av hele samlingen digitalisert. Per 2016 var Nasjonalbiblioteket kommet lengre enn noe annet sammenlignbart nasjonalbibliotek i verden.

Scanner tusenvis av sider daglig

Så hvordan digitaliserer man egentlig aviser og tidsskrifter som er over 100 år gamle?

Bastiansen forteller at Nasjonalbiblioteket har dedikterte maskiner som både blar i bøker og scanner de automatisk, og at disse kan scanne tusensvis av sider hver dag.

publikum
STOR INTERESSE: Oppmøtet til foredraget var godt, og publikum fulgte nøye med. (Foto: Niclas Bergh Bugge)

– I 2013 opplevde dette prosjektet økt omtale i verdenspressen, fra BBC, The Independent, Huffington Post og andre aktører. Sean Martin fra British Library har også sagt at «avdelingen i Rana er verdens mest dynamiske på sitt område» i sin omtale av den automatiske scanningen.

Ufattelige mengder informasjon

Digitaliseringsprosjektet, som har som mål å være ferdigstilt i 2026, tar sikte på å ha landets mest komplette samling av publisert norsk materiale innenfor alle medietyper. 

Til nå har over 600 000 bøker blitt digitalisert totalt, 250 000 av disse er tilgjengelig online. I tillegg skal 75 millioner avissider gjennom samme prosess.

bøker
KNUT, ALF, ALEX OG HENRIK: Alle norske bøker noensinne utgitt blir nå digitalisert og klargjort for søk. Ibsens Catilina var den første boken som ble heldigitalisert i 2006. (Foto: Niclas Bergh Bugge)

– Ikke bare skal alle printede publikasjoner digitaliseres. Nasjonalbiblioteket høster også inn hele det norske internettet, altså linker som tilhører .no-domenet.

Formålet med dette, sier Bastiansen, er at alt som noensinne har vært på det norske internett skal lagres og brukes slik de var på innhøstingstidspunktet. I 2017 omfattet denne innhøstingen så mye som 2,4 milliarder datafiler.

Avslutningsvis pratet Bastiansen om Nasjonalbibliotekets besøkstall og at de gjerne skulle sett disse tallene vokse.

– Det er et viktig arbeid de gjør for å bevare norsk mediehistorie, og det legges mye fokus på å gjøre dette verktøyet lett tilgjengelig for alle på deres hjemmeside. I praksis trenger man ingen forkunnskaper for å bruke verktøyet og finne frem i norske publikasjoner gjennom tidene.