Internetts arkiv

Tekst
Åpen lunsj. Grunnlegger Brewster Kahle har åpen lunsj hver fredag. Her viser han besøkende hvordan de kan søke opp obskur musikk i arkivets nettsider. 138.793 musikkfiler fra 6449 band er på lager

Åpen lunsj. Grunnlegger Brewster Kahle har åpen lunsj hver fredag. Her viser han besøkende hvordan de kan søke opp obskur musikk i arkivets nettsider. 138.793 musikkfiler fra 6449 band er på lager

Brewster Kahle ble styrtrik på dataselskapene han solgte. De siste 20 årene har han bygget opp internetts svar på biblioteket i Alexandria.

Den tidligere kirken i San Francisco ser akkurat så verdig ut som et gudshus bør. Stentrappene, de korintiske søylene og marmorurnene er det første man legger merke til fra utsiden, men inne i bygningen er det vår tids religion som tilbes: datamaskiner og bytes. Helligdommen inneholder alt som finnes av tekst, lyd, bilde og nettinnhold, og det lagres digitalt. Arkivet er i ferd med å bli vår tids bibliotek i Alexandria.

Datakirken. Internettarkivet holder til i en gammel kirke, som ble kjøpt fordi den minnet om arkivets logo

Datakirken. Internettarkivet holder til i en gammel kirke, som ble kjøpt fordi den minnet om arkivets logo

Sjefbibliotekaren Brewster Kahle (54) ligner klisjeen om den eksentriske akademikeren, med hårstil i kategorien gal professor, en stemme i det lysere toneleiet. De lange armene veiver når han snakker, noe han i grunn gjør hele tiden, og kinnene blir rødlige. Kahle tok datautdannelse på MIT (Massachusetts Institute of Technology) før han startet Wais, som ble en forløper til digital lagring før internett ble gjort tilgjengelig for offentligheten. Selskapet ble solgt for 15 millioner dollar til AOL. Så startet han opp Alexa Internet, som Amazon kjøpte i 1999 i bytte mot 250 millioner dollar i aksjer. Han er med andre ord mangemilliardær. Men i stedet for å pensjonere seg som 38-åring, startet han The Internet Archive, en veldedig organisasjon som skal være hele internetts hukommelse.

 

100 dager

En gjennomsnittlig nettside har i dag en levetid på 100 dager. En tweet og andre meldinger i sosiale medier slettes gjerne etter noen timer, slik som meldingen fra ifjor sommer som førte til at The Internet Archive bidro til å starte en krig.

Et fly fra Malaysia Airlines styrtet i bakken utenfor Donetsk i Ukraina. 298 mennesker omkom. Separatistlederen Igor «Strelkov» Girkin la ut en melding på russiske sosiale medier. «Vi skjøt nettopp ned et fly, et AN-26», sto det på kontoen hans. AN-26 er et russiskbygd militært fraktfly. Meldingen inneholdt en link til bilder av biter av flyvraket, som lignet mye mer på et Boeing 777.

To uker tidligere hadde internettarkivet blitt varslet av en russisk bibliotekar om at det burde samle inn informasjon fra russiske og ukrainske nettsteder, i tilfelle den allerede hete konflikten i området tilspisset seg. Under to timer etter at Girkin la ut meldingen, var den slettet. Internettarkivet rakk å fange den opp.

Lagres. Internettarkivet i San Francisco har lagret hele internett siden 1996. Brewster Kahles mål er å ha informasjonen tilgjengelig for folket

Lagres. Internettarkivet i San Francisco har lagret hele internett siden 1996. Brewster Kahles mål er å ha informasjonen tilgjengelig for folket

 

Verdiløse adresser

En av fordelene med internettpublisering er at man kan rette opp feil. Ofte opplyser ikke nettsider om at det finnes en eldre versjon, fordi originalsiden blir overskrevet med ny informasjon. Gamle data og innhold blir slettet. At nettsider endres, kan bli et problem når for eksempel advokater og dommere bruker linker til saker som bevis.

En studie fra 2013 viser at etter seks år er rundt halvparten av nettadressene tilknyttet lovdata- og forskningspublikasjoner slettet. Mer enn 70 prosent av linkene i det anerkjente tidsskriftet Harvard Law Review sender ikke leserne til den originalt siterte informasjonen, ifølge magasinet The New Yorker. 50 prosent av nettsider med uttalelser fra USAs høyesterett linker ikke til korrekt kilde.

Ifølge The New Yorker utførte bibliotekarer i Los Alamos National Laboratory en undersøkelse tidligere i år som konkluderte med at én av fem linker fra 3,5 millioner akademiske rapporter innen vitenskap, teknologi og medisin som ble publisert mellom 1997 og 2012, var forsvunnet. I praksis vil det si at å bruke nettadresser som fotnoter i akademiske verker, er så godt som verdiløst.

 

Logokjøp

Dette er en av mange grunner til at Kahle vil digitalisere absolutt alt som finnes av tekst, musikk, tv, film og annet. Målet hans er å gjøre alt tilgjengelig for offentligheten i digitalt format, som en slags arkivvariant av Wikipedia, men med mindre feilmargin.

Hver fredag guider han besøkende rundt i den gamle kirken, som ble kjøpt for fire år siden.

– Da vi så den, skrek jeg: «Der er logoen vår!» roper han entusiastisk til noen titall mennesker som er med på fredagslunsjen.

– Vi har tilpasset oss til bygningen, og den til oss, forteller Kahle.

Søylene og høytideligheten passer ham fint.

– Vi vil lage et Alexandria-bibliotek, versjon 2.0. Vi vil lagre alt som noensinne er publisert på internett, fra tekst til video til programvare. Er det publisert, skal det være tilgjengelig her, og alle som vil, skal ha tilgang. Internettarkivet skal være en permanent institusjon.

– På nettet gjør mange en stor innsats for å fjerne ting. Vi tar kontinuerlig snapshots av sider. Hver uke lagrer vi en milliard sider, forteller han.

Arkiverer. Savannah Campbell laster inn filmer til arkivet. Nylig fikk det donert 40 år med 24 timer opptak av amerikanske nyheter av en eldre dame

Arkiverer. Savannah Campbell laster inn filmer til arkivet. Nylig fikk det donert 40 år med 24 timer opptak av amerikanske nyheter av en eldre dame

 

Slettet forgjeves

For ni år siden sa den daværende britiske opposisjonslederen David Cameron i en tale at Google demokratiserte verden fordi selskapet gjorde mer informasjon tilgjengelig for flere folk. «Det gir makt til alle, slik at folket kan holde til ansvar de som tidligere hadde monopol på makt,» sa Storbritannias nåværende statsminister.

I 2013 slettet partiet hans alle taler fra nettet som toryene hadde holdt de siste ti årene – inkludert overstående. Buzzfeed slettet ifjor mer enn 4000 innlegg fra oppstartsperioden, fordi de var «utdaterte» og fremsto som dummere jo lengre tid som hadde gått siden de ble skrevet. Når nettselskaper går konkurs, forsvinner innholdet på serverne de har eid eller leid. Slik kan millioner av innlegg forsvinne i en jafs.

 

Datanaturlig oppvarming

Kahle har en quiz til de datainteresserte folkene han guider rundt. Han svarer selv.

– Hvor mange bits er det i en byte? Hvor mye er 1000 bytes? En kilobyte. 1000 kilobytes? En megabyte. 1000 megabytes? En gigabyte. 1000 gigabytes? En terabyte. 1000 terabytes? En petabyte, sier han.

Tilsammen lagres for øyeblikket rundt 20 petabytes her. Tre millioner brukere benytter seg av siden hver dag. Med det er den blant de 200 mest populære nett­sidene i verden. Hver uke vokser innholdet med 20 terabytes. 456 milliarder nettsider er lagret. Det gjør det til verdens største digitale arkiv.

– Jeg har laget supercomputere hele livet mitt. Det jeg vet, er at når lysene blinker, er det enten noen som laster noe ned eller opp, sier Kahle og peker på de godt synlige dataserverne.

Det blinker ustanselig, som et lyskryss på speed.

– Man ser ikke folk feire datamaskiner. Det gjør vi, og det er derfor de er synlige. Ofte er datakabinetter mørke og ser litt skumle ut. Vår idé er å ha dem fremme og lage et annet forhold til det vi driver med.

Det finnes ingen luftavkjøling i de romslige lokalene. Den kalde luften kjøler ned datamaskinene, mens varmen fra maskinene varmer opp bygningen.

– Kult, ikke sant? Men vi gjør det mest fordi vi er gjerrige, sier Kahle.

Hær. Internettarkivet har sin versjon av Terrakottahæren. Har man vært ansatt i arkivet i mer en tre år, får man en skulptur av seg selv.

Hær. Internettarkivet har sin versjon av Terrakottahæren. Har man vært ansatt i arkivet i mer en tre år, får man en skulptur av seg selv.

 

Aktivist

Selv om Kahle selv er styrtrik, er han opptatt av at de som jobber med og for offentligheten, og dermed ikke blir like rike som han selv, skal ha bedre levevilkår. Derfor har han rett og slett startet en egen bank: Archive Credit Union.

– Det gjorde vi fordi vi mener de fleste banker suger. Folk bruker mye penger på husleie, gjerne så mye som 60–70 prosent av inntekten sin. Vi tenkte: «Hvorfor er det slik?» Det viser seg at det koster ikke så mye på grunn av renter eller vedlikehold av bolig, men som følge av den onde sirkelen av gjeld. Vi prøver å gjøre husene til våre ansatte og kunder permanent gjeldfrie. Å starte en bank for våre ansatte er en ny idé. Bankene er fæle, fæle, og det kan jeg si fordi jeg er sjef for en bank! Vi prøver å hjelpe våre folk, slik at de fortsatt kan jobbe til gode for samfunnet og ikke tvinges til å flytte langt vekk fra arbeidsplassen eller miste jobben fordi de ikke har råd til å bo.

Ansatte får også bonuser utbetalt i bitcoins.

– Folk donerer bitcoins til oss, og noe av det gir vi de ansatte i lønn eller bonuser. Omtrent halvparten av de ansatte tar betalingen i bitcoins. Vi har en egen bitcoinmaskin der man putter inn penger og får bitcoins. Det har ført til at sushirestauranten ved siden av oss godtar bitcoins som betaling. Bitcoins er internetts valuta, sier Kahle.

 

Sikkerhet

San Francisco er på overtid for et kraftig jordskjelv. Hva skjer med arkivet når det en gang inntreffer?

– Vi er utsatt for jordskjelv og naturkatastrofer, men de største katastrofene for biblioteker er gjerne myndighetene. Vi mener det er viktig å distribuere kopier nå, i tilfelle noe skjer. Men det politiske miljøet de siste årene er mer utfordrende. Vi vil gjerne distribuere alt til alle, men noen myndigheter er ikke glade for det, sier Kahle.

Den store utfordringen er å gjøre det enorme arkivet lettere å søke i. De vil ha alt tilgjengelig, men med så mye data, jobber de kontinuerlig med å gjøre det lettere å finne frem.

Det er også en annen stor utfordring for arkivet: opphavsrett. Mye kan ikke legges ut på nettsidene deres. Kahle mener lovene ikke helt har fulgt med den teknologiske utviklingen, og tar noen sjanser med hva som lagres. Måten det gjøres på, og at det er i USA og i nærheten av Silicon Valley, gjør skepsisen fra flere andre land stor. For å prøve å inngå kompromiss, opererer internettarkivet også som vanlige biblioteker, der hvem som helst kan droppe innom og høre på en plate, se et tv-program eller lese en bok.

I lobbyen er det et lytterom, komfortable stoler, noen bokhyller, et par Ipader og hodetelefoner.

Bøker. Bøker blir skannet fortløpende, både på oppdrag for andre, som kongressbiblioteket, og for egen del

Bøker. Bøker blir skannet fortløpende, både på oppdrag for andre, som kongressbiblioteket, og for egen del

 

Jobber for andre

Internettarkivet samarbeider med biblioteker fra hele verden, samt Kongressens bibliotek, USAs svar på Nasjonalbiblioteket. De tar ti cent per side som skannes. Av de 140 ansatte i internettarkivet, er det 100 som jobber med å skanne.

– Skanningen står for omtrent halvparten av inntektene våre. Resten er donasjoner, sier Kahle.

Nettsidene som ikke finnes lenger, er lagret i noe de kaller The Wayback Machine, som spesielt er populært blant forskere. Hvert sekund logger 2000 personer seg på den. De har skannet 300.000 bøker. Har en enorm musikksamling. Nylig donerte en familien til en avdød kvinne vhs-samlingen hennes. Gjennom 40 år hadde hun tatt opp nyhetene.

– Det var 40.000 forskjellige videokassetter. CNN døgnet rundt, vanlige nyhetssendinger, alt som fantes. Vi driver å digitaliserer det nå, men trenger litt mer penger før det blir gjort.

De lagrer også dataspill fra de først kom på markedet på 70-tallet, til i dag. Det samme med programvare. På utsiden av biblioteket står en rekke satellitter som kontinuerlig fanger opp og tar opp tv-program og nyheter fra flere titall land. 70 kanaler blir kontinuerlig tatt opp.

– Vi vil bevare alt for fremtidige generasjoner.

Les også:
Portrettet: Telenors nye sjef skjønner godt at noen skulle ønske han var kvinne.

Restauranter: Hvem vil betale 2000 kroner for å være prøvekanin?

Vin: Klarte å lage gode, tørre hvitviner av katastrofal årgang.

Tegneserie: «Lunch» av Børge Lund

Les mer fra Magasinet her(Vilkår)Copyright Dagens Næringsliv AS og/eller våre leverandører. Vi vil gjerne at du deler våre saker ved bruk av lenke, som leder direkte til våre sider. Kopiering eller annen form for bruk av hele eller deler av innholdet, kan kun skje etter skriftlig tillatelse eller som tillatt ved lov. For ytterligere vilkår se her.

Informasjonskapsler og personvern

Dagens Næringsliv er ansvarlig for dataene du oppgir og dataene vi samler om dine besøk på DN.no. Vi bruker informasjonskapsler og dine data til å analysere og forbedre tjenestene, og til å tilpasse annonser og deler av innholdet du ser og bruker. Dersom du er innlogget, kan du endre dine innstillinger for personvern.

Les mer Ok, jeg skjønner