Filformater til langtidsbevaring

Er du bevidst om, hvor vigtigt det er at vælge et egnet filformat for at sikre fremtidig adgang til digitale arkivalier og records?

I denne artikel giver jeg en kort introduktion til emnet og præsenterer samtidig filformater, der er velegnede til langtidsbevaring. 

Introduktion 

En konsekvens af den hastige teknologiske udvikling er, at alt inden for IT forældes hurtigt. Programmer og platforme opdateres og udbygges konstant, nye kommer til og andre udgår. Det samme gælder filformater. Forsøger man eksempelvis at åbne en Microsoft Word DOC-fil fra 1990’erne, kan den se mærkelig ud og være formateret forkert. Måske ligger man inde med filer fra nu udgåede og ikke-supporterede programmer, der har anvendt udokumenterede filformater, som kun er kompatible med de respektive programmer, hvor de blev skabt, eller som kræver hardware, der for længst er udgået.

Over tid, kan der derfor være risiko for, at digitale arkivalier og records ikke længere vil kunne åbnes, blive vist korrekt eller miste metadata – alle scenarier, der kan være bekostelige at udrede og få juridiske og forretningsmæssige konsekvenser.   

En måde at ruste sig imod ovenstående problem, er at benytte relevante filformater, der er egnede til langtisbevaring og som tager hensyn til retentionperioder og forventet fremtidig anvendelse.

Filformater til langtidsbevaring 

Valget af filformater afhænger i høj grad af ens behov, tidshorisont og de konkrete formål som digitale arkivalier og records skal understøtte.

Årsagerne til at langtidsbevare digitale arkivalier og records kan være mange. En produktionsvirksomhed har måske af juridiske årsager behov for, at specifikke records er tilgængelige gennem hele et givent produkts levetid eller længere, der potentielt set kan spænde over årtier. Det kan også dreje sig om at sikre kontinuerlig adgang til vitale og fortrolige records, der har stor betydning for en virksomheds forretning, såsom opskrifter, forskningsresultater eller teknisk data, ligesom det også kan være materiale, der dokumenterer eller ligger til grund for virksomhedens forretnings- og ledelsesmæssige beslutninger. Der kan naturligvis også være rent historiske årsager til langtidsbevaring, hvor målet slet og ret er at tilgængeliggøre materialet til eftertiden.

På trods af (eller måske på grund af) områdets kompleksitet og signifikans, findes der ikke nogen universel eller standardiseret tilgang til langtidsbevaring af digitale records og arkivalier, og der er mange forskellige meninger og holdninger til, hvad der er bedst at gøre – eksempelvis er der forskel på, hvilke strategier som de nationale arkiver rundt om i verden har besluttet sig for at anvende i forbindelse med langtidsbevaring.

Filformater, der er velegnede til langtidsbevaring vil dog typisk have en eller flere af følgende karakteristika:  

  • Åbne – Er formater åbne er de modsat proprietærer filformater ikke kontrolleret og supporteret af en enkelt udvikler. Formatets beskrivelse vil være offentligt tilængelig og i visse situationer varetaget af et standardiseringsorgan. Hermed kan åbne filformater lettere og kontinuerligt blive implementeret i nye programmer, hvilket således også øger sandsynligheden for læsbarhed, anvendelse og kompatibilitet på lang sigt. Et væsentligt eksempel er PDF/A-1 (ISO 19005-1:2005).
  • Udbredte – Anvendt på tværs af programmer og platforme samt industrier, sektorer, lande og sprog. Desto flere, der anvender filformatet, desto flere vil have en interesse i at sikre muligheden for dets fremtidige benyttelse.
  • Understøtter påføring af metadata. Er essentielt i forhold til styre records samt sikre og opretholde integritet.  
  • Benytter eller understøtter tabsfri komprimering. Muliggør eksakt gendannelse af original, komprimeret data uden tab af information.

 Nedenfor er eksempler på forskellige filtyper og de filformater som kan anvendes for at sikre langtidsbevaring:  

Type Anbefalet filformat
Dokument PDF/A-1
Video AVI
Lyd WAV
Billede TIFF
E-mail MBOX
Hjemmeside WARC
Regneark CSV eller PDF/A-1
Præsentation OPT eller PDF/A-1
Container ZIP (ikke-komprimeret)

Valget af filformater kan naturligvis også været betinget af mange øvrige både interne og eksterne faktorer, herunder IT-infrastruktur, omkostninger og lovgivning. Hertil kommer også om de digitale arkivalier og records er født digitale eller skabt som led i digitaliseringsprocesser, og hvorvidt, de måske indeholder indlejrede filer (såsom præsentationer med videofiler).

Konvertering 

Ved anvendelse af filformater til langtidsbevaring, vil konvertering spille en væsentlig rolle.   

Her kan der både være tale om store mængder af digitale arkivalier og records, der skal konverteres for at sikre deres anvendelse fremadrettet, men det også være i situationer, hvor det af praktiske årsager først er ved i et særligt stadie i den pågældende records’ livscyklus (eksempelvis ved arkivering), at konverteringen finder sted.  

Selv om konverteringsarbejdet i høj grad kan automatiseres, er det alligevel ikke nødvendigvis en ukompliceret proces, da den potentielt set kan ændre, korrumpere eller slette indhold og metadata. For at komme sikkert i mål er det derfor også nødvendigt med et grundigt for- og efterarbejde, der blandt andet kan omfatte kravspecificering, mapping af metadata, risikoanalyser, procesbeskrivelser og løbende kvalitetssikring.  

Som følge af de ovennævnte risici, anbefales det derfor også, at man så vidt muligt sørger for at beholde de oprindelige filer.