7. marraskuuta 2024

Digitaalisen säilyttämisen parhaat käytännöt rakentuvat yhteistyössä

Marraskuun toinen torstai on aina kansainvälinen digitaalisen pitkäaikaissäilyttämisen päivä. Tänä vuonna päivän teemana on Preserving Our Digital Content: Celebrating Communities. Teemalla halutaan juhlistaa yhteisöjä, jotka ovat eri tavoin toteuttamassa sähköisten aineistojen pitkäaikaissaatavuutta.

Itselleni tärkeä yhteisö on ollut CoreTrustSeal. Se on kansainvälinen, voittoa tavoittelematon järjestö, joka tarjoaa luotettavan sähköisen säilyttämisen perustason sertifiointia. Olen palvellut CoreTrustSealin hallituksessa jo vuodesta 2018 alkaen. Viimeisen vuoden aikana yksi keskeinen teema on ollut digitaalisen säilyttämisen ja aineistojen kuratoinnin erilaiset tavoitteet ja tasot, koska niihin liittyvät käsitteet ja määritelmät eivät ole vielä vakiintuneita.

Olemme CoreTrustSealin piirissä käyneet aiheesta avointa ja yhteisöä osallistavaa keskustelua, jonka perusteella hallitus on hahmotellut neljä erilaista digitaalisen säilyttämisen tasoa1:

  • Z. Nollataso (level zero): Repositorio säilyttää ja jakaa digitaalisen objektin sisällön sellaisena kuin se on repositorioon tallennettu.
  • D. Tallennuskriteerit täyttävä taso (deposit compliance): Tallennusvaiheessa repositorio tarkistaa, että digitaalinen objekti ja sen metadata täyttää tietyt ennalta määritellyt minimivaatimukset.
  • C. Ensikuratoinnin taso (initial curation): Repositorio täydentää digitaalista objektia tai sen metadataa repositorien käytäntöjen mukaisesti, esimerkiksi lisää FAIR-periaatteiden mukaista metadataa.
  • A. Aktiivisen pitkäaikaissäilytyksen taso (active preservation): Repositorio ottaa vastuun siitä, että digitaalinen objekti säilyy käytettävänä ja ymmärrettävänä pitkällä aikavälillä.

Nämä tasot voivat olla kumulatiivisia ja usein ovatkin. Tyypillisesti esimerkiksi repositorio, joka vastaa datan pitkäaikaissäilyttämisestä (A) myös tarkistaa tallennuskriteerien täyttymisen (D) ja kuratoi aineistoja (C). Kaikenlaisia repositorioita tarvitaan, koska asiakkaiden tarpeet ovat erilaisia. Tärkeää on, että repositoriot viestivät selkeästi palvelulupauksensa, jotta asiakkaat pystyvät valitsemaan oikean paikan digitaalisen materiaalin tallennukseen. Esimerkiksi tutkimusdatalle oikea repositorio on usein tieteenalakohtainen sertifioitu data-arkisto.

Työ tällä saralla jatkuu. CoreTrustSealin hallitus on julkaissut keskustelupaperin, jossa pohditaan, miten näiden neljän eri säilytystason avulla voidaan ryhmitellä repositorioita2. Osallistuin keväällä 2024 Saksan data-arkiston GESISin järjestämään tutkijavierailuun. Sen tuloksena julkaisimme paperin, jossa hahmotellaan mitä metadataa tarvitaan kuvaamaan kuratoinnin ja säilyttämisen tasoa sekä repositorion että digitaalisen objektin tasolla.3

Ensi tammikuussa alkaa CSC:n johtama Horisontti-rahoitteinen FIDELIS-hanke, jossa Tietoarkisto on mukana. Hankkeen tavoitteena on rakentaa eurooppalainen luotettujen datarepositorioiden verkosto, määritellä hyviä käytäntöjä ja tutkia luotettavien repositorioiden ominaisuuksia.

Tutkimusdatan digitaalinen pitkäaikaissäilyttäminen on nopeasti kehittyvä ala, jossa tarvitaan monenlaista osaamista ja erilaisia näkemyksiä. Parhaat käytännöt rakennetaan yhteistyöllä ja verkostoitumalla. CoreTrustSeal on vain yksi monista yhteisöistä, joihin Tietoarkisto ja tietoarkistolaiset kuuluvat. Tätä blogiakin olen työstänyt yhdessä CoreTrustSealin hallituksen ja CESSDA-kollegojen kanssa. Lue lisää CoreTrustSealin ja Digital Preservation Coalitionin sivuilta.

Mari Kleemola
kehittämispäällikkö
etunimi.sukunimi [at] tuni.fi

[1] CoreTrustSeal Standards and Certification Board. (2024). Curation & Preservation Levels: CoreTrustSeal Position Paper. Zenodo. https://doi.org/10.5281/zenodo.11476980

[2] CoreTrustSeal Standards & Certification Board. (2024). Types of Repository: Entities, Responsibilities, Objects. CoreTrustSeal Board Discussion Paper (v01.00). Zenodo. https://doi.org/10.5281/zenodo.13133041

[3] L'Hours, H., Kleemola, M., & Recker, J. (2024). CoreTrustSeal Levels of Curation and Preservation: Implied Repository and Object Metadata Characteristics (v01.00). Zenodo. https://doi.org/10.5281/zenodo.12701324