15. tammikuuta 2020

Digitaalisen tutkimusdatan pitkäaikaissaatavuutta jo vuodesta 1999

Viime vuonna Tietoarkisto juhli 20-vuotista taivaltaan. Olemme tutkimusaineistojen digitaalisen pitkäaikaissäilytyksen pioneereja Suomessa. Aluksi haimme mallia toimintaamme eurooppalaisilta ja muilta kansainvälisiltä yhteiskuntatieteellisiltä data-arkistoilta, ja työmme käynnistyi ripeästi.

Ensimmäiset pitkäaikaissäilytettävät aineistopaketit valmistuivat vain runsaan puolen vuoden kuluttua Tietoarkiston perustamisesta. Nämä olivat Puolueiden ajankohtaistutkimukset, joiden kuvailut julkaisimme verkkosivuillamme syyskuussa 1999. Jo tätä ennen olimme palvelleet ensimmäistä asiakastamme, kun kesäkuussa 1999 välitimme Eurobarometri-dataa Turun yliopiston tutkijalle.

Datan tekijän ja jatkokäyttäjän kohtaamispaikka

Tällä hetkellä aineistovarannossamme on jo yli 1500 tutkimusdataa ja Aila-dataportaalimme on osa eurooppalaista avoimen tieteen pilvipalvelua EOSC Marketplacea. Palveluillamme on vuosien varrella ollut tuhansia käyttäjiä. Tällä hetkellä Ailassa on yli 2600 rekisteröitynyttä käyttäjää ja verkkosivuillamme vieraillaan reilusti yli miljoona kertaa vuodessa. Ailasta tutkijat, opettajat ja opiskelijat saavat datat käyttöönsä helposti ja maksutta kunkin aineiston käyttöehtojen mukaisesti.

Tutkimusaineiston tallentaminen Tietoarkistoon on myös helppoa. Ennen aineiston siirtoa tehdään käsittelysopimus, jolla varmistetaan muun muassa henkilötietojen vastuullinen käsittely ja aineiston laillinen siirtäminen Tietoarkistoon. Tämän jälkeen Tietoarkiston asiakaspalvelu avaa Ailaan työtilan, jossa tutkija siirtää tiedostot tietoturvallisesti Tietoarkiston aineistopalvelun käsiteltäviksi.1

Huolehdimme saatavuudesta ja ymmärrettävyyden säilymisestä

Tietoarkiston perustehtävä on alusta asti ollut varmistaa digitaalisten tutkimusaineistojen säilyvyys, käytettävyys ja saatavuus tutkijoiden käyttöön sekä nyt että kaukana tulevaisuudessa. Digitaaliset tutkimusaineistot eivät säily itsestään, vaan niitä pitää hoivata koko elinkaaren ajan.

Tietoarkisto seuraa ohjelmistojen kehittymistä ja huolehtii arkistoitujen tutkimusdatojen tiedostomuotojen pysymisestä ajantasaisena ja käyttökelpoisena. Koska tutkimusdatamme sisältävät yleensä tietoa ihmisistä, panostamme tietosuojaan koko tutkimusdatan säilytyksen ajan. Laadimme vuosittain selosteet aineistoihin kohdistuneista tietosuojatoimenpiteistä sekä varmistamme, ettei aineistoihin synny teknologioiden kehittyessä tietosuojariskejä.

Pelkkä datan hoivaaminen ei yksin riitä takaamaan aineiston pitkäaikaista käytettävyyttä. Tarvitaan myös metadataa eli kuvailevaa tietoa aineiston sisällöstä ja taustasta. Tietoarkisto tekee aineistoille laajat, tasalaatuiset kuvailut. Ilman niitä tutkimusdatan arvo ei säily eikä data ole jatkokäyttökelpoista tai tutkimus toistettavaa. Analyysien kannalta on esimerkiksi ihan eri asia, onko data kerätty 1980-luvulla vai 2010-luvulla, onko otanta satunnainen vai ei tai onko otannan perusjoukko Suomen väestö vai helsinkiläiset.

Tietoarkisto tarkkailee jatkuvasti kuvailujen laatua ja ajanmukaistaa ja rikastaa metadataa esimerkiksi ottamalla käyttöön uusia kansainvälisiä sanastoja. Aineistoille annetaan myös pysyvät tunnisteet. Näin Tietoarkisto voi taata datojen pitkäaikaisen käytettävyyden ja kansainvälisen yhteentoimivuuden.

Vuodesta 2017 alkaen olemme hyödyntäneet kansallista pitkäaikaissäilytyspalvelua tutkimusaineistojemme bittitason säilytykseen. Palvelun suunnittelussa ja rakentamisessa olemme olleet mukana vuodesta 2008 ja pilotointivaiheemme alkoi 2015.

Sertifiointi luotettavuuden merkkinä

Tietoarkiston asiantuntijoiden pitkäjänteisen, jatkuvan, huolellisen ja innovatiivisen työn tuloksena olemme onnistuneet kehittämään ja rakentamaan toimivat prosessit, jotka varmistavat aineistojen pitkäaikaissaatavuuden. Tästä osoituksena saimme Data Seal of Approval (DSA) -sertifikaatin vuonna 2014 ensimmäisenä suomalaisena PAS-organisaationa. Tällä hetkellä meillä on voimassa vaatimuksiltaan DSA:ta tiukempi CoreTrustSeal (CTS) -sertifikaatti.

1 Lue lisää: Tietoarkistoblogi 9/2018: Ailassa nyt tallennustyökalu aineistojen arkistointiin ja Ohjeita aineiston arkistoijalle.

Lisätietoa:

» Tietoarkiston CoreTrustSeal-sertifikaatti (PDF)
» Aila
» Aila EOSC Marketplacessa
» Tietotilinpäätökset
» Tietoarkistoblogi: Tietoarkisto jatkaa uudella vuosikymmenellä luotettuna tutkimusaineistojen asiantuntijana

Mari Kleemola
kehittämispäällikkö, varajohtaja

Katja Moilanen
tietoarkkitehti

etunimi.sukunimi [at] tuni.fi

Ei kommentteja: