15. tammikuuta 2020

Digitaalisen tutkimusdatan pitkäaikaissaatavuutta jo vuodesta 1999

Viime vuonna Tietoarkisto juhli 20-vuotista taivaltaan. Olemme tutkimusaineistojen digitaalisen pitkäaikaissäilytyksen pioneereja Suomessa. Aluksi haimme mallia toimintaamme eurooppalaisilta ja muilta kansainvälisiltä yhteiskuntatieteellisiltä data-arkistoilta, ja työmme käynnistyi ripeästi.

Ensimmäiset pitkäaikaissäilytettävät aineistopaketit valmistuivat vain runsaan puolen vuoden kuluttua Tietoarkiston perustamisesta. Nämä olivat Puolueiden ajankohtaistutkimukset, joiden kuvailut julkaisimme verkkosivuillamme syyskuussa 1999. Jo tätä ennen olimme palvelleet ensimmäistä asiakastamme, kun kesäkuussa 1999 välitimme Eurobarometri-dataa Turun yliopiston tutkijalle.

Datan tekijän ja jatkokäyttäjän kohtaamispaikka

Tällä hetkellä aineistovarannossamme on jo yli 1500 tutkimusdataa ja Aila-dataportaalimme on osa eurooppalaista avoimen tieteen pilvipalvelua EOSC Marketplacea. Palveluillamme on vuosien varrella ollut tuhansia käyttäjiä. Tällä hetkellä Ailassa on yli 2600 rekisteröitynyttä käyttäjää ja verkkosivuillamme vieraillaan reilusti yli miljoona kertaa vuodessa. Ailasta tutkijat, opettajat ja opiskelijat saavat datat käyttöönsä helposti ja maksutta kunkin aineiston käyttöehtojen mukaisesti.

Tutkimusaineiston tallentaminen Tietoarkistoon on myös helppoa. Ennen aineiston siirtoa tehdään käsittelysopimus, jolla varmistetaan muun muassa henkilötietojen vastuullinen käsittely ja aineiston laillinen siirtäminen Tietoarkistoon. Tämän jälkeen Tietoarkiston asiakaspalvelu avaa Ailaan työtilan, jossa tutkija siirtää tiedostot tietoturvallisesti Tietoarkiston aineistopalvelun käsiteltäviksi.1

Huolehdimme saatavuudesta ja ymmärrettävyyden säilymisestä

Tietoarkiston perustehtävä on alusta asti ollut varmistaa digitaalisten tutkimusaineistojen säilyvyys, käytettävyys ja saatavuus tutkijoiden käyttöön sekä nyt että kaukana tulevaisuudessa. Digitaaliset tutkimusaineistot eivät säily itsestään, vaan niitä pitää hoivata koko elinkaaren ajan.

Tietoarkisto seuraa ohjelmistojen kehittymistä ja huolehtii arkistoitujen tutkimusdatojen tiedostomuotojen pysymisestä ajantasaisena ja käyttökelpoisena. Koska tutkimusdatamme sisältävät yleensä tietoa ihmisistä, panostamme tietosuojaan koko tutkimusdatan säilytyksen ajan. Laadimme vuosittain selosteet aineistoihin kohdistuneista tietosuojatoimenpiteistä sekä varmistamme, ettei aineistoihin synny teknologioiden kehittyessä tietosuojariskejä.

Pelkkä datan hoivaaminen ei yksin riitä takaamaan aineiston pitkäaikaista käytettävyyttä. Tarvitaan myös metadataa eli kuvailevaa tietoa aineiston sisällöstä ja taustasta. Tietoarkisto tekee aineistoille laajat, tasalaatuiset kuvailut. Ilman niitä tutkimusdatan arvo ei säily eikä data ole jatkokäyttökelpoista tai tutkimus toistettavaa. Analyysien kannalta on esimerkiksi ihan eri asia, onko data kerätty 1980-luvulla vai 2010-luvulla, onko otanta satunnainen vai ei tai onko otannan perusjoukko Suomen väestö vai helsinkiläiset.

Tietoarkisto tarkkailee jatkuvasti kuvailujen laatua ja ajanmukaistaa ja rikastaa metadataa esimerkiksi ottamalla käyttöön uusia kansainvälisiä sanastoja. Aineistoille annetaan myös pysyvät tunnisteet. Näin Tietoarkisto voi taata datojen pitkäaikaisen käytettävyyden ja kansainvälisen yhteentoimivuuden.

Vuodesta 2017 alkaen olemme hyödyntäneet kansallista pitkäaikaissäilytyspalvelua tutkimusaineistojemme bittitason säilytykseen. Palvelun suunnittelussa ja rakentamisessa olemme olleet mukana vuodesta 2008 ja pilotointivaiheemme alkoi 2015.

Sertifiointi luotettavuuden merkkinä

Tietoarkiston asiantuntijoiden pitkäjänteisen, jatkuvan, huolellisen ja innovatiivisen työn tuloksena olemme onnistuneet kehittämään ja rakentamaan toimivat prosessit, jotka varmistavat aineistojen pitkäaikaissaatavuuden. Tästä osoituksena saimme Data Seal of Approval (DSA) -sertifikaatin vuonna 2014 ensimmäisenä suomalaisena PAS-organisaationa. Tällä hetkellä meillä on voimassa vaatimuksiltaan DSA:ta tiukempi CoreTrustSeal (CTS) -sertifikaatti.

1 Lue lisää: Tietoarkistoblogi 9/2018: Ailassa nyt tallennustyökalu aineistojen arkistointiin ja Ohjeita aineiston arkistoijalle.

Lisätietoa:

» Tietoarkiston CoreTrustSeal-sertifikaatti (PDF)
» Aila
» Aila EOSC Marketplacessa
» Tietotilinpäätökset
» Tietoarkistoblogi: Tietoarkisto jatkaa uudella vuosikymmenellä luotettuna tutkimusaineistojen asiantuntijana

Mari Kleemola
kehittämispäällikkö, varajohtaja

Katja Moilanen
tietoarkkitehti

etunimi.sukunimi [at] tuni.fi

20. joulukuuta 2019

Tietoarkisto jatkaa uudella vuosikymmenellä luotettuna tutkimusaineistojen asiantuntijana

Viimeistään kuluneen juhlavuoden 2019 aikana tuli selväksi, että Tietoarkisto on yksi vakiintuneista data-arkistoista, joiden puoleen uudet palveluntuottajat kääntyvät hakeakseen esimerkkejä, opastusta ja innoitusta. Myös Tietoarkistoa vanhempien ulkomaisten data-arkistojen ja alan muiden toimijoiden edustajat arvostavat asiantuntemustamme. Voin siis hyvillä mielin todeta, että Tietoarkisto on saavuttanut strategisen tavoitteensa olla vuonna 2020 Suomessa ja ulkomailla yhä tunnetumpi, luotettu avoimen tieteen ja tutkimusaineistojen pitkäaikaissaatavuuden asiantuntija.

Luotettu asema tutkimusaineistojen asiantuntijaorganisaationa näkyi muun muassa useina ulkomaisten kollegojen pyyntöinä päästä vierailulle keskustelemaan ja oppimaan Tietoarkiston kokemuksista ja käytännöistä. Usein heidän tiedontarpeensa olivat samanlaisia kuin kotimaisilla kumppaneillamme. He toivoivat keskustelua ja opastusta erityisesti tietosuojasta, tutkimusaineistojen hallinnasta ja hallinnan ohjeistamisesta, aineistojen anonymisoinnista, kvalitatiivisten aineistojen käsittelystä tai sertifiointiin valmistautumisesta.

Kaukaisia vieraita ja virtuaalikokouksia

Juhlavuoden tapahtumat ja vierailut käynnisti maaliskuussa japanilaisten tutkimuslaitosten edustajien kanssa yhteistyössä järjestetty seminaari. Tätä käsittelin blogissa jo keväällä. Heidän lisäkseen Tietoarkistossa vieraili vuoden mittaan kollegoita muun muassa Tanskasta, Sloveniasta, Itävallasta ja Qatarista. Joulukuussa järjestimme Tampereen yliopistossa yhdessä Tilastokeskuksen kanssa eurooppalaisten DDI-kuvailuformaatin käyttäjien ja kehittäjien konferenssin EDDIn.

Tampereelle suuntautuneiden vierailujen ja tietoarkistolaisten lisääntyneen matkustelun lisäksi osaamisen kysyntä näkyy virtuaalikokousten runsautena. Alustavan tilaston mukaan vuonna 2019 Tietoarkiston edustajat osallistuivat yli 240 virtuaalikokoukseen. Luku on kasvanut vuodesta 2018 muutamalla kymmenellä. Kokousten ja matkojen määrän lisääntyminen on paljolti seurausta Tietoarkiston CESSDA ERICin palveluntuottajuudesta ja Tietoarkiston asiantuntijoiden toiminnasta kansainvälisissä organisaatioissa. Vierailujen ja virtuaalikokousten työnimien perusteella yhteistä valtaosalle tapahtumista onkin CESSDA ERICin sisäinen projektityö tai työskentely EU-projekteissa yhtenä CESSDAn arkistoista.

Kaikki tämä toteuttaa Tietoarkiston strategiaa, jossa lupaamme aktiivisuutta CESSDAssa. Lupaamme strategiassa myös syventää ja monipuolistaa osaamistamme sekä jakaa kasvanutta osaamistamme aktiivisesti.

Kansallisten tutkimusinfrastruktuurien strategia vaikuttaa suunnitelmiin

Vuosi 2020 on viimeinen Tietoarkiston kuluvalla strategiakaudella. Uuden vuosikymmenen aloitamme siis strategiatyöllä. Suomen Akatemia julkaisee tammikuussa 2020 Kansallisten tutkimusinfrastruktuurien strategian uudelle vuosikymmenelle. Ennakkotietojen perusteella se listaa kehittämiskohteita, jotka jo nyt ovat Tietoarkistossa joko arkipäivää tai ainakin tunnistamiamme kehittämisen kohteita. Akatemian joulun alla julkaiseman tiedotteen mukaan kehittämisalueita ovat vastuullisuus ja kestävä kehitys, pitkäjänteisyys ja dynaamisuus, omistajuus ja osaaminen, digitaalisuus ja data, avoimuus ja yhteistyö sekä laaja ja monimuotoinen vaikuttavuus.

Tästä on pääteltävä, että Tietoarkisto ei voi laittaa omia suunnitelmiaan aivan uusiksi. Kyse on paremminkin Tietoarkiston strategian päivittämisestä. Myös sitoumuksemme Akatemian rahoittamissa FIRI-projekteissa ja CESSDA ERICin palveluntuottajana ulottuvat usean vuoden päähän, tulevaisuuteen. Oma strategiatyömme ja tiekarttahakemuksen työstäminen varmasti palvelevat toisiaan.

Strategiatyössä korostuu jatkuvuus

Tietoarkiston 20-vuotisen toiminnan kunniaksi syyskuussa järjestämämme Tietoarkisto-seminaari oli tilaisuus tarkastella sekä mennyttä että tulevaa kehitystä.

Seminaarissa esittelin Tietoarkisto-lehden juhlanumerossa julkaistua aikajanaa, johon on kerätty tietoarkistolaisten aikaansaannoksia ja tapahtumia kuluneilta 20 vuodelta. Aikajanalla on paljon tapahtumia ja palveluita, joilla on merkitystä myös tulevaisuudessa. Listaan tässä vain muutamia.

  • Palveluportaali Ailaa kehitetään parhaillaan Akatemian rahoittamassa projektissa. Käytettävyyden parantamisen ja uusien toiminnallisuuksien lisäksi tavoitteena on muun muassa yhteentoimivuuden parantaminen ulkopuolisten palvelujen suuntaan.
  • Aineistonhallinnan käsikirjan sisällön tuottaminen ja sen pitäminen ajan tasalla on yhä vain merkityksellisempää. Pelkästään viime elo-syyskuussa aineistonhallinnan käsikirjaan tuli noin 11 000 sivupyyntöä.
  • Sertifioinnit - Date Seal of Approval ja nykyinen CoreTrustSeal - ovat todisteena siitä, että Tietoarkisto on organisaatio, joka säilyttää sähköisiä aineistoja luotettavasti ja mahdollistaa aineistojen jatkokäytön. Vastuullisuus ja pitkäjänteisyys pysyvät toiminnan kulmakivinä tehtävän perusluonteen ohella yhä korostuneemmin myös ulkopuolisen rahoittajan, Akatemian, vaatimuksesta.
  • Menetelmäopetuksen tietovaranto MOTV on retrosta ulkoasustaan huolimatta edelleen verkkosivujen seurannan perusteella Tietoarkiston käytetyin palvelu. Tietoarkisto päivittää sen ulkoasun ja vanhentuneet sisällöt uudelle vuosikymmenelle. Sisältöä myös kehitetään menetelmäopetuksen asiantuntijoiden kanssa. Työ ajoittuu pääosin vuodelle 2020.

Vuoden 2020 käynnistyessä arvioimme nykyistä strategiaamme ja hahmottelemme tulevaa. Kutsumme Tietoarkiston yhteistyökumppanit ja asiakkaat pohtimaan, miten pystymme yhdessä palvelemaan parhaalla mahdollisella tavalla tiedeyhteisöä tutkimusaineistojen hoivaamisessa ja vastuullisessa avaamisessa.

Lisätietoa:

» Tietoarkistoblogi: Monikielinen aineisto-osaaminen ja laadullisten aineistojen asiantuntemus tuovat kansainvälisiä vieraita Tietoarkistoon
» Tietoarkiston strategia 2017-2020 (PDF)

Helena Laaksonen
johtaja
etunimi.sukunimi [at] tuni.fi