31. maaliskuuta 2020

Supporting Certification - SSHOC Project Helps Digital Repositories in Becoming More Trustworthy

Good news on the Social Sciences and Humanities Open Cloud (SSHOC) project: the first deliverable in task 8.2, which is led by the Finnish Social Data Archive, was published in late March. The deliverable lays the ground for the SSHOC trust work that is needed in order to facilitate the adoption of Trustworthy Digital Repository (TDR) standards and the FAIR principles in data repositories across the social sciences and humanities.

The task team also specified modes of support in building trust and helping repositories reach TDR certification, charted the current trust landscape within the SSHOC communities, and selected the repositories that will be the main focus of the support activities provided by task 8.2 within the timeframe of the project.

SSHOC is one of the five cluster projects within the European Open Science Cloud (EOSC) initiative, and the project focuses on increasing and improving the reuse of research data in the social sciences and humanities. Task 8.2, Trust & Quality Assurance, concentrates on developing an agreed approach to assessing the trustworthiness and quality of data repositories. The task joins colleagues from three ERICs (CESSDA, CLARIN and DARIAH) and one aspiring ERIC (E-RIHS).

Flexible yet sustainable approach to trust

The diversity of repositories within the SSHOC communities requires an approach to TDR certification that is sustainable but also adaptable to a wide range of data infrastructures at varying levels of maturity. The task team selected the CoreTrustSeal as the standard certification reference for SSHOC.

The CoreTrustSeal consists of sixteen requirements for which applicants are asked to provide self-assessment statements along with relevant evidence. The CoreTrustSeal is sufficiently stringent but significantly less costly and labour-intensive than formal audit against ISO/DIN standards. Certification requirements for the CoreTrustSeal are also reviewed every three years in comparison with every five years for ISO/DIN standards.

As a community-driven TDR framework, with over 80 past certifications (in March 2020), CoreTrustSeal is open to feedback and continuously considering the widest possible range of certification candidates. However, the task team also identified certain types of organisations for which the CoreTrustSeal requirements are not applicable. Identifying these cases will help develop the CoreTrustSeal framework to better support a variety of repositories.

Support for certification efforts

It is evident that achieving CoreTrustSeal certification requires resources and work from repositories. Even though the workflows and processes themselves related to trustworthy preservation of data may be well established, work may be needed in producing publicly available documentation to show that these processes are sufficient to meet the requirements of certification.

For this reason, the task team specified modes of support provided to repositories for attaining the CoreTrustSeal. The level of SSHOC support required will depend on the starting state of the repositories. The team will amend the modes of support according to the repositories' needs.

The task team aims to raise awareness of the relevance of certification of repositories and the role of the CoreTrustSeal in this via existing communication channels. Webinars and workshops held for repositories will guide and support them in their certification efforts. The team will also provide feedback on self-assessments primarily to the selected repositories (see Table 1 in the report).

For its first support event, SSHOC task 8.2 will host a webinar on Thursday 23 March (more details on the way). In addition to the support activities, further work in 2020 for task 8.2 includes liaising with other relevant projects, such as EOSC-Nordic and FAIRsFAIR.

Further information:

» Development Manager Mari Kleemola
» SSHOC D8.2 Deliverable: Certification plan for SSHOC repositories
» SSHOC project website
» CoreTrustSeal

Niko Koski
Information Specialist
etunimi.sukunimi [at] tuni.fi

15. tammikuuta 2020

Digitaalisen tutkimusdatan pitkäaikaissaatavuutta jo vuodesta 1999

Viime vuonna Tietoarkisto juhli 20-vuotista taivaltaan. Olemme tutkimusaineistojen digitaalisen pitkäaikaissäilytyksen pioneereja Suomessa. Aluksi haimme mallia toimintaamme eurooppalaisilta ja muilta kansainvälisiltä yhteiskuntatieteellisiltä data-arkistoilta, ja työmme käynnistyi ripeästi.

Ensimmäiset pitkäaikaissäilytettävät aineistopaketit valmistuivat vain runsaan puolen vuoden kuluttua Tietoarkiston perustamisesta. Nämä olivat Puolueiden ajankohtaistutkimukset, joiden kuvailut julkaisimme verkkosivuillamme syyskuussa 1999. Jo tätä ennen olimme palvelleet ensimmäistä asiakastamme, kun kesäkuussa 1999 välitimme Eurobarometri-dataa Turun yliopiston tutkijalle.

Datan tekijän ja jatkokäyttäjän kohtaamispaikka

Tällä hetkellä aineistovarannossamme on jo yli 1500 tutkimusdataa ja Aila-dataportaalimme on osa eurooppalaista avoimen tieteen pilvipalvelua EOSC Marketplacea. Palveluillamme on vuosien varrella ollut tuhansia käyttäjiä. Tällä hetkellä Ailassa on yli 2600 rekisteröitynyttä käyttäjää ja verkkosivuillamme vieraillaan reilusti yli miljoona kertaa vuodessa. Ailasta tutkijat, opettajat ja opiskelijat saavat datat käyttöönsä helposti ja maksutta kunkin aineiston käyttöehtojen mukaisesti.

Tutkimusaineiston tallentaminen Tietoarkistoon on myös helppoa. Ennen aineiston siirtoa tehdään käsittelysopimus, jolla varmistetaan muun muassa henkilötietojen vastuullinen käsittely ja aineiston laillinen siirtäminen Tietoarkistoon. Tämän jälkeen Tietoarkiston asiakaspalvelu avaa Ailaan työtilan, jossa tutkija siirtää tiedostot tietoturvallisesti Tietoarkiston aineistopalvelun käsiteltäviksi.1

Huolehdimme saatavuudesta ja ymmärrettävyyden säilymisestä

Tietoarkiston perustehtävä on alusta asti ollut varmistaa digitaalisten tutkimusaineistojen säilyvyys, käytettävyys ja saatavuus tutkijoiden käyttöön sekä nyt että kaukana tulevaisuudessa. Digitaaliset tutkimusaineistot eivät säily itsestään, vaan niitä pitää hoivata koko elinkaaren ajan.

Tietoarkisto seuraa ohjelmistojen kehittymistä ja huolehtii arkistoitujen tutkimusdatojen tiedostomuotojen pysymisestä ajantasaisena ja käyttökelpoisena. Koska tutkimusdatamme sisältävät yleensä tietoa ihmisistä, panostamme tietosuojaan koko tutkimusdatan säilytyksen ajan. Laadimme vuosittain selosteet aineistoihin kohdistuneista tietosuojatoimenpiteistä sekä varmistamme, ettei aineistoihin synny teknologioiden kehittyessä tietosuojariskejä.

Pelkkä datan hoivaaminen ei yksin riitä takaamaan aineiston pitkäaikaista käytettävyyttä. Tarvitaan myös metadataa eli kuvailevaa tietoa aineiston sisällöstä ja taustasta. Tietoarkisto tekee aineistoille laajat, tasalaatuiset kuvailut. Ilman niitä tutkimusdatan arvo ei säily eikä data ole jatkokäyttökelpoista tai tutkimus toistettavaa. Analyysien kannalta on esimerkiksi ihan eri asia, onko data kerätty 1980-luvulla vai 2010-luvulla, onko otanta satunnainen vai ei tai onko otannan perusjoukko Suomen väestö vai helsinkiläiset.

Tietoarkisto tarkkailee jatkuvasti kuvailujen laatua ja ajanmukaistaa ja rikastaa metadataa esimerkiksi ottamalla käyttöön uusia kansainvälisiä sanastoja. Aineistoille annetaan myös pysyvät tunnisteet. Näin Tietoarkisto voi taata datojen pitkäaikaisen käytettävyyden ja kansainvälisen yhteentoimivuuden.

Vuodesta 2017 alkaen olemme hyödyntäneet kansallista pitkäaikaissäilytyspalvelua tutkimusaineistojemme bittitason säilytykseen. Palvelun suunnittelussa ja rakentamisessa olemme olleet mukana vuodesta 2008 ja pilotointivaiheemme alkoi 2015.

Sertifiointi luotettavuuden merkkinä

Tietoarkiston asiantuntijoiden pitkäjänteisen, jatkuvan, huolellisen ja innovatiivisen työn tuloksena olemme onnistuneet kehittämään ja rakentamaan toimivat prosessit, jotka varmistavat aineistojen pitkäaikaissaatavuuden. Tästä osoituksena saimme Data Seal of Approval (DSA) -sertifikaatin vuonna 2014 ensimmäisenä suomalaisena PAS-organisaationa. Tällä hetkellä meillä on voimassa vaatimuksiltaan DSA:ta tiukempi CoreTrustSeal (CTS) -sertifikaatti.

1 Lue lisää: Tietoarkistoblogi 9/2018: Ailassa nyt tallennustyökalu aineistojen arkistointiin ja Ohjeita aineiston arkistoijalle.

Lisätietoa:

» Tietoarkiston CoreTrustSeal-sertifikaatti (PDF)
» Aila
» Aila EOSC Marketplacessa
» Tietotilinpäätökset
» Tietoarkistoblogi: Tietoarkisto jatkaa uudella vuosikymmenellä luotettuna tutkimusaineistojen asiantuntijana

Mari Kleemola
kehittämispäällikkö, varajohtaja

Katja Moilanen
tietoarkkitehti

etunimi.sukunimi [at] tuni.fi