Näytetään tekstit, joissa on tunniste EU. Näytä kaikki tekstit
Näytetään tekstit, joissa on tunniste EU. Näytä kaikki tekstit

24. huhtikuuta 2026

FIDELIS takes shape: Collaboration towards a more trustworthy data infrastructure

The future of trustworthy digital repositories, shared development tools, and European collaboration were at the heart of the FIDELIS project consortium meeting held in The Hague in March. During the two-day meeting, discussions focused on the sustainable maintenance of the network, current and emerging tools, and how training can become an impactful part of everyday operations even after the project has concluded.

FIDELIS project (1 January 2025–31 December 2027, Horizon Europe) will set up, develop, and operate a European network of trustworthy repositories that will support the development and growth of TDRs within the EOSC ecosystem; foster harmonisation and interoperability across repositories to enable an EOSC federation of TDRs; and strengthen the upskilling of repositories and expansion of the network through an active training and support programme. FSD's participants in the Consortium Meeting were Henna Kaartinen, Mari Kleemola, and Tuomas J. Alaterä.

At the consortium meeting, discussions focused heavily on the strategic development of the Trustworthy Digital Repository (TDR) Network, with particular attention to its long-term sustainability. Participants explored how the Network could continue to operate beyond the lifetime of the project and how it could support the European research data infrastructure more broadly.

Another key theme of the consortium meeting was the ongoing work on the FIDELIS Transparent, Trustworthy Repository Attributes Matrix (TTRAM). During the project, TTRAM has evolved into a practical and transparent tool that helps repositories systematically assess and strengthen their trustworthiness. The role of the tool as part of broader community-driven development and its integration into the TDR Network were discussed extensively.

The meeting also addressed the FIDELIS training and support programme, which is now entering a more active phase. Call for mentoring and peer-to-peer support programme has been open since late February and call for participation in Support for the Adoption of Solutions will in the end of April. Both calls aim to provide repositories with concrete, hands-on support for developing trustworthy and sustainable services.

In addition, discussions covered the role of FIDELIS within the European Open Science Cloud (EOSC). Attention was given to how the TDR Network can contribute to the EOSC Federation by widening the expertise of its member repositories and by promoting high-quality, trustworthy data in line with the FAIR principles.

Representatives of CESSDA repositories at the Consortium Meeting. Mari (third from the left), and Tuomas and Henna (on the right). Photo: Anja Radonjic.

From FSD's perspective, it is important that the results of project work also become embedded in everyday practice and bring clear benefits to users. The work undertaken in the FIDELIS project supports the continuous development of FSD’s archival services and helps clarify practices related to trustworthiness, transparency, and sustainability. For users, this may be reflected in more harmonised practices, clearer communication, and stronger support for opening data and ensuring long-term preservation in line with the FAIR principles.

Furthermore, through the project’s training and support, FSD’s expertise within the European repository community is strengthened. This is visible in the advice, training, and practical support that FSD offers at different stages of research data lifecycle. With the help of project funding, new solutions and services are explored and tried out, while already proven services or functions are strengthened and developed.

Read more about the Consortium Meeting in the FIDELIS project blog!

Henna Kaartinen
Project Assistant
firstname.surname [at] tuni.fi

FIDELIS-työ konkretisoituu: Yhteistyöllä kohti luotettavampaa datainfrastruktuuria

Luotettavien digitaalisten repositorioiden tulevaisuus, yhteiset kehittämistyökalut ja eurooppalainen yhteistyö olivat FIDELIS-hankkeen konsortiokokouksen keskiössä viime maaliskuussa Haagissa. Kaksipäiväisessä tapaamisessa keskusteltiin verkoston kestävästä ylläpitämisestä, ajankohtaisista työkaluista sekä siitä, miten koulutus muodostuu vaikuttavaksi osaksi arjen toimintaa myös hankkeen jälkeen.

FIDELIS-hanke (1.1.2025–31.12.2027, Horisontti Eurooppa) rakentaa eurooppalaista luotettavien repositorioiden verkostoa, edistää yhteentoimivuutta, kehittää parhaita käytäntöjä ja tarjoaa repositorioille koulutusta ja tukea. Konsortiokokoukseen Tietoarkistosta osallistuivat Henna Kaartinen, Mari Kleemola ja Tuomas J. Alaterä.

Kokouksessa keskityttiin erityisesti Trustworthy Digital Repository (TDR) -verkoston strategiseen kehittämiseen, eritoten sen tulevaisuuden jatkuvuuden näkökulmasta. Keskusteluissa pohdittiin, miten TDR-verkosto voi toimia kestävällä tavalla myös hankkeen päättymisen jälkeen ja tukea laajemmin eurooppalaista tutkimusdatainfrastruktuuria.

Toinen keskeinen teema oli ajankohtainen työ FIDELIS Transparent Trustworthy Repository Attributes Matrix (TTRAM) -työkalun parissa. TTRAM on kehittynyt hankkeen aikana käytännölliseksi välineeksi, jonka avulla repositoriot voivat tarkastella ja kehittää omaa luotettavuuttaan systemaattisesti ja läpinäkyvästi. Työkalun roolia osana laajempaa yhteisöllistä kehittämistä ja sen integrointia TDR-verkostoon käsiteltiin laajasti.

Kokouksessa tarkasteltiin myös FIDELIS-hankkeen tuki- ja koulutusohjelmaa, joka on parhaillaan siirtymässä aktiivisempaan vaiheeseen. Mentorihaku on ollut auki jo toista kuukautta ja haku parhaiden käytäntöjen soveltamista tukeviin koulutuksiin käynnistyy huhtikuun lopussa. Molempien tavoitteena on tarjota repositorioille konkreettista tukea käytäntöjensä ja luotettavuutensa kehittämiseen.

Lisäksi keskusteluun nousi FIDELIS-hankkeen rooli EOSCissa (European Open Science Cloud). Erityisesti pohdittiin, miten TDR-verkosto voi tukea EOSC-federaatiota hyödyntämällä jäsentensä laajaa asiantuntemusta ja edistämällä FAIR-periaatteiden mukaisen, laadukkaan ja luotettavan datan saatavuutta.

CESSDA-arkistojen edustajia konsortiokokouksessa. Mari (3. vas) sekä Tuomas ja Henna (oikealla). Kuva: Anja Radonjic.

Tietoarkiston näkökulmasta on tärkeää, että hanketyön tulokset tulevat myös osaksi arkea, aina asiakkaillemme asti. FIDELIS-hankkeessa tehty työ tukee arkistopalveluiden jatkuvaa kehittämistä, reflektointia ja toimintatapojen selkeyttämistä erityisesti luotettavuuden ja läpinäkyvyyden näkökulmasta. Asiakkaille tämä näyttäytyy yhtenäisempinä käytäntöinä, selkeämpänä viestintänä sekä entistä vahvempana tukena FAIR periaatteiden mukaisen datan avaamiseen ja pitkäaikaissäilytykseen.

Lisäksi hankkeen koulutus- ja tukitoiminta vahvistaa Tietoarkiston asiantuntijuutta osana eurooppalaista repositorioyhteisöä. Tämä heijastuu asiakkaille tarjottavana neuvontana, koulutuksina ja käytännön tukena tutkimusdatan elinkaaren eri vaiheissa. Hankerahoituksen turvin Tietoarkistossa voidaan myös kokeilla uusia toimintamalleja sekä vahvistaa ja kehittää jo hyväksi havaittuja palveluja tai toimintoja.

Lue tarkemmin konsortiokokouksen kuulumisia FIDELIS-hankkeen blogikirjoituksesta!

Henna Kaartinen
projektiassistentti
etunimi.sukunimi [at] tuni.fi

23. maaliskuuta 2021

Palveluita tutkimuksen tueksi kehitetään hankeyhteistyöllä

Tietoarkisto osallistuu jatkuvasti useisiin erilaisiin kehityshankkeisiin. Hankkeissa kehitetään nykyisiä palveluita ja suunnitellaan uusia tutkijoille sekä tutkimuksen tueksi. Hanketyössä pyritään löytämään ratkaisuja eri toimijoiden yhteisiin tarpeisiin. Eurooppalaisten yhteiskuntatieteellisten tietoarkistojen tutkimusinfrastruktuuri CESSDAn palveluntuottajana Tietoarkisto osallistuu aktiivisesti sen moniin työryhmiin ja projekteihin. Lisäksi Tietoarkisto tekee yhteistyötä muiden kansainvälisten ja kansallisten tahojen kanssa.

Monet tietoarkistolaiset osallistuvat hankkeisiin eri tavoin. Hanketyö on arkipäivää erityisesti Projektit ja kehittäminen -moduulin jäsenille, joiden työajasta suurin osa kuluu hanketehtävien parissa. Kehittämispäällikkö Mari Kleemola ja erityisasiantuntija Taina Jääskeläinen kertovat hanketyön arjesta sekä kuulumisia hankkeista, joihin he osallistuvat.

Mihin hankkeisiin osallistut ja mitä niissä tehdään?

Mari: Osallistun SSHOC- (Social Sciences & Humanities Open Cloud) ja EOSC Nordic (European Open Science Cloud) -hankkeisiin sekä CESSDAn Trust-projektiin. Lisäksi toimin CESSDAn Tools-työryhmän vetäjänä.

– Näillä hankkeilla on rinnakkaisia tehtäviä, joilla on synergiaetuja. Esimerkiksi SSHOC- ja CESSDA Trust -hankkeissa edistetään luotettujen aineistovarantojen sertifiointia tukemalla data-arkistoja sähköisten aineistojen luotettavassa säilytyksessä ja laadun takaamisessa. Olen CoreTrustSeal-sertifikaatin johtokunnan jäsen ja minulle on kertynyt sertifiointiin liittyvää asiantuntemusta, jota voin tuoda hankkeisiin. Hankkeista puolestaan saadaan palautetta, jota voidaan käyttää sertifioinnin ja data-arkistojen kehittämisessä.

– EOSC Nordic ja SSHOC -projekteissa sekä Tools-työryhmässä kehitetään myös uusia palveluita ja parannetaan aineistojen ja niiden kuvailutietojen yhteentoimivuutta. Kaikilla hankkeilla on yhteisenä tavoitteena Euroopan avoimen tieteen pilvipalvelun eli EOSCin rakentaminen.

Taina: Yli puolet työajastani kuluu CESSDAn hankkeisiin. Toimin sekä CESSDAn aineistoluettelon että sanastopalvelun sisältövastaavana. Rooliin kuuluu ohjausryhmän vetäminen, käyttäjien edustaminen, vaatimusmäärittely, yhteistyö teknisen puolen vastuuhenkilöiden kanssa, tiedottaminen, sidosryhmäyhteistyö ja monenlainen toiminnan sujuvuuden varmistaminen. Lisäksi osallistun monikielisen ELSST-asiasanaston (European Language Social Science Thesaurus) sisällön kehittämiseen ja koulutan kaikki sen kääntäjät.

– CESSDAn aineistoluettelossa on 15 kansallisen palveluntuottajan julkaisemat tutkimusaineistokuvailut, joita on tällä hetkellä yli 30 000. Se on erinomainen lähde löytää yhteiskuntatieteellisiä ja joitakin terveystieteellisiä tutkimusaineistoja eri maista. Luettelosta on julkaistu uusi versio viime kuussa.

– CESSDAn sanastopalvelussa luodaan, ylläpidetään ja käännetään monikansalliseen käyttöön tarkoitettuja sanastoja. Monet sanastoista on luotu DDI Allianssin tutkimusaineistojen kansainvälisen kuvailustandardin osaksi, ja osallistun sen sanastoryhmän työhön itsekin. CESSDAn jäsenorganisaatiot kääntävät näitä omille kansallisille kielilleen.

– Näiden lisäksi osallistun kahteen EU-projektiin: TRIPLE (Transforming Research through Innovative Practices for Linked Interdisciplinary Exploration)- ja SSHOC-projekteihin. Molemmissa on samoja elementtejä kuin CESSDA-hankkeissa, mutta nämä koskevat useampaa eurooppalaista tutkimusinfrastruktuuria ja tieteenalaa, kuten kielitieteitä ja humanistisia tieteitä. Kummassakin projektissa olen yhden työpaketin jäsenenä, useimmiten liittyen sanastoihin, niiden hyödyntämiseen tai laajoihin aineistoluetteloihin. TRIPLEssä kiinnostaa erityisesti nähdä, missä määrin algoritmeilla onnistutaan rikastuttamaan eri maista ja eri kielillä tulevaa metadataa.

Mikä hanketyössä on antoisinta?

Mari: Hanketyössä oppii paljon uutta eikä siinä ole kahta samanlaista päivää. Se avaa näköaloja Eurooppaan ja muualle maailmaan ja tarjoaa tilaisuuden nähdä, mitä muualla tehdään ja miten. Hankkeiden kautta voimme myös vaikuttaa siihen, että Suomen avoimen tieteen hyviä käytäntöjä omaksuttaisiin kansainvälisesti. On myös antoisaa olla osaltani vaikuttamassa alan kehitykseen ja rakentamassa CESSDAa ja sen palveluita yhteiskuntatieteilijöille.

Taina: Olen viihtynyt toimiessani ja verkostoituessani eri maista tulevien ihmisten kanssa. On mielekästä tehdä työtä, jossa voi kerrankin hyödyntää kaikkia asiantuntemusalueitaan. Olen taustaltani sekä informaatikko että kielenkääntäjä, joten metadatan harmonisointi ylikielirajojen ja datan löydettävyys kiinnostavat minua aina. Vuosikausien kieliharrastuksestani on ollut yllättävän paljon iloa, koska huomasin voivani tutkailla sanastoja tai aineistokuvailuja kahdeksalla eri kielellä ja pysyä suunnilleen kärryillä siitä, onko siellä vääriä tietoja väärässä paikassa jne. Taidan olla kansainvälisessä työskentelyssä kuin kala vedessä.

– Antoisaa on huomata, että on pystynyt organisoimaan asioita niin, että tavoitteet saavutetaan ja maaliin päästään, vaikka olisi tullut kuinka monta yllättävää mutkaa matkan varrella. Koko ajan saa myös oppia uutta eikä tylsää päivää ole.

Entä mikä on haastavinta?

Mari: Haastavaa on se, että kansainvälisessä hanketyössä tehdään enimmäkseen virtuaalisesti tiimityötä eri taustoista tulevien ihmisten kanssa. Se vaatii erilaisten näkökulmien, tieteenalakäytäntöjen ja ihmisten työtapojen huomioon ottamista ja yhteensovittamista. Monesti tapaaminen ja tutustuminen edes kerran kasvokkain helpottaa yhteistyötä.

Taina: Kun kehitetään kansainvälisiä palveluja, tavoitteesta ollaan usein yksimielisiä mutta matkan varrella joudutaan neuvottelemaan siitä, miten tavoitteisiin parhaiten päästään. Data-arkistot ovat keskenään hyvin erilaisia: osa hyvin resursoituja ja osa vähemmän, osa toiminut vuosikymmeniä, osa on toiminnan alkutaipaleella. Tämä asettaa omat haasteensa esim. metadatan harmonisoinnissa.

– Käyttäjien edustajien ja IT-puolen on myös hyvä jatkuvasti keskustella siitä, paljonko kukin käyttäjien toive vaatii koodauspuolella. Joskus haluttu toiminnallisuus on helposti toteutettavissa ja joskus se vaatii runsaasti työtä. Jälkimmäisessä tapauksessa käyttäjien edustajien on pohdittava, onko se vaivan arvoista. Tärkeintä olisi tunnistaa ja jättää pois paljon IT-työtä vaativat vähemmän tärkeät tavoitteet, jotta voidaan keskittyä olennaisempiin.

– Sisältövastaava on tietyissä asioissa vahtikoira, joka tarkkailee mm. metadatan laatua ja yhteensopivuutta CESSDAn aineistoluettelon ja sanastojen vaatimusten kanssa. Tehtävässä täytyy neuvotella eri maissa sijaitsevien organisaatioiden kanssa heidän metadatansa laadusta ja yhteensopivuudesta sekä hoputtaa esim. sanastojen kääntäjiä tekemään oma kieliversionsa ajoissa. Ystävällisistä reaktioista päätellen ratkaisuja etsivää vahtikoiratoimintaani ei kuitenkaan ole koettu ikäväksi.

Kuinka koronavuoden poikkeusolot ovat vaikuttaneet hanketyöskentelyyn?

Mari: Ehdin onneksi tavata suurimman osan tämänhetkisten hankkeiden yhteistyökumppaneista ennen poikkeusolojen alkua, joten yhteistyö sujuu hyvin myös virtuaalisesti. Kasvokkaisten tapaamisten puuttuessa vapaamuotoinen ideointi on kuitenkin hankalampaa. Kasvokkaisissa kokouksissa epävirallisella sosiaalisella kanssakäymisellä on suuri merkitys - työtä tehdään ihmisten kanssa ja välillä on hyvä jutella heidän kanssaan muustakin kuin työasioista!

Taina: Normaalioloissakin kansainväliset projektit tarkoittavat sähköposteja ja videokonferensseja, joten siihen koronavuosi ei ole tuonut muutosta. Zoom oli kovassa käytössä jo aiemmin. Esimerkiksi aineistoluettelon uuden version teknisen puolen tekijät olivat Iso-Britanniassa ja Norjassa, sanastotyökalun koodari puolestaan Saksassa.

– Ainoa mikä on jäänyt pois, ovat kasvokkaiset tapaamiset ja konferenssit. Niitä kaipaa ja olisi hyvä välillä olla, vaikka en lentokentillä notkumisesta ja muusta matkustamisen aikasyöpöistä pidä. Verkostoituminen on paljon helpompaa, kun ihmiset on tavannut kasvotusten. Monet asiat saa helpommin ja nopeammin selvitettyä paikan päällä ja tauoilla. Jos projektissa on paljon ihmisiä, joita on aina tavannut vain etänä, on toiminnan sujuvuudessa ja verkostoitumisessa eroa verrattuna siihen, että ryhmä olisi ainakin kerran tavannut kasvotusten.

– Etätyön huonoin puoli on työpäivien venyminen, koska tekemistä tuntuu aina riittävän loputtomiin.

Lisätietoa:

» Tietoarkiston hankesivut
» Kehittämispäällikkö Mari Kleemola
» Erityisasiantuntija Taina Jääskeläinen

Henri Ala-Lahti
tietoasiantuntija
etunimi.sukunimi [at] tuni.fi

21. marraskuuta 2017

GDPR tulee – onko akateeminen vapaus ja arkistojen toiminta vaarassa?

Euroopan unionin yleistä tietosuoja-asetusta, tuttavallisemmin GDPR:ää, ja sen aiheuttamia muutoksia tutkijoiden, yliopistojen ja arkistojen toimintaan on odotettu kauhun sekaisin tuntein jo kohta kuusi vuotta. Otsikon kysymys pyöri mielessä varmasti monella osallistujalla Tietoarkiston ja Avoin tiede- ja tutkimus -hankeen loka-marraskuun vaihteessa järjestämissä seminaareissa EU:n tietosuoja-asetus - tietosuojalainsäädännön muutokset tutkimuksessa ja arkistoinnissa sekä Tietosuoja ja tutkittavan suostumus osallistua tutkimukseen. Paikalla ja etänä tapahtumia seurasi yhteensä lähes tuhat ihmistä.

Valitsimme seminaarien ajankohdan hyvissä ajoin olettaen, että kotimainen tarkentava lainsäädäntö ja Euroopan tietosuojatyöryhmän odotettavissa olevat suostumusta koskevat ohjeet olisivat valmistuneet. Olimme sittenkin etuajassa, emmekä valitettavasti saaneet lopullisia vastauksia kaikkiin kuulijoiden - ja osin järjestäjienkin mieltä vaivaaviin kysymyksiin.

Oikeusministeriö sai lausuntokierrokselta tietosuojalaista yli sata lausuntoa. Nyt ministeriön virkamiehet valmistelevat hallituksen lakiesitystä. Lain pitäisi tulla voimaan samaan aikaan, kun tietosuoja-asetusta aletaan soveltaa 25.5.2018. Euroopan WP29-tietosuojatyöryhmän suostumusta koskeva ohjeluonnos julkaistaneen marraskuussa työryhmän kokouksen jälkeen.

Jotkin asiat ovat selvillä kuitenkin jo nyt. Varmaa on, että siitä mikä on asetuksessa säädetty, ei voida säätää uudelleen kotimaisessa tietosuojalaissa tai muissa kansallisissa säädöksissä. Tässä mielessä ei kannata odottaa liikoja kotimaiselta lainsäädännöltä. Säätää voidaan vain siitä, mihin asetus antaa mahdollisuuden. Jotkin asetuksen ja kotimaisen lain tulkinnat selviävät viimeistään vasta oikeustapauksien myötä. Lainsäädännön noudattamisen tueksi tarvitaan alakohtaisia käytännesääntöjä ja muita ohjeita.

Tavoitteena tutkittavien oikeuksien vahvistaminen

Tietosuoja-asetuksen tavoitteena on vahvistaa rekisteröidyn oikeuksia ja lisätä henkilötietojen käsittelyn avoimuutta. Se kuitenkin huomioi tutkimuksen erityislaadun eikä tarkoituksena ole rajoittaa tutkimuksen vapautta. Kansallisessa lainsäädännössä on sovitettava yhteen toisaalta oikeus henkilötietojen suojaan ja toisaalta oikeus sananvapauteen ja tiedonvälityksen vapauteen. Vapauksiin sisältyy myös tietojen käsittely akateemisen ilmaisun tarkoituksiin.

Tutkijoiden on syytä huomata, että tietosuojakielen "rekisteröity" tarkoittaa heidän tutkittaviaan, jos itse tutkimusaineisto sisältää henkilötietoja. Lisäksi henkilötiedon käsite on paljon laajempi, kuin tutkijat ajattelevat sen olevan. Kun tutkii ihmisiä ja yhteiskuntaa tavalla tai toisella, kannattaa olla kiinnostunut EU:n tietosuoja-asetuksesta ja tulevasta kotimaisesta lainsäädännöstä. Tietosuojavaltuutetun toimiston ylitarkastaja Anna Hänninen muistutti esityksessään myös, että tietosuojan toteuttaminen tutkimuksessa ylläpitää luottamusta tutkimukseen yleisesti.

Tietojen käsittelylle oltava perusteet

Tietosuoja-asetuksen 6 artikla sisältää oikeusperusteet henkilötietojen lainmukaiselle käsittelylle. Perusteita henkilötietojen käsittelylle ovat sen perusteella muun muassa tutkittavan yksilöity suostumus ja käsittelyn tarpeellisuus yleistä etua koskevan tehtävän suorittamiseksi.

Jos käsitellään arkaluonteisia tietoja, on lisäksi jonkin 9 artiklan perusteista täytyttävä. Arkaluonteisia tietoja saa käsitellä esimerkiksi nimenomaisella suostumuksella, tieteellistä tai historiallista tutkimustarkoitusta varten, mutta käsittelyoikeudesta ja suojatoimista on säädettävä unionin oikeudessa tai kansallisella lainsäädännöllä, esimerkiksi tulevalla tietosuojalailla.

Kannattaa huomata, että arkaluonteisia tietoja saa käsitellä tutkimuksessa vain, jos se on tarpeen tutkimuksen tavoitteiden saavuttamiseksi. Toisin sanoen vaikka tutkittava olisi antanut suostumuksensa, tietoja ei saa käsitellä, jos se ei ole tarpeen. Tästä periaatteesta ei voida poiketa kansallisella lainsäädännölläkään. Esimerkiksi tarpeetonta käsittelyä olisi rekisteriaineiston käyttäminen anonymisoimattomana suojatun etäkäyttöjärjestelmän välityksellä, jos tutkimuksen tarkoituksen voisi saavuttaa anonyymiä aineistoa käyttäen. Kyse on tietojen minimoinnin periaatteen noudattamisesta. Tarvitaan siis rekistereistä tutkimustarkoituksiin valmistettuja dataversioita ja ehkä vielä yleisempään käyttöön soveltuvia versioita, ja tarvitaan Tietoarkiston kaltaisia toimijoita, jotka avustavat tutkijoita aineiston anonymisoinnissa ja avaamisessa alkuperäisen tutkimushankkeen jälkeen.

Tietosuojalain toivotaan turvaavan avointa tiedettä

Yleisen edun mukaisia arkistointitarkoituksia, tutkimustarkoituksia ja tilastollisia tarkoituksia varten tapahtuvan henkilötietojen käsittelyn perussäännös on tietoasuoja-asetuksen 89 artikla. Siinä säädetään suojatoimista ja poikkeuksista, joista voidaan säätää kansallisesti tai myös unionin oikeudessa muilla säädöksillä. Artiklaan viitataan muun muassa edellä mainituissa 6 ja 9 artikloissa.

Opetus- ja kulttuuriministeriön hallitusneuvoksen Immo Aakkulan mukaan tietosuojalakiin on tulossa laaja poikkeuspykälä käsittelyperustevaatimuksista ja rekisteröidyn oikeuksista. Hän esitteli seminaarissa OKM:n ehdotusta arkistoinnin osalta. Pyrkimyksenä on turvata myös muiden kuin Kansallisarkiston toimintamahdollisuudet. Siksi ehdotuksessa arkistotyyppinen rekisterinpitäjä määritellään laajasti niin, että sen tehtävä voi olla lakisääteinen tai sääntömääräinen tutkimus- tai kulttuuriperintöaineistojen tallentaminen ja saataville saattaminen. Toiminnan olisi lisäksi perustuttava julkisesti saatavilla olevaan suunnitelmaan; tietojen tulisi olla käytettävissä tieteelliseen ja historialliseen tutkimukseen ja journalistisia tarkoituksia varten; ja tietoja voisi luovuttaa vain niille, joilla on oikeus tietojen käsittelyyn.

Koska tietosuojalaista ei ole vielä edes hallituksen esitystä, emme voi tietää, meneekö OKM:n esittämä muotoilu läpi ja miten aineistojen avaaminen jatkokäyttöön mahdollistetaan tulevaisuudessa. Mietimme Tietoarkistossa, helpottuuko vai vaikeutuuko toimintamme, kun tietosuoja-asetusta aletaan soveltaa. Toivomme tutkimusaineistojen vastuullisen avoimuuden turvaavaa ratkaisua.

Tutustu tapahtumasivujen materiaaliin

Seminaarien esitysdiat ja -taltioinnit ovat katsottavissa seminaarien tapahtumasivuilla, jos puhuja on antanut tähän luvan. Kannattaa katsoa esimerkiksi ylitarkastaja Anna Hännisen esitykset, joista saa hyvän käsityksen siitä, mitä EU:n tietosuoja-asetus merkitsee tutkimuksen tai tutkittavan suostumuksen näkökulmasta. Hallitusneuvos Immo Aakkulan esityksestä näkee tarkemmin, mitä ministeriö on ehdottanut oikeusministeriölle, jotta myös avoimen tieteen ja arkistoinnin tarpeet huomioitaisiin.

Kiitän järjestäjien puolesta suuresta kiinnostuksesta ja saamastamme palautteesta.

Lisätietoa:
Linkit seminaaritallenteisiin ja esityksiin:
» EU:n tietosuoja-asetus - tietosuojalainsäädännön muutokset tutkimuksessa ja arkistoinnissa (31.10.2017)
» Tietosuoja ja tutkittavan suostumus osallistua tutkimukseen (1.11.2017)
Lähteitä:
» EU:n tietosuoja-asetus Euroopan unionin virallisessa lehdessä (pdf)
» Tietosuojavaltuutetun toimiston tiedotteet tietosuojauudistuksesta
» Tietosuojatyöryhmä, Article 29 Data Protection Working Party
» Tiedonhallinnan lainsäädännön kehittämislinjaukset: Työryhmän raportti. Valtiovarainministeriön julkaisuja 37/2017.

Helena Laaksonen
johtaja
etunimi.sukunimi [at] uta.fi

16. kesäkuuta 2017

Suostumuksen edellytykset tietosuoja-asetuksen mukaan

Ihmisiin kohdistuvissa tieteellisissä tutkimuksissa käsitellään useimmiten tutkittavien henkilötietoja. Nykyinen henkilötietolaki (523/1999) perustuu EU:n direktiiviin yksilöiden suojelusta henkilötietojen käsittelyssä ja näiden tietojen vapaasta liikkuvuudesta (95/46/EY). Aiemmat säädökset korvaavaa uutta tietosuoja-asetusta (2016/679) aletaan soveltamaan 25.5.2018 alkaen. Henkilötietoja käsittelevien rekisterinpitäjien, esimerkiksi tutkimusryhmän tai tutkimusorganisaation, on saatettava toimintansa vastaamaan asetuksen vaatimuksia viimeistään tähän mennessä.

Tutkittavien suostumukseen perustuvan tieteellisen tutkimuksen osalta tämä tarkoittaa sitä, että jos tällä hetkellä käynnissä olevaa tutkimusta varten hankitut suostumukset eivät täytä tietosuoja-asetuksen vaatimuksia, ja tutkittavien henkilötietoja on tarpeellista käsitellä tunnisteellisina 25.5.2018 jälkeen, on tutkittavilta pyydettävä uusi suostumus ennen asetuksen ensimmäistä soveltamispäivää. Jos tutkittavien henkilötiedot on kuitenkin ennen tätä tarkoitus tuhota tai muuttaa pysyvästi tunnistamattomaan muotoon, ei tutkijoiden tarvitse ryhtyä lisätoimenpiteisiin. Jos suostumuksia ei ole vielä pyydetty tutkittavilta, tulisi ne jo nyt pyytää tietosuoja-asetuksen edellyttämällä tavalla.

Tietosuoja-asetuksen mukainen suostumus ei eroa ratkaisevasti nykyisen henkilötietolain mukaisesta suostumuksesta ja tietosuojatyöryhmän (Article 29 Working Party) suostumusta koskevasta lausuntokäytännöstä. Aiempaa lausuntokäytäntöä on nyt siirretty suoraan osaksi asetusta ja tietosuoja-asetus asettaa suhteellisen korkeat vaatimukset pätevälle suostumukselle. Seuraavassa käydään läpi asetuksen keskeisimpiä vaatimuksia suostumukselle:

  1. Osoitusvelvollisuus. Rekisterinpitäjän on pystyttävä osoittamaan, että tutkittavilta hankittu suostumus täyttää tietosuoja-asetuksen vaatimukset. Rekisterinpitäjän osoitusvelvollisuuden täyttämiseksi on tärkeää dokumentoida selkeästi esimerkiksi:
    • kuka on antanut suostumuksen,
    • miten tutkittavaa on informoitu suostumuksen antamisen yhteydessä (tutkittavalle annettu kirjallinen informaatio sekä tieto suullisesti annetusta informaatiosta) ja
    • milloin suostumus on annettu (esim. päiväys suostumuslomakkeessa tai sähköinen aikaleima).
  2. Erottuvuus ja selkeys. Kun suostumus annetaan kirjallisessa ilmoituksessa, joka koskee myös muita asioita, suostumusta koskeva pyyntö on esitettävä selkeästi erillään muista asioista. Jos esimerkiksi tutkittava osallistuu tutkimuksen yhteydessä työpaja- tai koulutustoimintaan – ja tätä toimintaa varten olisi tarpeellista sopia erillisistä ehdoista – on suostumuksen henkilötietojen käsittelyyn tieteellisessä tutkimuksessa oltava selkeästi erillään työpaja- tai koulutustoimintaa koskevista ehdoista. Suostumus henkilötietojen käsittelyyn on lisäksi pyydettävä helposti ymmärrettävässä ja saatavilla olevassa muodossa selkeällä ja yksinkertaisella kielellä.
  3. Suostumuksen aktiivinen ilmaiseminen. Tietosuojadirektiiviin verrattuna suostumus edellyttää entistä selkeämmin tutkittavan aktiivista toimintaa. Suostumus pitää antaa suostumusta ilmaisevalla lausumalla tai toteuttamalla selkeästi suostumusta ilmaisevan toimi. Suostumusta ilmaiseva lausuma on esimerkiksi suostumuslomakkeen täyttäminen ja allekirjoittaminen. Suostumusta selkeästi ilmaiseva toimena voidaan pitää kyselylomakkeen täyttämistä ja palauttamista tutkijoille. Vaikenemiseen perustuva suostumus, valmiiksi rastitettu ruutu verkkosivulla tai jonkin toimenpiteen tekemättä jättäminen sen sijaan eivät päde suostumukseksi.
  4. Tiedollisuus, vapaaehtoisuus ja yksilöitävyys. Tiedollisuus edellyttää tietoa esimerkiksi rekisterinpitäjästä (tarkista tähän liittyen organisaatiosi toimintakäytännöt) ja henkilötietojen käsittelyn tarkoituksesta. Lisäksi on huomioitava asetuksen yksityiskohtaisemmat informointisäännökset. Suostumusta ei katsota vapaaehtoiseksi, jos tutkittavalla ei ole mahdollista antaa suostumusta eri henkilötietojen käsittelytoimille, vaikka tämä olisi yksittäistapauksessa mahdollista. Vapaaehtoisuus edellyttää myös tosiasiallista valinnanvapautta ilman pelkoa haitallisista vaikutuksista. Tämä voi olla kyseenalaista, kun rekisteröidyn ja rekisterinpitäjän välillä on selkeä epäsuhta. Erityisten tietoryhmien (aiemmin henkilötietolain arkaluonteiset tiedot) käsittely edellyttää lisäksi suostumuksen nimenomaisuutta. Tämä on katsottu yleensä edellyttävän rekisteröidyn antamaa täsmällistä ilmaisua joko kirjallisesti tai suullisesti.
  5. Suostumuksen peruuttaminen. Tutkittavalla tulee olla mahdollisuus peruuttaa suostumuksensa milloin vain. Suostumuksen peruuttamisen on oltava yhtä helppoa kuin sen antamisen. Asetuksen mukaan tutkittavalle on kerrottava, että suostumuksen peruuttaminen ei vaikuta ennen suostumuksen peruuttamista tapahtuneen henkilötietojen käsittelyn lainmukaisuuteen. Suostumuksen peruuttamisen mahdollistamiseksi on oleellista, että tutkittavilla on aina käytössään tutkimuksesta vastaavan tahon ajantasaiset yhteystiedot. Suostumuksen peruttaminen ei välttämättä edellytä vastaavaa menettelyä kuin suostumuksen antaminen – olennaista on peruuttamisen helppous.
  6. Suostumuksen kattavuus. Suostumuksen pitää kattaa kaikki käsittelytoimet, jotka toteutetaan samaa tarkoitusta tai samoja tarkoituksia varten. Jos käsittelyllä on useita tarkoituksia, suostumus täytyy antaa kaikkia käsittelytarkoituksia varten. Jos esimerkiksi taiteellisen tutkimuksen yhteydessä on erotettavissa käsittelytarkoitus, joka ei liity suoraan tieteelliseen tutkimukseen, pitää myös tämä tarkoitus ilmoittaa yksilöidysti ja nimenomaisesti suostumusta pyydettäessä.
  7. Tieteellinen jatkotutkimus. Tietosuoja-asetuksen johdanto-osassa todetaan, että silloin kun tieteellisen tutkimuksen tunnustettuja eettisiä standardeja noudatetaan, suostumuksen antaminen on mahdollista tietyille tieteellisen tutkimuksen aloille. Tämä on sektorikohtainen poikkeus siihen pääsääntöön, että suostumus on annettava tarkkarajaisesti ennalta yksilöityä käyttötarkoitusta varten. Tutkittavalle täytyy kuitenkin aina varata mahdollisuus antaa suostumus pelkästään tietyille tutkimusaloille tai tutkimushankkeiden osille, jos tämä vain on mahdollista.

Asetuksen kohdasta ei ole vielä tulkintakäytäntöä. Euroopan unionin neuvoa antavan tietosuojatyöryhmän on tarkoitus julkaista syksyllä 2017 lausunto tietosuoja-asetuksen mukaisen suostumuksen tulkinnasta.

Henkilötietojen käsittely on mahdollista tutkittavan suostumuksen lisäksi myös muilla tietosuoja-asetuksen 6 artiklan mukaisilla perusteilla. Näitä ovat muun muassa yleistä etua koskevan tehtävän toteuttaminen sekä tilanteet, joissa henkilötietojen käsittely on eräissä tapauksissa tarpeen rekisterinpitäjän tai kolmannen osapuolen oikeutettujen etujen turvaamiseksi. Lisäksi erillisiä suostumukseen liittyviä säännöksiä on esimerkiksi EU:n kliinisiä lääketutkimuksia koskevassa asetuksessa (536/2014).

Suostumuksen edellytyksiä koskevien säännösten rikkomisesta voidaan määrätä hallinnollinen sakko. Tietosuoja-asetuksen artiklan 83 kohdan 5 mukainen hallinnollinen sakko on enintään 20 000 000 euroa, tai jos kyseessä on yritys, neljä prosenttia sen edeltävän tilikauden vuotuisesta maailmanlaajuisesta kokonaisliikevaihdosta sen mukaan, kumpi näistä määristä on suurempi.

Lisätietoja
» Tietosuoja ja tutkittavan suostumus osallistua tutkimukseen
Seminaari Helsingissä 1.11.2017
» Tietosuoja-asetus
» Article 29 Working Party, Opinion 15/2011 on the definition of consent, WP187
» Information Commissioner's Office: GDPR Consent Guide (draft)

Antti Ketola
lakimies, F.E.C.
etunimi.sukunimi [at] uta.fi

24. huhtikuuta 2017

Näin anonymisoit kvalitatiivisen tutkimusaineistosi

Kvalitatiivisissa tutkimusaineistoissa, esimerkiksi haastattelu- ja kirjoitusaineistoissa, tutkittavat kertovat usein itsestään ja läheisistään avoimesti yksityiskohtaisia tietoja. Lain mukaan henkilötiedot eivät saa vuotaa ulkopuolisille, joten aineistot täytyy anonymisoida huolellisesti ennen kuin ne voi arkistoida jatkokäyttöä varten.

Lähes kaikki suomalaiset yliopistot ja monet tutkimusrahoittajat suosittelevat tai vaativat, että tutkijat avaavat aineistonsa, joten anonymisointiosaaminen alkaa kuulua kvalitatiivisia aineistoja keräävän tutkijan perustaitoihin.

Tietoarkisto ja Avoin tiede ja tutkimus -hanke järjestivät 5. huhtikuuta Tutkimusaineistojen anonymisointi -seminaarin jossa käsiteltiin sekä kvantitatiivisten että kvalitatiivisten aineistojen anonymisointikeinoja.

Seminaarin esityksiin voi tutustua tapahtuman sivulla julkaistujen diojen ja esitysvideoiden avulla. Täsmällisempiä anonymisointivinkkejä kaipaavan kannattaa tutustua myös Aineistonhallinnan käsikirjaan.

Tässä blogikirjoituksessa käyn Tietoarkiston tieteenala-asiantuntijan Katja Fältin ja Tietoarkiston tutkimusapulaisen Emilia Lehdon seminaariesitysten perusteella läpi kvalitatiivisen aineiston tavallisimpia anonymisointikäytäntöjä.

Kaikki elävään ihmiseen liittyvät tiedot voivat olla henkilötietoja

Aivan ensimmäiseksi on olennaista ymmärtää, milloin aineisto vaatii anonymisoimista, eli mitkä kaikki tiedot aineistossa ovat lain mukaan henkilötietoja.

Henkilötietolaissa määritelmä on varsin laaja: henkilötietoja ovat kaikki elävää ihmistä, hänen ominaisuuksiaan tai elinolosuhteitaan kuvaavat merkinnät, joista henkilö, hänen perheensä tai hänen kanssaan yhteisessä taloudessa elävät ihmiset voidaan tunnistaa. Toisin sanoen lähes kaikki elävään ihmiseen liittyvät tiedot voivat olla henkilötietoja.

Käytännössä tiedot lasketaan henkilötiedoiksi kuitenkin vain silloin, kun niiden perusteella voidaan tunnistaa aineistosta yksittäinen henkilö. Tunnistamisen mahdollistavat tiedot, eli tunnisteet on jaettu suoriin ja epäsuoriin tunnisteisiin. Epäsuorat tunnisteet on lisäksi jaoteltu vahvoihin epäsuoriin tunnisteisiin ja epäsuoriin tunnisteisiin.

Suorat tunnisteet riittävät yksin tutkittavan tunnistamiseen, eli niiden lisäksi ei tarvita mitään muita tietoja. Suoria tunnisteita ovat esimerkiksi koko nimi, henkilönimen mukainen sähköpostiosoite ja biometriset tunnisteet kuten sormenjälki tai ääni.

Vahvat epäsuorat tunnisteet ovat tietoja, jotka eivät suoraan kerro kuka henkilö on, mutta henkilöllisyyden selvittäminen niiden perusteella on hyvin helppoa. Tällaisia ovat esimerkiksi osoite, auton rekisterinumero, harvinainen ammattinimike tai harvinainen sairaus.

Epäsuoriksi tunnisteiksi voidaan laskea monenlaiset henkilöstä kertovat tiedot, kuten sukupuoli, ikä, asuinkunta ja ammattinimike. Epäsuorat tunnisteet eivät yleensä yksin riitä tutkittavan tunnistamiseen, mutta useammat epäsuorat tunnisteet saattavat yhdessä mahdollistaa tutkittavan tunnistamisen.




Tietoarkiston humanististen tieteiden tieteenala-asiantuntija Katja Fält kertoi seminaarissa kvalitatiivisten aineistojen anonymisoimisesta teoreettisella tasolla. (Kuva: Kaisa Järvelä).

Poista aineistosta kaikki tarpeettomat tunnisteet

Aineisto on anonyymi silloin, kun yksittäisiä henkilöitä ei voida tunnistaa siitä kohtuullisesti toteutettavissa olevilla toimenpiteillä. Haastateltavien omien tietojen lisäksi on tärkeää muistaa poistaa aineistosta myös kolmansia henkilöitä koskevat tunnisteet. Laadullisissa aineistoissa näitä voi olla paljonkin, jos esimerkiksi tutkittava mainitsee haastattelussa perheenjäseniään, naapureitaan tai työkavereitaan.

Yleisenä ohjeena anonymisoinnissa voi pitää sitä, että aineistosta täytyy poistaa kaikki tarpeettomat tunnisteet. Tunnisteellisten tietojen käsitteleminen ja aineiston anonymisoiminen täytyy kuitenkin suunnitella aina aineistokohtaisesti. Jokainen tutkimusaineisto on yksilöllinen, ja joissain aineistoissa tunnistetietoja on esimerkiksi selvästi enemmän kuin toisissa.

Ennen anonymisoinnin aloittamista aineistolle onkin hyvä laatia konkreettinen anonymisointisuunnitelma. Suunnitelmaan kannattaa kirjata ainakin, mitä anonymisointitoimenpiteitä aineistolle aikoo tehdä. Lisäksi suunnitelmassa kannattaa kuvailla esimerkiksi se, miten tutkittavia on informoitu ja millä tavalla aineistoa on mahdollisesti aiemmin muokattu.

Anonymisoinnin yleinen periaate on, että suorat tunnisteet ja vahvat epäsuorat tunnisteet poistetaan aineistoista aina kokonaan. Tämän lisäksi myös epäsuorat tunnisteet vaativat yleensä vähintään jonkin verran käsittelemistä.

Joissain poikkeustapauksissa voi kuitenkin olla mahdollista jättää arkistoitavaan aineistoon jopa haastateltavan koko nimi. Näin on esimerkiksi silloin, jos haastateltava on ammattipoliitikko, haastattelu koskee politiikkaa ja haastateltava on antanut luvan nimensä julkaisemiseen.

Epäsuorien tunnisteiden kohdalla on tärkeää ottaa huomioon aina myös se, mitä tietoja tutkittavasta voi saada aineiston ulkopuolelta, esimerkiksi sosiaalisesta mediasta tai muualta internetistä.

Yksinkertaisimmillaan anonymisointi on tietojen poistamista

Tyypillisimmät laadullisen aineiston anonymisointikeinot ovat tietojen poistaminen, pseudonymisointi, kategorisointi ja tunnistetietojen vaihtaminen. Tavallisesti yksittäisen aineiston anonymisointiin joudutaan käyttämään useaa mainituista keinoista.

Yksinkertaisimmillaan tietojen poistaminen tarkoittaa suorien ja vahvojen epäsuorien tunnisteiden poistamista sekä taustamuuttujista että haastattelulitteraatioista tai esimerkiksi kilpakirjoitusteksteistä.

Haastatteluista on mahdollista poistaa yksittäisten tunnisteiden lisäksi myös pidempiä pätkiä, jos haastateltava harhautuu kertomaan itsestään yksilöiviä arkaluonteisia tietoja. Tämä on perusteltua etenkin silloin, kun tiedot eivät ole tutkimuksen varsinaisena kohteena.

Poistettavia, eli kokonaan hävitettäviä tietoja ovat myös kaikki aineistoon liittyvät, tunnisteita sisältävät taustamateriaalit. Tiedostoista on syytä tarkistaa, onko niissä piilotettuja teknisiä tietoja, esimerkiksi kuvatiedostojen tekijä- tai paikkatietoja.

Voisiko tiedon pseudonymisoida, karkeistaa tai vaihtaa?

Haastatteluissa ja kirjoitusaineistoissa henkilönimien pseudonymisointi on usein aineiston ymmärrettävyyden kannalta parempi vaihtoehto kuin se, että nimet poistettaisiin kokonaan.

Pseudonymisointi tarkoittaa sitä, että henkilönimet vaihdetaan peitenimiksi eli pseudonyymeiksi. Haastateltavana olleesta Matista voi siis tehdä esimerkiksi Pekan ja hänen Anna-vaimostaan Liisan. Pseudonymisointi täytyy suunnitella johdonmukaisesti niin, että sama henkilö esiintyy aineistossa alusta loppuun asti samalla peitenimellä.

Kategorisointia eli tietojen karkeistamista tehdään paljon esimerkiksi aineiston taustatiedoille. Taustatietojen kohdalla kategorisoiminen on yleensä parempi vaihtoehto kuin tietojen poistaminen, sillä aineiston tulkitseminen ja ymmärtäminen ilman taustatietoja olisi vaikeaa.

Haastatteluista tai kirjoitusaineistoista voidaan joissain tapauksissa karkeistaa myös esimerkiksi henkilönimiä. Tämä on järkevää silloin, kun henkilö esiintyy aineistossa korkeintaan pari kertaa eikä ole keskeinen aineiston sisällön kannalta. Esimerkiksi sivulauseessa mainitun Marjatta-naapurin voi hyvin muuttaa pelkäksi naapuriksi.

Useimmiten kategorisointia vaativat myös kaikki kirjoituksissa tai haastatteluissa esiintyvät yksilöivät ammattinimikkeet, toimipaikat, oppilaitokset ja paikkakunnat. Näiden luokittelemisessa kannattaa käyttää apuna Tilastokeskuksen valmiita luokituksia.

Joissain tapauksissa paras vaihtoehto on vaihtaa tekstissä esiintyvä yksilöivä tunnistetieto toiseksi. Aineiston ymmärtämisen kannalta voi esimerkiksi olla olennaista kertoa, että henkilö on syntynyt jouluaattona. Jotta tarkka syntymäaika ei paljastuisi, henkilön syntymävuotta on tällaisessa tapauksessa mahdollista muuttaa pari vuotta myöhemmäksi tai aikaisemmaksi.

Käytännössä anonymisointi voi sujua vaikka näin

Emilia Lehto konkretisoi laadullisen aineiston anonymisoimista seminaarissa kahden aineistoesimerkin avulla. Toinen esimerkkiaineistoista oli Tietoarkistoon tallennettu Erityislapsiperheiden tukiverkostot -kysely.



Tietoarkiston tutkimusapulainen, laadullisia aineistoja työkseen anonymisoiva, Emilia Lehto, kertoi anonymisoimisesta konkreettisten aineistoesimerkkien kautta. (Kuva: Kaisa Järvelä).

Aineistossa vastaajilta oli kysytty taustatiedoiksi heidän rooliansa (esim. äiti), ikäänsä, ammattiansa, siviilisäätyänsä, perheen lasten lukumäärää ja lasten ikiä sekä sitä, kuka lapsista on erityislapsi (esimerkiksi poika, 1. lapsi). Taustatiedoista kategorisoitiin vastaajan ikä ja ammatti. Jos siis haastateltavana olevan äidin ammatti oli esimerkiksi kätilö, ammatti karkeistettiin Tilastokeskuksen luokituksen mukaan [terveydenhuollon ammattilaiseksi]. Ikä luokiteltiin viiden vuoden tarkkuudella.

Tutkittavat käyttivät haastatteluissa paljon erityislastensa ja näiden sisarusten nimiä. Nämä korvattiin aineistossa pseudonyymeillä. Paikkakuntien nimet kategorisoitiin niin, että esimerkiksi Nokia muuttui [kaupunkimaiseksi kunnaksi Pirkanmaalla]. Yksityisen päiväkodin nimi poistettiin aineistosta kokonaan ja siihen viitattiin vain termillä päiväkoti. Jos esimerkiksi päiväkoteja esiintyi samassa haastattelussa useampia, ne erotettiin toisistaan kirjaimin, esimerkiksi näin: [päiväkoti A nimi poistettu].

Epäsuorien tunnisteiden kohdalla huomioitiin myös se, voiko tutkittavan henkilöllisyys paljastua, jos tunnisteen yhdistää muualta saatavilla oleviin tietoihin. Eräs äiti esimerkiksi puhui haastattelussa perheensä matkasta Kroatiaan. Tarkka matkakohde karkeistettiin lomamatkaksi [Eurooppaan], koska äiti oli saattanut julkaista tiedon perheen Kroatian-matkasta sosiaalisessa mediassa. Lehto vinkkasi, että jos hän itse ei ole varma, voiko jokin tunniste johdattaa muualta saatavaan tietoon yhdistettynä henkilön jäljille vai ei, hän tekee kokeeksi muutaman yksinkertaisen google-haun.

Kvalitatiiviset aineistot ovat usein huomattavasti työläämpiä anonymisoitavia kuin kvantitatiiviset aineistot. Tietoarkistossa kuitenkin toivomme, että myös kvalitatiiviset aineistot toimitetaan arkistoitavaksi mahdollisimman pitkälle anonymisoituina.

Lopullisen vastuun aineiston anonymiteetista otamme silti me. Tarkistamme kaikki aineistot ja käsittelemme niitä vielä niin, että ne ovat Ailaan päätyessään varmasti täysin anonyymeja.

Lisätietoja
» Seminaarin sivulta löydät esitysdiat ja myöhemmin myös videot
» Aineistonhallinnan käsikirja: Tunnisteellisuus ja anonymisointi

Vastaavan tekstin kvantitatiivisten aineistojen anonymisoinnista voi lukea myös Tietoarkistoblogista.

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

18. huhtikuuta 2017

Näin anonymisoit kvantitatiiviset aineistosi

Ihmistieteiden tutkimusaineistot sisältävät aina enemmän tai vähemmän henkilötietoja. Henkilötietolain mukaan tunnisteellista aineistoa voi käyttää tutkimukseen, jos se on välttämätöntä, tarkoituksenmukaista, suunniteltua ja asiallisesti perusteltua. Tutkittavia koskevat tiedot eivät kuitenkaan missään tapauksessa saa vuotaa ulkopuolisille.

Viimeistään aineiston arkistointivaiheessa tunnisteet täytyy hävittää, jos tunnisteellisen aineiston arkistoimiseen ei ole erillistä Kansallisarkistolta anottua lupaa. Useimmat suomalaiset yliopistot ja tutkimusrahoittajat kannustavat aineistojen arkistoimiseen ja avaamiseen, eli anonymisointiosaaminen alkaa kuulua jokaisen tutkijan perustaitoihin.

Anonymisointikoulutukselle onkin Suomessa selvästi tarvetta, sillä Tietoarkiston ja ATT-hankkeen huhtikuussa Tampereella järjestämään Tutkimusaineistojen anonymisointi -seminaariin ilmoittautui lähes 350 osallistujaa ympäri maata.

Seminaarin esitysdioihin voi tutustua verkossa tapahtuman sivuilla, ja myös esityksistä kuvatut videot ovat tulossa julki samalle sivulle.

Tässä blogikirjoituksessa käyn seminaariesitysten perusteella läpi määrällisen aineiston anonymisointikäytäntöjä. Kun oman aineiston anonymisointi tulee ajankohtaiseksi, yksityiskohtaisempia ohjeita kannattaa käydä lukemassa vielä Tietoarkiston Aineistonhallinnan käsikirjasta.

Tietoarkistossa toivomme, että meille toimitettavat aineistot ovat valmiiksi anonymisoituja. Tarkastamme kuitenkin kaikki aineistot, ja käsittelemme niitä usein vielä jonkin verran niin, että Ailassa julkaistavat aineistot ovat varmasti täysin anonyymeja.

Kaikki elävää ihmistä koskevat tiedot ovat henkilötietoja

Aivan ensimmäiseksi tunnisteellista aineistoa anonymisoivan tutkijan täytyy ymmärtää, mitkä tiedot ovat henkilötietoja. Tätä aihetta avasi seminaarissa Tietoarkiston kehittämispäällikkö Arja Kuula-Luumi.

Tiivistetysti voi sanoa, että henkilötiedoiksi lasketaan kaikki elävää ihmistä koskevat tiedot. Sellainen voi olla esimerkiksi tutkittavan tai tämän läheisen ominaisuus, tutkittavan elinolosuhteita koskeva maininta tai vaikkapa tutkittavan mielipide.

Tämä ei onneksi kuitenkaan tarkoita, että esimerkiksi kaikki tutkittavan esittämät mielipiteet pitäisi poistaa aineistosta ennen kuin sen voi arkistoida. Tutkittavia koskevat tiedot lasketaan henkilötiedoksi vain silloin, kun yksilö on tunnistettavissa aineistosta. Aineiston anonymisoiminen tarkoittaakin sitä, että aineistosta poistetaan, luokitellaan tai muutetaan sellaiset tiedot, joiden avulla yksilön voi tunnistaa ja esimerkiksi aineistossa esitetyt mielipiteet yhdistää tietyn yksilön mielipiteiksi.

EU:n uuden tietosuoja-asetuksen mukaan henkilö on tunnistettavissa silloin, kun hänet voidaan tunnistaa suoraan tai epäsuorasti tunnistetietojen perusteella. Käytännössä suorat tunnistetiedot tarkoittavat tietoja, jotka riittävät yksin henkilön tunnistamiseen, vaikka hänestä ei kerrottaisi mitään muuta. Suoria tunnisteita ovat siis esimerkiksi koko nimi ja henkilötunnus.

Epäsuorat tunnisteet on jaoteltu vahvoihin epäsuoriin tunnisteisiin ja epäsuoriin tunnisteisiin. Vahvat epäsuorat tunnisteet eivät viittaa suoraan henkilöön, mutta niiden avulla voi helposti selvittää, kenestä henkilöstä on kyse. Vahva epäsuora tunniste voisi siis olla esimerkiksi auton rekisterinumero, jonka avulla on mahdollista suoraan selvittää auton omistaja.

Epäsuorat tunnisteet eivät yksin paljasta henkilöllisyyttä, mutta saattavat muihin tietoihin yhdistettynä mahdollistaa henkilön tunnistamisen. Tällaisia ovat esimerkiksi ikä, sukupuoli ja asuinpaikka sekä lukuisat muut fyysiset, psyykkiset, taloudelliset ja sosiaaliset tekijät.

Tunnistettavuutta miettiessä on olennaista ottaa huomioon myös se, mitä tietoja henkilöstä on saatavilla muualta kuin omasta aineistosta. Moni paljastaa itsestään paljon sosiaalisessa mediassa. Lisäksi esimerkiksi julkiset asiakirjat ja järjestöjen verkkosivut voivat tarjota monenlaisia tietoja.



Tietoarkiston kehittämispäällikkö Arja Kuula-Luumi piti seminaarissa esityksen aiheesta Tietosuoja tutkimuksessa. (Kuva: Kaisa Järvelä).

Anonymisointi on aina peruuttamaton

Yksi olennainen asia on ymmärtää, että aineiston pseudonymisointi ja anonymisointi ovat eri asioita. Jos tutkijat analysoivat aineistoa ilman tunnisteita, mutta säilyttävät tunnistetiedot ja koodiavaimen itsellään, aineisto ei ole anonyymi vaan pseudonyymi, eikä sitä voi esimerkiksi arkistoida sellaisenaan jatkokäyttöä varten.

Lain mukaan aineisto on anonyymi vasta silloin, kun siitä ei voi tunnistaa yksittäisiä tutkittavia millään kohtuullisesti toteutettavissa olevalla keinolla. Tietosuoja-asetuksen mukaan kohtuullisuutta tulee arvioida tunnistamisesta aiheutuvien kulujen, tunnistamiseen tarvittavan ajan ja käytettävissä olevan teknologian näkökulmista.

EU:n tietosuojatyöryhmä neuvoo arvioimaan aineiston tunnisteellisuutta kolmesta näkökulmasta:

  1. Onko yksilö edelleen mahdollista erottaa joukosta?
  2. Onko tietojen yhdistäminen yksilöön mahdollista?
    ja
  3. Voidaanko yksilöä koskevat tiedot päätellä?

Tietoarkiston tutkimusamanuenssi Eliisa Haanpää konkretisoi kysymyksiä vielä kolmella esimerkillä:

  1. Pystyykö yksittäisen henkilön tunnistamaan vastauksista, kun on tiedossa, että hän on vastannut kyselyyn?
  2. Pystyykö vastaukset yhdistämään henkilöön, vaikka ei tiedä, onko hän vastannut kyselyyn?
  3. Paljastaako esimerkiksi tietyn paikallisradion kuuntelemisen kaltainen yksityiskohta, että henkilö asuu tietyssä kunnassa?

Anonyymin aineiston määritelmän kannalta on olennaista myös se, että anonymisointitoimien täytyy olla peruuttamattomia. Kertaalleen anonymisoitu aineisto ei siis saa olla palautettavissa tunnisteelliseen muotoon.



Tietoarkiston tutkimusamanuenssi Eliisa Haanpää kertoi kvantitatiivisten aineistojen anonymisoinnista sekä teoreettisella tasolla että konkreettisten aineistoesimerkkien avulla. (Kuva: Kaisa Järvelä).

Anonymisointi alkaa tarkasta suunnittelusta

Eliisa Haanpäällä on vuosien kokemus erilaisten kvantitatiivisten aineistojen anonymisoimisesta. Hän korostikin seminaariesityksessään, että kaikkiin aineistoihin suoraan sovellettavaa anonymisointimallia ei ole olemassa, vaan yksittäiset toimet täytyy viime kädessä suunnitella kunkin aineiston ehdoilla. Tutkijan on siis punnittava aina erikseen, mitkä käytännöt toimivat parhaiten juuri oman aineiston kohdalla. Oman aineiston anonymisointia suunnitellessa kannatta pohtia esimerkiksi, kuinka arkaluontoinen aineisto on, ja mitä aihetta se käsittelee, eli mitkä tiedot on olennaista säilyttää, jotta aineisto pysyy ymmärrettävänä.

Jotta anonymisoiminen sujuisi alusta loppuun asti loogisesti, Haanpää neuvoi laatimaan kirjallisen anonymisointisuunnitelman, jonka mukaisesti johdonmukainen anonymisointi on helppo toteuttaa. Hyvä perusmalli on anonymisoida ensin taustamuuttujat, seuraavaksi mahdolliset avokysymykset ja lopuksi vielä muita tunnisteita sisältävät muuttujat sekä mahdolliset muut aineistoon liittyvät lisämateriaalit.

Kolme yleisintä tapaa anonymisoida kvantitatiivista aineistoa

Määrällisen aineiston kohdalla kolme yleisintä anonymisointikeinoa ovat muuttujan poistaminen, arvojen luokittelu ja tunnisteiden poistaminen avokysymysten vastauksista.

Muuttuja on järkevää poistaa aineistosta kokonaan silloin, kun siinä on paljon tunnisteita. Käytännössä muuttujan käsittelemiseen vaikuttaa se, millaisia tunnisteita se sisältää. Suorat tunnisteet ja vahvat epäsuorat tunnisteet, siis esimerkiksi nimet, henkilötunnukset tai auton rekisterinumerot tulee poistaa kokonaan. Epäsuorien tunnisteiden, kuten vastaajan iän, asuinkunnan ja sukupuolen kohdalla on arvioitava tapauskohtaisesti kannattaako ne poistaa tai luokitella vai onko ne turvallista jättää aineistoon.

Arvojen luokittelemiseen on olemassa kaksi keskenään hieman erilaista mallia. Ensimmäisessä, perusluokittelumallissa vastaukset yhdistetään järjestäen luokiksi. Yleinen käytäntö on yhdistää esimerkiksi vastaajien iät viiden ikävuoden luokiksi tai työt ammattiryhmiksi.

Toinen yleinen luokittelumalli on arvojen harkinnanvarainen luokittelu. Se tarkoittaa, että vastauksista poistetaan tai karkeistetaan harvinaisia ääriarvoja. Jos esimerkiksi kyselyssä on mukana vain vähän iäkkäitä vastaajia, heidät voidaan yhdistää yhdeksi yli 50-vuotiaiden luokaksi.

Luokkia ei kannata yrittää keksiä itse, vaan apuna on hyvä käyttää Tilastokeskuksen vakiintuneita luokittelumalleja. Tilastokeskuksen luokitukset on suunniteltu huolella sellaisiksi, että ne ovat mahdollisimman yleisiä, mutta kuitenkin informatiivisia.

Kolmas yleinen anonymisointikeino on tunnisteiden poistaminen avokysymysten vastauksista. Tämä on tarpeen, jos tutkittavat ovat antaneet esimerkiksi harrastuksia koskeviin avokysymyksiin niin yksityiskohtaisia vastauksia, että heidät voi niiden perusteella tunnistaa.

Avokysymysten vastauksia ei yleensä tarvitse poistaa kokonaan, vaan niistä voi poimia yksittäisiä tunnisteellisia pätkiä, ja muuttaa ne anonyymimpään muotoon. Jos vastaaja esimerkiksi mainitsee asuvansa Humppilassa, vaikka vastaajan kotikunta ei saisi selvitä aineistosta, kunnan nimen voi muuttaa Tilastokeskuksen luokituksiin perustuen muotoon [maaseutumainen kunta Kanta-Hämeessä].

Aineistosta on pystyttävä erottamaan, mitkä kohdat avovastauksista on anonymisoitu, eli tekstiin tehdyt muutokset kannattaa merkitä selkeästi ja järjestelmällisesti. Hyvä ratkaisu on esimerkiksi hakasulkeiden käyttäminen.

Tarkempia esimerkkejä siitä, miten Haanpää on käytännössä anonymisoinut erilaisia aineistoja voi käydä katsomassa seminaarin tapahtumasivulta löytyvistä esitysmateriaaleista. Vastaava kvalitatiivisten aineistojen anonymisointia käsittelevä blogikirjoitus julkaistaan Tietoarkistoblogissa myöhemmin tämän kuun aikana.

Lisätietoja
» Seminaarin sivulta löydät esitysdiat ja myöhemmin myös videot
» Aineistonhallinnan käsikirja: Tunnisteellisuus ja anonymisointi

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

2. joulukuuta 2016

Suomi on tieteen avoimuudessa Pohjoismaiden kärkimaa

Tieteen avoimuus on tärkeä tavoite, kysyttiin asiaa sitten suomalaisilta, muilta pohjoismaalaisilta tai eurooppalaisilta. Useimmissa maissa on kuitenkin vielä melkoisesti matkaa siihen, että avoimuus olisi sujuva osa tutkijoiden arkea.

Hyvät ja huonot uutiset kävivät selväksi Helsingissä viime viikolla järjestetyssä Nordic Open Science and Research Forum 2016 -tapahtumassa, johon kokoontui avoimen tieteen asiantuntijoita ainakin Suomesta, Ruotsista, Norjasta, Tanskasta ja Brysselistä.

Kansainväliset puhujat olivat yksimielisiä avoimen tieteen eduista. Esityksestä toiseen todettiin, että ihannetapauksessa avoin tiede nopeuttaa innovaatioiden syntymistä ja takaa sen, että sekä yhteiskunta että yksityiset rahoittajat saavat tutkimukseen sijoittamillensa rahoille parhaan mahdollisen vastineen. Tutkijoihin kohdistuvista hyödyistä korostuivat ainakin päällekkäisen työn väheneminen ja tutkimusten yhteiskunnallisen vaikuttavuuden kasvu.

Esimerkiksi Jean-Claude Burgelman Euroopan Komission tutkimus- ja innovaatio-osastolta totesi, että avoimen tieteen edistämisen keskeisenä tavoitteena on kasvattaa radikaalisti eurooppalaisen tieteen laatua ja vaikuttavuutta – kukapa tällaisia tavoitteita vastustaisi.

Kaikesta huolimatta siirtyminen avoimen tieteen aikakaudelle on monissa maissa lähtenyt liikkeelle hitaasti. Pohjoismaista kehityksessä on selvästi pisimmällä Suomi. Meillä tieteen avaamiseen on ryhdytty päättäväisesti sekä poliittisen hallinnon, rahoittajien että yliopistojen tasolla.

Opetusministeriön Avoin tiede ja tutkimus -hankkeen tavoitteena on nostaa Suomi avoimen tieteen kärkimaaksi vuoden 2017 loppuun mennessä. Suomen Akatemia vaatii rahoitushakemuksiinsa liitteeksi aineistonhallintasuunnitelmaa, joka sisältää suunnitelman datan avaamisesta, ja yliopisto toisensa perään on laatinut viimeisen vuoden aikana itselleen datapolitiikan.

Esimerkiksi Etelä-Tanskan yliopiston professori Henrik Pedersen totesikin, että heillä avoimen tieteen asioissa on otettu esimerkkiä juuri Suomesta. Kehuja suomalaisten rahoittajien, poliitikkojen ja yliopistojen aktiivisuudesta tuli myös norjalaisilta ja ruotsalaisilta avoimen tieteen kollegoilta.

Suurin syy avoimen tieteen hitaaseen vallankumouksen on todennäköisesti projektin massiivinen luonne. Jean-Claude Burgelman huomautti, että avoin tiede merkitsee systemaattista toimintatavan muutosta koko tiede- ja tutkimusmaailmassa. Tutkimusaineistojen ja -tulosten onnistunut avaaminen vaatii konkreettisia muutoksia tutkimusprosessin kaikissa vaiheissa. Osaamisen ja ajattelumallien päivittämistä tarvitaan kaikissa tutkimuksen sidosryhmissä.

Esityksistä nousi esiin monia konkreettisia huolia, joihin pitäisi löytää ratkaisu ennen kuin avoin tiede voi oikeasti muuttua hienosta visiosta käytännöksi. Erityisen yksimielisiä kansainväliset asiantuntijat olivat siitä, että tieteen avaaminen vaatii rahoitusta, tutkijoiden ja tutkimuksen tukipalveluissa työskentelevän henkilökunnan kouluttamista, selkeää palkitsemismallia ja infrastruktuureja, jotka käytännössä tekevät tieteen avaamisesta mahdollista – avoimille aineistoille täytyy esimerkiksi olla tarjolla säilytyspaikkoja, joista toiset tutkijat pääsevät niitä helposti hyödyntämään.

Päättäjät ja poliitikot tuntuvat olevan sekä Pohjoismaissa että muualla Euroopassa tieteen avaamisesta pääosin innoissaan, mutta tutkijoilla on vielä selvästi varautuneempi asenne. Esimerkiksi Ruotsin tietoarkiston johtaja Max Petzold totesikin, että käytännössä avoimuuteen siirtymisen täytyy tapahtua paikallisesti yliopistoissa, joissa tutkijat aineistojansa tuottavat. Avoimuudesta voi tulla totta vain, jos käytännön apu, aineistonhallintakoulutus ja tarvittavat IT-infrastruktuurit saadaan tutkijoiden käyttöön, heidän omiin kotiyliopistoihinsa.

Esiintyjät olivat järjestäen sitä mieltä, että ratkaisevia kysymyksiä tutkijoiden motivoimisen kannalta ovat rahoitus, joka on suunnattu nimenomaan aineistojen avaamiseen, ja lupaus siitä, että aineistojen avaamisesta saa tieteellisen meriitin.

Moni korosti myös sitä, että avoimen tieteen huumassa pitää muistaa ottaa huomioon eri tieteenalojen väliset erot ja se, että ehdoton vaatimus kaikkien aineistojen avaamisesta ei ole realistinen tai edes järkevä. Esimerkiksi Mikael Karstensen Elbæk Tanskan teknillisestä yliopistosta muistutti, että yliopistojen yhteistyö yksityisten yritysten kanssa ei saa avoimuuden takia vaarantua. Hänen mukaansa avoimen datan käsitteestä olisikin hyvä siirtyä reilun datan käsitteeseen. Tällöin lähtökohtana olisi, että data on niin avointa kuin mahdollista, mutta toisaalta myös niin yksityistä kuin on tarpeen.

Hallvard Fossheim Bergenin yliopistosta korosti, että kunnioitus tutkittavaa kohtaan ei saa avoimuuden aikakaudella unohtua. Hän muistutti, että jos tutkimuksessa käsitellään henkilötietoja, tutkittavalta täytyy olla aineiston avaamiseen aina vapaaehtoinen, asialliseen informointiin perustuva suostumus.

Suomen Akatemian tutkimusasioista vastaava ylijohtaja Riitta Maijala puolestaan huomautti, että tutkimuksen laadun ja luotettavuuden säilymisestä pitää pystyä huolehtimaan, vaikka avoimuus lisääntyy. Hän tiivisti, että tieteen avaaminen täytyy hoitaa niin, että tieteen laatu nousee eikä heikkene.

Vaikka avoimeen tieteeseen liittyy vielä monenlaisia huolia, niiden ratkaisemiseksi on alettu tehdä aktiivisesti töitä eri puolilla Eurooppaa.

Esimerkiksi Euroopan Komission asettama kansainvälinen työryhmä työskentelee parhaillaan kahdeksan keskeisen avoimeen tieteeseen liittyvän kysymyksen parissa. Listalla ovat muun muassa tutkijoiden palkitsemismalli, tieteen laadun ja vaikuttavuuden mittaustavat, tiedejulkaisemisen tulevaisuus ja eurooppalainen avoimen tieteen pilvipalvelu, joka tarjoaa yhden käytännön ratkaisun datan säilyttämiseen ja jakamiseen.

Ivo Grigorov, Tanskan teknillisestä yliopistosta esitteli EU-rahoitteista Foster-projektia, jossa tutkijoille ja esimerkiksi kirjastojen henkilökunnalle tarjotaan avoimeen tieteeseen ja aineistonhallintaan liittyvää koulutusta sekä sähköisesti että kasvotusten.

Sverker Holmgren NordForskista kertoi, että Norjassa on viimeisten kolmen vuoden aikana alettu pienen tauon jälkeen tehdä tosissaan töitä avoimen tieteen edistämisen eteen. Esimerkiksi Norwegian Research Council voi nykyään myöntää rahaa erikseen aineistojen avaamiseen. Ympäri Pohjois-Eurooppaa on parhaillaan käynnissä lukuisia lupaavia projekteja.

Jean-Claude Burgelman huomautti, että tieteen avaaminen ei ole pinnalla vain Pohjoismaissa tai Euroopassa, vaan se kiinnostaa juuri nyt ympäri maailmaa. Hän totesikin, että edessä on jännittävät poliittiset ajat, kun avointa tiedettä aletaan toden teolla muuttaa visiosta todellisuudeksi kaikkialla maailmassa.

Lisätietoja:
» Nordic open Science and Research Forum

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

21. kesäkuuta 2016

Suomalaisen tutkimuksen asema on varmistettava!

Tutkimus on ottamassa aimo harppauksen kohti tiedon entistä nopeampaa kertymistä ja tehokkaampaa tutkimusrahoituksen käyttöä. Avoin julkaiseminen saattaa tutkimusryhmien tulokset aiempaa nopeammin muiden tutkijoiden käyttöön. Tutkimusaineistojen avaaminen tuo mukanaan vielä suuremman muutoksen: se mahdollistaa tutkimusaineistojen monipuolisen käytön useilla tieteenaloilla, lisää poikkitieteellistä tutkimusta ja vähentää aineistojen kertakäyttöisyyttä sekä päällekkäisen tiedon keruuta.

Avoin julkaiseminen ja tutkimusaineistojen avaaminen ovatkin saaneet taakseen suuren joukon valtioita, mukaan lukien Suomen, EU:n tutkimussiiven ja suuren joukon kansainvälisiä tiedelehtiä. Avoimuuden kannattajien joukko myös kasvaa koko ajan.

EU:n tietosuoja-asetus määrittelee tutkittavien tietosuojan

Tutkimusaineistojen avaaminen muun tiedeyhteisön käyttöön ei kuitenkaan voi tapahtua ilman tarkkaa harkintaa. Erityisesti huolenaiheena ovat tutkittavien tietosuoja ja se, miten taataan, että yksilöllä on määräysvalta hänestä kerättyjen tietojen käyttämiseen.

EU:n uusi tietosuoja-asetus vastaa edellä mainittuihin huolenaiheisiin. Siinä on määritelty tarkkaan tutkittavilta kerättävän suostumuksen ja informoinnin muoto sekä se, mitä ihmisiä koskevaa tietoa saa käyttää tutkimuksessa ja millä ehdoin.

Tässä vaiheessa lukijaa kenties kummastuttaa, mikä tilanteessa sitten on ongelma. Jos asetus on valmis ja se tulee voimaan sellaisenaan ilman ratifioimisvaatimusta jäsenvaltioilta, eikö asia ole selvä?

Kansallinen ohjeistus asetuksen tulkintaan puuttuu

Tietosuoja-asetuksessa, niin kuin kaikissa lakiteksteissä, ongelmana on kuitenkin pykälien tulkinta. Vaikka asetus sisältää pitkän johdanto-osan, jossa selvitetään mitä sen säätäjät ovat artikloita kirjoittaessansa tarkoittaneet, tulkinnanvaraa jää silti. Lisäksi monessa kohtaa asetusta on teksti, jossa on kirjoitettu, että kansallisessa lainsäädännössä on mahdollisuus säätää tarkemmista vaatimuksista.

Tutkimuksen aseman ongelmallisuus astuu esiin tässä: Meillä ei ole vielä kansallista ohjeistusta siitä, miten asetusta pitää tulkita tutkimuskontekstissa. Vielä vähemmän meillä on tietoa siitä, aiotaanko asetuksen kansallista säätelyvaraa käyttää tiukentavaan suuntaan ja jos, kuinka paljon tiukempaan.

Tutkimuksen tekeminen vaatii paljon aikaa ja suunnittelua. Asetus tulee voimaan kahden vuoden kuluttua. Tuolloin käytettäviä tutkimusaineistoja ollaan joko keräämässä nyt tai niiden keräämistä suunnitellaan parhaillaan. Jotta asetusta päästään noudattamaan 2018, sen tulkinnan pitäisi olla tiedossa nyt, kun tutkittavilta on mahdollisuus ilman suuria lisäkustannuksia hankkia uuden asetuksen mukainen informoitu suostumus. Lääketieteellistä tutkimusta ei saa aloittaa ennen kuin se on saanut eettiseltä toimikunnalta myönteisen lausunnon. Eettisten toimikuntien täytyisikin pystyä antamaan eettiset lausunnot jo nyt uuden asetuksen mukaisesti. Sama koskee luonnollisesti myös muiden ihmistieteiden eettisiä toimikuntia.

Alueelliset toimikunnat tarvitsevat yhteiset pelisäännöt

Vallitsevassa tilanteessa eettisten toimikuntien on tehtävä ratkaisunsa tulkitsemalla asetusta mahdollisimman tiukasti, jotta asetuksen ehdot varmasti täyttyvät. Todennäköisesti myös alueellisten toimikuntien ratkaisut poikkeavat yhteisten pelisääntöjen puuttuessa toisistaan vielä entistä enemmän – alueellisia toimikuntia moitittiin jo nyt keskenään ristiriitaisista ratkaisuista työ- ja elinkeinoministeriön teettämässä selvityksessä terveysalan tutkimus- ja innovaatiotoiminnan säädösympäristöstä1.

Toimikuntien jäsenet tunnistavat ongelman ja ovat hämmentyneitä siitä, millaisia ratkaisuja heidän pitäisi tehdä. Heiltä kuitenkin puuttuvat välineet tehdä asialle mitään konkreettista. Tietoarkistoon on ollut yhteydessä useampi eettisten toimikuntien jäsen, mutta meidänkin on vastattava, ettemme valitettavasti vielä tiedä, miten asetusta pitäisi tulkita.

Epätietoisuus voi pudottaa Suomen kansainväliseltä pelikentältä

Ongelma on suurempi kuin nyt suunniteltavien tutkimusaineistojen tarkoituksenmukaista suppeampi käyttömahdollisuus ja sitä kautta resurssien alikäyttö. Kansainvälisesti tutkimusaineistojen avoimuus on saanut suuren kannattajakunnan. Kansainvälisistä tiedejulkaisuista huomattava osa (mm. PLOSone, useat BioMed Centralin jäsenlehdistä, PNAS, Nature ja NEJM) vaatii tutkimusjulkaisun ehdoksi datan saattamista avoimeksi. ICMJE:n ehdotuksen (International Committee of Medical Journal Editors) mukaan tulevaisuudessa hyväksytään julkaistavaksi vain sellaisten kliinisten tutkimusten tulokset, joiden taustalla oleva tutkimusaineisto avataan.

Jos ICMJE:n ehdotus menee läpi ja muut tiedejulkaisut kiristävät samalla omia avoimuusvaatimuksiaan, suomalaisten tutkijoiden mahdollisuus saada tutkimustuloksensa julkaistua heikkenevät olennaisesti. Kansainvälisiin rahoituksiin vaaditaan hyviä julkaisuja, joten myös niiden saaminen vaarantuu. Kansainvälisiin konsortioihin tuskin tulevaisuudessa kelpuutetaan tutkimusryhmiä, joiden aineistoja ei saa avata julkaisun yhteydessä samaan tapaan kuin muita aineistoja.

Tulkintalinjauksia tutkimukselle kaivataan

Oikeusministeriö on asettanut työryhmän käymään läpi suomalaisen lainsäädännön ongelmakohtia uuden tietosuoja-asetuksen näkökulmasta2. Alustavan arvion mukaan nykyisistä säännöksistä useassa sadassa ohjeistetaan henkilötietojen käsittelystä. Työryhmän on määrä tuottaa muutosehdotukset kesään 2017 mennessä. Myös sosiaali- ja terveysministeriössä työstetään uutta lakia, jossa säädetään sosiaali- ja terveydenhuollon asiakastietojen toissijaisesta käytöstä3. Näiden sekä uuden tietosuoja-asetuksen ansiosta tulevaisuudessa siis lainsäädäntömme voikin olla tutkimuksen osalta huomattavasti selkeämpi kuin se nyt on.

Tulkintakäytäntöjä kuitenkin tarvittaisiin jo ennen kuin tietosuoja-asetus astuu voimaan, jotta tutkijat voivat julkaista tuloksensa ja käyttää aineistojaan jatkotutkimuksissa. Salokanteleen4 mukaan suostumuksella saatujen aineistojen suostumusten on oltava asetuksen mukaisia asetuksen voimaan astuttua, jos henkilötietojen käsittelyä aiotaan jatkaa. Minkä sääntöjen pohjalta eettiset toimikunnat antavat lausuntonsa uusille tutkimuksille? Millä ehdoin Tietoarkisto, Kielipankki ja muut kansalliset tutkimusaineistojen arkistot voivat tallettaa aineistoja ja neuvoa tutkijoita pyytämään uusiin tutkimuksiin asetuksen mukaiset suostumukset?

Tarvitsemme selkeän linjauksen, joka ilmaisee lainsäätäjien näkemyksen siitä, mihin suuntaan Suomen tutkimuksessa tähdätään niin pian kuin mahdollista. Asetuksen edellyttämiä muutoksia käsittelevällä työryhmällä on mahdollisuus jakautua jaoksiin. Tulisiko tutkimusta varten asettaa oma jaos?

Tutkijoilta ja eettisiltä toimikunnilta vaaditaan päätöksiä nyt. Vuonna 2018 tietosuoja-asetuksen voimaan tullessa on monen tutkimuksen osalta myöhäistä.

Lähteet:
1 OwalGroup (2015). Selvitys terveysalan tutkimus- ja innovaatiotoiminnan säädösympäristöstä.
2 Oikeusministeriö, lakihankkeet. Henkilötietojen suojaa koskevan kansallisen lainsäädännön tarkistaminen.
3 Sosiaali- ja terveydenhuollon asiakas- ja potilastiedon toissijaista käyttöä koskevaa lainsäädäntöä valmisteleva työryhmä: Työryhmä- ja hankekuvaus ja Lainsäädäntöryhmän työskentelytila
4 Marjut Salokannel (2016). EU:n tietosuoja-asetus ja terveystietojen tutkimuskäyttö. Lääke- ja terveystieteen tutkimuksen tietosuoja nyt ja tulevaisuudessa, seminaari 17.3.2016. (pdf)

Annaleena Okuloff
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

20. huhtikuuta 2015

Eurooppalainen datafoorumi EDAF2 esitteli tulevaisuuden tutkijapalveluita mikrodatan käyttäjille

Data without Boundaries (DwB) -projektin lähestyessä loppuaan DwB-väki kokoontui yhteiseen 2nd European Data Access Forum -tapahtumaan Luxemburgiin. DwB-projektiin on osallistunut lukuisa joukko tietoarkistojen, yliopistojen ja tilastokeskuksien henkilökuntaa ympäri Eurooppaa. Projektin tavoitteena on ollut tukea ja helpottaa virallisen tilastollisen mikrodatan saantia tutkimuskäyttöön Euroopan alueella. EDAF2-tapahtumassa tutkailtiin tiiviillä tahdilla, mitä kaikkea DwB-projekti on tuonut tullessaan.

DwB-projektissa on tehty useita kyselyitä ja haastatteluja, joiden avulla on kartoitettu tutkijoiden haluja ja tarpeita mikrodatan löytämisestä ja saamisesta tutkimuskäyttöön. Tulokset kuulostavat, näin tutkimusaineistojen jatkokäyttöä edistävän organisaation edustajan korviin, tutuilta: tutkijat toivovat, että mikrodatat olisi helppo sekä löytää että saada käyttöönsä. Löytämisen helppous liitetään hyvin tuotettuihin ja yksityiskohtaisiin datan kuvailuihin. Kuvailujen eli metadatan avulla tutkijat toivovat voivansa löytää, ei vain sopivat mikrodatat, vaan myös sopivat muuttujat. Luvan saaminen mikrodatan tutkimuskäyttöön ei saisi viedä kauaa eikä olla monimutkikasta. Joskus pelkkä luvan saaminen voi viedä tutkimusprojektista vuoden. Lisäksi tutkijat toivovat muutosta monessa paikassa edelleen olevaan tapaan antaa aineisto käyttöön vain mikrodatan hallinnoijan tiloissa ja koneella. Eniten toivotaan, että mikrodatoja voisi käyttää omalla tietokoneella, jotta niitä voisi analysoida ajasta ja paikasta riippumatta.


DwB-projektilla oli kertoa tutkijoille hyviä uutisia sekä mikrodatan löydettävyydestä että sen saannista. Projektin aikana on kehitetty mikrodatakatalogi CIMES, jonne on kerätty Euroopan maiden mikrodatojen kuvailuja maittain. Toki kuvailujen yksityiskohtaisuudessa on vielä eroja riippuen datan tuottajan organisaatiosta, mutta tutkijan kannalta yksi kuvailujen suhteen heterogeeninen verkkosivu lienee kuitenkin parempi kuin kymmenien eri verkkosivujen tutkiminen erikseen. DwB-projektissa on myös kehitelty tapoja yhdenmukaistaa mikrodatan jatkokäyttöproseduureja eri maiden välillä. Haasteita tähän luovat hyvinkin erilaiset lainsäädännöt eri maiden välillä koskien muun muassa mikrodatan siirtoa toiseen maahan. DwB-projektissa on myös pilotoitu usealla eri tavalla kirjaimellisesti rajat ylittävää datan saantia. Kaikista mieleenpainuvin näistä oli tapahtumassa demonstroitu esimerkki, jossa erilaisten etäkäyttöjärjestelyiden ja sopimusten avustamana mikrodataa voitiin käyttää jopa kansainvälisessä tutkimusryhmässä siten, että tutkijat olivat keskenään eri maissa, käyttivät eri tilasto-ohjelmistoja ja eri maiden datoja, mutta pystyivät silti työskentelemään yhdessä. Uskomattoman hienoa, eikö teistäkin?

Tässä olivat minun näkökulmastani EDAF2-tapahtuman antoisimmat asiat. Toki tapahtumassa käsiteltiin ja esiteltiin paljon muitakin DwB-projektin saavutuksia. EDAF2-tapahtuman materiaalit ovat saatavissa projektin verkkosivuilta. Hauskoja lukuhetkiä!

Lisätietoa:
» Data without Boundaries (DwB)
» EDAF2-esitykset
» Mikrodatakatalogi CIMES

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

26. marraskuuta 2013

Kaksi viestiä

Yliopistojen ulkoinen tiedeviestintä tuntuu muuttuvan etupainotteiseksi elvistelyksi. Liian paljon keskitytään esittelemään aikomuksia ja saadun tutkimusrahoituksen määrää. No - mitä isot edellä, sitä pienet perässä. Tietoarkistokin sai juuri mittavan rahoituksen Suomen Akatemialta toimintojensa vahvistamiseen. Kuinka ollakaan, omakin uutisointimme muisti mainita muhkean rahasumman.

Yksikkömme kaltaiselle tuki-infrastruktuurille ei tarjoudu liian usein mahdollisuuksia kertoa toiminnastaan laajalle yleisölle. Viestintämme on enimmäkseen kansallisen ja kansainvälisen tutkimusyhteisön sisäistä. Sen pääkohteita ovat yliopistot, tutkimusorganisaatiot ja muut tutkimusaineistoja keräävät, teettävät ja käyttävät tahot. Palvelujemme pääkäyttäjäryhmiä ovat tutkijat, opettajat ja opiskelijat.

Ydinviestimme kaikille on palvelujemme maksuton käyttömahdollisuus ja niiden hyödyllisyys tutkimusaineistojen elinkaaren hallinnan ja aktiivisen, avoimen käytön kannalta. Meille voi ja kannattaa arkistoida tutkimusaineistonsa, koska sitä kautta se dokumentoidaan kansainvälisen kuvailukäytännön mukaan. Aineistolle annetaan aineistoviite, tutkimusdata julkaistaan ja siihen voidaan viitata. Julkaistu aineisto on tuottajalleen tieteellinen meriitti. Tutkimuseettisen neuvottelukunnan ja keskeisten tiederahoittajien nykysuosituksen mukaan julkaistujen tutkimusdatojen aineistoviitteet liitetään tutkimuksen harjoittajan ansioluetteloon muiden julkaisujen tavoin.

Tutkimusaineistoihin viittaamista tietoarkisto tukee kääntämällä tarvittaessa aineiston kuvailun englanniksi. Näin aineisto voidaan liittää kansainvälisiin tutkimusaineistotietokantoihin. Kvantitatiivisten tutkimusaineistojen osalta kielenkäännökset kattavat data-aineiston muuttujakuvauksineen.

Tutkimusaineistojen jatkokäyttäjille tarjoamme monipuolisia ja muitakin kuin yhteiskuntatieteitä tukevia palveluja. Aineistosivujen ohella verkkosivujemme keskeisiä sisältöjä ovat Tutkimusaineistojen tiedonhallinnan käsikirja ja Menetelmäopetuksen tietovaranto. Ne ovat laaja-alaisia oppaita tutkimusaineistojen keruuseen ja analyysivaiheen hallintaan sekä tutkimusaineistojen käyttöön. Muistutettakoon, että Suomen Akatemia edellyttää kaikilla tieteenaloilla rahoituksen hakijoilta aineistohallinnan suunnittelua osana tutkimussuunnitelmaa.

Ydinviestin ohella tietoarkistolla on muutosviesti. Piakkoin ilmestyvä, painetun Tietoarkisto-lehden uusi numero valottaa tietoarkistojen eurooppalaisen yhteistyön syvenemistä. Lisäksi se esittelee muita yhteiskuntatieteiden ja humanististen tieteenalojen eurooppalaisia tutkimusinfrastruktuureja, joiden kehittäminen on kuulunut jo tovin tutkimuksen kehittämisen painoaloihin EU:ssa. Kiitos jälleen kerran Helena Laaksoselle lehden kokoamisesta.

Valmistautuminen eurooppalaiseen CESSDA-yhteistyöhön on tarjonnut tietoarkistolle väylän myös kansallisten palvelujen laajentamiseen ja vahvistamiseen. Tämä alkaa näkyä erityisesti vuodesta 2014 alkaen, kun jo käynnissä olleet, Suomen Akatemian rahoittamat kehittämishankkeet tuottavat näkyviä muutoksia palveluihimme.

Ensi vuoden alussa tietoarkiston tallentamien aineistojen tilaus- ja toimitusjärjestelmä muuttuu sähköiseksi, jolloin rekisteröityneet käyttäjät saavat data-aineistot käyttöönsä suoraan verkosta. Yliopisto- ja ammattikorkeakoulukäyttäjät voivat käyttää aineistopalvelujamme oppilaitoksensa käyttäjätunnuksella. Aineistojen tilaus- ja toimitusjärjestelmän uudistus on ollut erittäin mittava työkokonaisuus, josta ovat vastanneet osana Tietoarkisto 2015 -hanketta yksikön kaksi toiminnallista osastoa, aineistopalvelut ja tekniset palvelut. Vastuullisille kuuluu iso kiitos urakasta.

Peruspalvelumme ovat avoimesti ja maksutta käytössänne. Tämä on edelleen ydinviestimme. Muutosviestimme on palveluiltaan vahvistuva ja laajeneva tietoarkisto.

Sami Borg
johtaja
etunimi.sukunimi [at] uta.fi