1. huhtikuuta 2016

Digitaalinen humanismi ja avoimen datan (haasteellinen) huuma

Digitaalisen humanismin ympärillä pöhisee. Tietojenkäsittelymenetelmiä ja teknologiaa humanistis-yhteiskuntatieteellisessä tutkimuksessa hyödyntävä ala on ujuttautumassa opetukseen sekä tutkimukseen hitaasti mutta varmasti. Helsinki Digital Humanities esimerkiksi organisoi Helsingin yliopistossa digitaalisen humanismin opintokokonaisuutta, tutkijaseminaareja sekä hackathon-tapahtumia. Suomen Akatemian DIGIHUM-teema puolestaan pyrkii rohkaisemaan tutkijoita sekä tutkimushankkeita monitieteiseen yhteistyöhön digitaalisten ihmistieteiden alueella. Lisäksi aiheen ympärille kietoutuvia seminaareja ja konferenssia pullahtelee esiin kuin rusinoita vappusimasta.

Digitaalisen humanismin yhteydessä kysymys erilaisista aineistoista tai datasta näyttäytyy varsinkin tietoarkistotyön silmin kiintoisassa valossa. Digihumanismi on monessa tapauksessa varsin riippuvainen sähköisistä aineistoista. Aineistojen merkittävyys korostuu esimerkiksi Suomen Akatemian DIGIHUM-teemassa, jonka yksi keskeisistä tavoitteista linjaa aineistojen käytettävyyden ja niiden tunnettuuden edistämisen:

"Avoimen datan ja avointen tietokoneohjelmistojen avulla on mahdollista edistää huomattavasti humanististen ja yhteiskuntatieteellisten tutkimustulosten avoimuutta, läpinäkyvyyttä, toistettavuutta ja yhteisöllisyyttä. Avoimen datan ja avoimen lähdekoodin mahdollisuuksien tuominen humanistiseen tutkimukseen on erittäin ajankohtaista uusien, kaikille avointen ja yleisten tutkimusvälineiden tuottamiseksi siten, että ne parhaiten vastaavat tutkimuksesta nouseviin tarpeisiin."

Avoin data näyttäytyy monesti digitaalisen humanismin ydinasiana, mutta avoimuuden ja jakamisen käytänteiden luontevassa omaksumisessa on haasteita. Alan tutkijoiden parissa jatkokäyttö – tai täsmällisemmin jakaminen – määrittyy tyypillisesti joko laajemmin tiedon jakamisen tai rajatummin erilaisten digitaalisten työkalujen jakamisen tärkeytenä. Helppo ja vaivaton pääsy avoimiin digitaalisiin resursseihin mielletään myös tärkeänä yhteistyön lisäämisen muotona. Avoimuus ja open access kiinnostavat tutkijoita, mutta avoimuudella viitataan tyypillisimmin tutkimusjulkaisujen avoimuuteen tai kulttuuriperintölaitosten avoimiin (ja usein digitoituihin) aineistokokoelmiin. Tässä tapauksessa avoimuus mielletään ensisijaisesti yksisuuntaisena käytäntönä, jossa tutkija tarvitsee pääsyn erilaisiin avoimiin aineistoihin voidakseen luoda ja kehittää digitaalisia käytänteitä. Haasteita tehokkaalle jatkokäytölle asettaa paikoin myös se, että digihumanistisessa tutkimuksessa käytetty tai tuotettu data ei yksinkertaisesti ole saatavilla, vaikka sen analysointiin ja esittämiseen olisi kehitetty näyttäviäkin teknisiä työkaluja, tietokantoja tai alustoja. Mikä on avoimuuden politiikan toitottamisen hyöty, jos vaivalla luodut ja analysoidut aineistot eivät ole millään tavalla saatavilla?


Digihumanismin raikkaan merelliset tuulet pyyhkivät yli Oslon, kun kaupungissa järjestettiin maaliskuussa Pohjoismaiden ensimmäinen digitaalisen humanismin konferenssi (Digital Humaniora i Norden).

Myös säilytyspaikkojen tai sopivien infrastruktuurien puute heikentää tulosten ja menetelmien leviämistä. Digitaalisesta aineistosta raskaasti riippuvainen tieteenala on ongelmissa, jos aineistoille ei löydy varmoja säilytyspaikkoja, jotka suojaavat ja hoitavat niitä oikein. Nopeasti kasvava ja alati muuntuva digitaalinen aines vaatii tarkkaa kontekstointia, metadatan lisäämistä ja mahdollista linkittämistä muihin asiaankuuluviin verkkoaineistoihin.

Digitaaliset säilytyspaikat ovat tulevaisuudessa avainasemassa, kun humanistilla aloilla pyritään luomaan toimivia e-infrastruktuureja. Digitaalisen humanismin kannalta olisi siten mielekästä pohtia, mikä tutkimusaineistoja säilyttävien, huoltavien ja jakavien tahojen rooli tulevaisuudessa on, ja kuinka ylipäätään olisi mahdollista luoda toimiva ja mahdollisimman kattava datainfrastruktuuri, joka huomioisi myös digitaalisen humanismin aineistotarpeet.

Lisätietoja
» Suomen Akatemian DIGIHUM-teema (pdf)
» Helsinki Digital Humanities

Katja Fält
tieteenala-asiantuntija
etunimi.sukunimi [at] uta.fi

23. maaliskuuta 2016

EU:n tietosuoja-asetus kaventaa tutkimuksen tietosuojan kansallista liikkumavaraa

Lainsäädäntö vaikuttaa olennaisesti siihen, miten lääke- ja terveystieteiden tutkijat pystyvät käyttämään ja jakamaan tutkimusaineistoja. Juuri nyt lakikysymyksestä tekee erityisen ajankohtaisen EU:n uusi tietosuoja-asetus, joka korvaa Suomessakin henkilötietojen käsittelyn yleislakina toimineen henkilötietolain kahden vuoden siirtymäajan jälkeen.

Tietoarkiston ja ATT-hankkeen järjestämä Lääke- ja terveystieteen tutkimuksen tietosuoja nyt ja tulevaisuudessa -seminaari kokosi Tampereen yliopistolle joukon tietosuojan ja arkaluontoisten aineistojen tutkimisen asiantuntijoita. 17. maaliskuuta pidetty seminaari keräsi paikalle noin neljäkymmentä osallistujaa, ja lisäksi etäyhteyden kautta mukana oli ainakin sata henkilöä.

Biopankkitoiminta tasapainottaa tutkimuksen ja tutkittavien oikeuksia

Tuorein tutkimusta koskeva suomalainen lainsäädännöllinen uudistus on syksystä 2013 asti voimassa ollut biopankkilaki. Biopankkilakia ja biopankkien käytännön toimintaa Suomessa avasi seminaarin aluksi varatuomari Sirpa Soini Helsingin biopankista.

Soini Kehui Suomen olevan biopankkitoiminnassa kansainvälisesti hyvissä asemissa, koska täällä on pystytty ratkaisemaan sellaisia haasteita, joista monessa muussa maassa edelleen keskustellaan. Biopankkilaki vastaa esimerkiksi siihen, miten vanhat aineistot saadaan tutkimuskäyttöön, ja miten uusile aineistoille hankitaan sellainen laaja suostumus, ettei jokaisen hankkeen kohdalla tarvitse erikseen kysyä, suostuuko tutkittava mukaan vai ei.

Soinin mukaan yksi biopankkitoiminnan keskeisistä tavoitteista on ollut tasapainottaa tutkimuksen ja tutkittavien oikeuksia. Toinen keskeinen pyrkimys on ollut saada tieto ja innovaatiot entistä nopeammin ja tehokkaammin potilaiden ja yhteiskunnan hyödyksi. Soini huomautti yhteiskuntaa hyödyttävän tiedon tuottamisen olevan erityisen olennaista nyt, kun biopankkitoiminta pyörii pitkälti verovaroilla. Tulevaisuuden tavoitteena on saada toimintaan enemmän myös yritysrahoitusta.

Biopankkitutkimus perustuu lähtökohtaisesti suostumukseen

Soini korosti, että biopankkitoiminta perustuu lähtökohtaisesti suostumukseen. Käytännössä tutkittava antaa laajan suostumuksen sille, että biopankki voi käsitellä hänen tietojaan ja luovuttaa niitä tutkimukseen erikseen kyselemättä.

Biopankkeihin on pystytty eettisten toimikuntien lausunnon nojalla siirtämään myös vanhoja aineistoja. Tällöin laajan suostumuksen puutetta on paikattu joko henkilökohtaisella tai julkisella tiedonantomenettelyllä. Lain mukaan vanhat tiedot saa siirtää biopankkiin, jos kukaan ei asiaa nimenomaisesti kiellä. Soini kuitenkin korosti, että kansalaisella on vielä massasiirron jälkeenkin oikeus kysyä, onko hänestä tietoja biopankissa ja halutessaan kieltää tietojen käyttäminen.

Soini huomautti, että vaikka vanhoja näytteitä on pystytty siirtämään biopankkeihin, biopankkilain voimaan astumisen jälkeen kerättyä materiaalia voi biopankittaa vain, jos suostumus on hankittu etukäteen. Hän korostikin, että tutkijan kannattaa jo tutkimussuunnitelman tekovaiheessa miettiä, haluaako hän aineistonsa biopankkiin vai ei.

Aarnio uskoo, että tietosuoja-asetus johtaa biopankkilain avaamiseen

Valitettavasti Soinin jälkeen puheenvuorossa ollut tietosuojavaltuutettu Reijo Aarnio ennusti, että hyvältä kuulostava biopankkilaki saattaa mennä vielä uusiksi. Aarnio uskoo vahvasti, että EU:n tietosuoja-asetus vaikuttaa väkisin niin, että Suomen biopankkilaki joudutaan avaamaan.

Aarnion mielestä asetuksen aikakauteen siirtyminen tarkoittaa kiistatta kysymystä siitä, mikä on Suomen biopankkilain kohtalo, ja mikä asetuksen myötä ylipäänsä on tietosuoja-asioissa Suomen kansallinen liikkumavara.

EU:n tietosuoja-asetuksen keskeinen idea on ihmisen itsemääräämisoikeuden vahvistaminen. Aarnion mukaan tämä tarkoittaa sitä, että biopankkitoiminnan kuten kaiken muunkin henkiötietojen käsittelyn täytyy jatkossa perustua vielä entistä varmemmin luottamukseen. Tämä taas edellyttää hänen tulkintansa mukaan automaattisesti korkeaa tietosuojatasoa.

Aarnio totesi odottavansa, milloin ensimmäinen biopankki toimittaa tietosuojavaltuutetun toimistoon tietotilinpäätöksen, joka todistaa, että biopankki noudattaa toiminnassaan lakia. Velvollisuus tietotilinpäätöksen toimittamiseen on hänen mukaansa yksi niistä asetuksen mukanaan tuomista vaatimuksista, joihin ei kansallisella liikkumavaralla voida vaikuttaa.

Kaiken kaikkiaan Aarnio tuntui pitävän EU:n tietosuoja-asetusta kuitenkin biopankkitoiminnan kannalta positiivisena asiana. Hänen mukaansa yksi asetuksen keskeisistä ideoista on nimittäin harmonisoida lainsäädäntö eurooppalaisella tasolla niin, että esimerkiksi biopankit voisivat jatkossa vaihtaa keskenään tietoja yhden lainsäädännön puitteissa.

Kaikki terveyteen liittyvä tieto on terveystietoa

Päivän suurimmat tunteet tuntui herättävän Sarecon informaatio-oikeudellisen asiantuntijan Marjut Salokanteleen esitys siitä, millä eri tavoilla EU:n tietosuoja-asetus käytännössä vaikuttaa terveystietojen tutkimiseen. Salokannel korosti, että terveystietojen tutkimuskäytössä tulee ottaa huomioon se, että niistä on EU:n asetuksessa säädetty hieman tiukemmin kuin henkilötietojen tutkimuskäytöstä ylipäätään.

Terveystiedoksi tulkitaan Salokanteleen mukaan käytännössä kaikki mahdollinen terveyteen liittyvä tieto. Selkeä asetuksen tuoma uudistus on se, että nyt myös geenitiedot ja biologiset näytteet on määritelty erikseen terveystiedoiksi. Suomen näkökulmasta uutta on myös henkilötunnuksen status: jatkossa tunnusta käsitellään automaattisesti terveystietona aina, kun se liittyy terveydellisiin tietoihin.

Salokannel korosti, että myös koodatut tai kryptatut tiedot ovat henkilötietoja riippumatta siitä, missä koodiavain sijaitsee, jos se vain on olemassa jossain päin maailmaa. Näin ollen myös pseudonyymit terveystiedot ovat arkaluontoisia, mikä tarkoittaa, että lähtökohtaisesti niitä ei saa käsitellä.

Anonymisoitu tieto sen sijaan ei ole henkilötietoa eikä näin ollen arkaluontoista. Asetuksen mukaan tiedon voi tulkita anonymisoiduksi silloin, kun sitä ei enää kohtuudella voida palauttaa yksittäiseen henkilöön.

Yleisö haastoikin Salokanteleen kiivaasti perustelemaan, millä perusteilla pseudonyymin tiedon palauttaminen yksittäiseen henkilöön tulkitaan kohtuudella mahdolliseksi silloin, kun koodiavain sijaistee esimerkiksi kassakaapissa toisella puolella maapalloa. Salokannel kuitenkin piti tiukasti kiinni vallitsevasta lain tulkinnasta. Toisaalta hän korosti, että myös arkaluonteisten tietojen tutkiminen on käytännössä mahdollista, ensisijaisesti tutkittavan vapaaehtoisen suostumuksen perusteella.

Asetus määrittelee tieteellisen tutkimuksen laajasti

EU:n tietosuoja-asetus on Salokanteleen mukaan tutkimuksen kannalta positiivinen ainakin siinä mielessä, että tieteellinen tutkimus on asetuksessa määritelty laajasti: määritelmä sisältää sekä teknologisen kehitystyön, perustutkimuksen, soveltavan tutkimuksen että yksityisesti rahoitetun tutkimuksen ja lisäksi kansanterveyden alueella liikkuvat, julkista etua palvelevat selvitykset.

Kliinisissä kokeissa syntyvien aineistojen jatkotutkimuskäyttö vaatii Salokanteleen mukaan uuden asetuksen aikakaudella aina erillisen, alkuperäisen suostumuksen yhteydessä annetun jatkokäyttösuostumuksen. Suostumus vaaditaan myös siihen, jos halutaan yhdistää toisiinsa esimerkiksi rekisteritietoja ja kliinisistä kokeista syntyneitä henkilötietoja.

Vireillä laki SOTE-tietojen toissijaisesta käytöstä

Suomalaisen tutkimuksen kannalta olennainen tulossa oleva uudistus on EU:n asetuksen lisäksi myös valmisteluvaiheessa oleva sosiaali- ja terveydenhuollon asiakas- ja potilastiedon toissijaista käyttöä koskeva lainsäädäntö. THL:n tietovarantopalveluiden kehittämispäällikkö, lainsäädäntötyöryhmän sihteeri Arto Vuori käytti oman puheenvuoronsa näiden suunnitelmien avaamiseen.

Suunnitteilla on useita lääke- ja terveystieteellisen tutkimuksen näkökulmasta positiivisia muutoksia. Selvää hyötyä toisi ainakin potilastiedon arkiston avaaminen tutkimuskäyttöön, käsittelyperusteiden selvempi sääntely sekä toissijaisen käytön kannalta keskeisten luovutussäännösten yhdenmukaistaminen ja yksinkertaistaminen. Viimeksi mainittu uudistus johtaisi ainakin ihannetapauksessa siihen, että aineistojen käyttölupien saaminen ja tietoluovutukset nopeutuisivat ja toimitusvarmuus paranisi.

Vireillä on myös kunnianhimoinen palveluoperaattorimalli, jonka tavoitteena on, että tutkija voisi tulevaisuudessa saada eri rekisteriaineistoja yhdellä aineistopyynnöllä yhden luukun kautta.

Tietosuojalain tulkinta tuntuu tutkijan näkökulmasta kohtuuttomalta

Päivän päättävässä paneelikeskustellussa THL:n tutkimusprofessori Mika Gissler ja Helsingin yliopiston ravitsemustieteen professori Mikael Fogelholm pääsivät vielä keskustelemaan tietosuojakysymyksistä tutkijan näkökulmasta sekä Marjut Salokanteleen että yleisön kanssa.

Gissler harmitteli, että tietosuojalain tulkinta on Suomessa jatkuvasti tiukentunut ja sen seurauksena rekisteritutkimuksen lupaprosessit ovat hankaloituneet. Hän toivoikin, että esimerkiksi Vuoren väläyttämä yhden luukun malli helpottaisi tulevaisuudessa kohtuuttomiksi venyneitä lupaprosesseja.

Gissler oletti, että EU:n tietosuoja-asetus ratkaisee osan rekisteritutkimuksen kansainvälisistä ongelmista, mutta huomautti, että esimerkiksi Yhdysvaltojen ja eurooppalaisen lainsäädännön väliset ongelmat pysyvät myös uuden asetuksen aikana.

Hän myös huomautti, että jos Suomi haluaa säilyttää mahdollisuuden julkaista arvostetuissa tiedelehdissä, on keksittävä keino, joilla myös terveys- ja lääketieteen aineistojen avaaminen on tulevaisuudessa jollain tapaa mahdollista.

Mikael Fogelholmin alustuksessa korostui erityisesti ajatus siitä, että olisi eettistä ottaa tutkittavilta kerätty tieto yhteiskunnassa mahdollisimman laajaan hyötykäyttöön. Hänen näkemyksensä olikin se, että kaikki yritykset estää ihmisiltä kerätyn datan mahdollisimman tehokas käyttäminen on epäeettistä toimintaa.

Lisäksi Fogelholm ilmaisi huolensa siitä, että etenkään pitkissä, monitieteisissä kohorttitutkimuksissa tutkijat eivät voi aineiston keruuvaiheessa tietää tarkasti, mistä kaikista näkökulmista tulevat vuosien saatossa aineistoa tutkimaan, minkä vuoksi tutkittavilta on käytännössä mahdotonta saada etukäteen suostumusta kaikkiin lopullisiin tutkimusaiheisiin. Fogelholm on törmännyt ongelmaan esimerkiksi tehdessään Päijäthäme Ikihyvä -tutkimusta, jossa on yli kymmenen vuoden ajan tutkittu vanhenemista hyvin monitieteisellä otteella.

Salokannel ja yleisössä ollut Tietosuojavaltuutetun toimiston ylitarkastaja Anna Hänninen lohduttivat Fogelholmia toteamalla, ettei suostumuksen tarvitse olla yksityiskohtainen. Riittää, että lopullinen käyttötarkoitus ei ole yhteensopimaton tutkittaville ilmoitetun käyttötarkoituksen kanssa. Salokannel huomautti, että informed consentia voi nykyteknologian avulla myös myöhemmin tarkentaa erilaisten tietokoneohjelmien välityksellä.

Kaiken kaikkiaan päivästä jäi varmuus ainakin siitä, että tietosuojaa koskeva lainsäädäntö tulee tulevaisuudessakin ohjaamaan vahvasti sitä, miten terveys- ja lääketieteen aineistoja voi tutkimuksessa käyttää ja jakaa. Toisaalta vireillä on myös paljon kehitysideoita, joiden ansiosta tulevaisuus voi kaikesta huolimatta olla paljon nykyhetkeä valoisampi.

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi