18. elokuuta 2017

Aineiston avaajan muistilista


Tietoarkiston tieteenala-asiantuntija Katja Fält ja tutkimusamanuenssi Eliisa Haanpää antoivat Jyväskylässä pidetyllä Metodifestivaalilla hyviä käytännönvinkkejä tutkimusaineistojen avaamiseen.

Aineistojen avaaminen tarkoittaa, että oma tutkimusaineisto saatetaan muun tiedeyhteisön käyttöön avoimen tieteen periaatteiden mukaisesti. Tätä vaativat tai suosittelevat nykyisin jo useimmat suomalaiset sekä kansainväliset yliopistot, julkaisijat ja rahoittajat. Aineiston avaaminen on myös tutkijalle itselleen tieteellinen meriitti, ja se lisää oman tutkimuksen vaikuttavuutta.

Aineistojen avaamista käsittelevä sessio herätti Metodifestivaalilla paljon kiinnostusta, mistä voi päätellä, että tutkijat kaipaavat asiassa konkreettisia neuvoja. Kokosimmekin Tietoarkistoblogiin Haanpään ja Fältin esityksiin perustuvan muistilistan, josta toivottavasti on apua aineiston avaamista suunnitteleville tutkijoille myös jatkossa! Vinkeistä on apua sekä siinä vaiheessa, kun aineistonkeruu on vasta suunnitelmissa että silloin, kun aineisto on jo olemassa, ja se on päätetty arkistoida.

Kun oman aineiston arkistoiminen ja avaaminen tulevat ajankohtaisiksi, kannattaa tutustua myös Tietoarkiston Aineistonhallinnan käsikirjaan ja ottaa yhteyttä Tietoarkiston asiakaspalveluun. Asiantuntijoiltamme saat aina parhaat täsmäneuvot juuri oman aineistosi vastuulliseen avaamiseen.

1. Tee aineistonhallintasuunnitelma

Aineistonkeruun suunnitteluun ja aineiston käsittelyyn kannattaa käyttää aikaa, että aineiston avaaminen jatkokäyttöä varten onnistuu tutkimuksen lopuksi. Olennaista on kiinnittää huomiota siihen, että aineisto on alusta asti johdonmukaisesti kerätty, kuvailtu ja toteutettu.

Aineistonhallintasuunnitelmassa kannattaa kertoa ainakin, minkälaista aineistoa aikoo kerätä, mitkä ovat aineistoon liittyvät oikeudet, minkälaisia tietosuoja- tai tietoturvakysymyksiä aineistoa kerätessä, käsitellessä ja säilytettäessä pitää huomioida, minkälaisia tiedostoformaatteja ja ohjelmistoja aineistoon liittyy, miten aineistoa aiotaan käsitellä, miten se kuvaillaan ja millainen aineiston elinkaaresta kokonaisuudessaan ajan myötä muodostuu.

Aineistonhallintasuunnitelman laatimiseen saa hyviä neuvoja Aineistonhallinnan käsikirjasta. Konkreettinen apu on myös aineistonhallintasuunnitelman laatimista varten kehitetty työkalu DMPTuuli.

2. Pohdi onko aineistossasi tunnisteellisia tietoja

Ihmistieteiden tutkimusaineistot sisältävät useimmiten enemmän tai vähemmän tutkittavien henkilötietoja. Tiedot ovat tunnisteellisia, jos niiden perusteella on mahdollista tunnistaa yksittäinen henkilö. Henkilötietolain ja EU:n tietosuoja-asetuksen määritelmien mukaisesti käytännössä mikä tahansa elävää ihmistä koskeva tieto voi olla tunnistamisen mahdollistava henkilötieto. Henkilötietojen käsittely vaatii aina tutkittavien nimenomaisen suostumuksen, ja tunnisteellisen aineiston avaaminen on usein tietosuojasyistä haastavaa.

Jos tunnisteellisen aineiston anonymisoi, siihen ei enää tarvitse soveltaa henkilötietolakia tai tietosuoja-asetusta. Anonymisointi tarkoittaa sitä, että tunnisteelliset tiedot häivytetään aineistosta niin täydellisesti, että yksittäisen henkilön tunnistaminen ei enää ole mahdollista.

Henkilötiedoista ja aineistojen anonymisoinnista voi lukea tarkemmin kvalitatiivista aineistoa ja kvalitatiivista aineistoa koskevista blogikirjoituksista.

3. Varmista onko aineisto tekijänoikeuden alaista

Erityisesti laadullisen aineiston avaaja törmää usein tekijänoikeuteen liittyviin kysymyksiin. Teossuojaa saavan aineiston avaaminen saattaa olla ongelmallista, mutta useimmiten se on kuitenkin mahdollista erikseen sopimalla. Tärkeintä on ymmärtää, että tekijänoikeuden haltija määrää aineiston käyttötavat, joten aineiston jatkokäyttöön on yleensä saatava suostumus tekijänoikeuden haltijalta.

Tietoarkisto on solminut Kopioston kanssa sopimuksen, jonka perusteella teossuojaa saavat sanomalehti-, aikakauslehti- ja kuva-aineistot, eli kaikki Kopiosto-sopimuksen alaiset aineistot voi arkistoida Tietoarkistoon. Näiden aineistojen kohdalla tutkijan ei siis tarvitse enää ryhtyä itse kysymään teossuojaa saavien aineistojen avaamiseen erillisiä lupia.

Esimerkiksi tutkittavien ottamien valokuvien tai heidän kirjoittamiensa teoksiksi tulkittavien tekstien avaamiseen sen sijaan tarvitaan erillinen lupa. Sosiaalisen median aineistojen avaamisessa tekijänoikeudet muodostuvat valitettavasti usein aineiston avaamissuunnitelmat pysäyttäväksi kynnyskysymykseksi, koska Suomen laissa ei ole ainakaan vielä tutkimuskäyttöä mahdollistavaa poikkeussäännöstä.

4. Tallenna aineisto huolellisesti

Kun aineisto on kerätty, tallenna havaintomatriisi, haastattelulitteraatiot tai muu aineisto varmaan paikkaan. Huolehdi myös siitä, että aineistosta tulee otettua säännöllisesti varmuuskopio. Uusi varmuuskopio kannattaa ottaa aina esimerkiksi silloin, jos lisäät aineistoon jotain taustatietoja. Näin varmistat, ettei aineisto katoa kesken analysoinnin tai ennen kuin se on ehditty avata jatkokäyttöön.

5. Nimeä aineiston muuttujat loogisesti

Aineistoa kuvaillessaan kannattaa miettiä, minkä verran aineistosta pitäisi kertoa, jotta itse pystyisi vielä kymmenen vuoden päästä ymmärtämään, mistä aineistossa on kyse ja käyttämään sitä vaivatta uuteen tutkimukseen.

Nimeä kvantitatiivisen aineiston muuttujat ja niiden selitteet niin, että ne vastaavat mahdollisimman yksiselitteisesti kyselylomaketta tai muuta keruuinstrumenttia. Myös muuttuja-arvot ja niiden selitteet kannattaa avata kokonaisuudessaan. Lyhenteiden käyttäminen on riski, koska lyhenteet saattavat sekoittua toisiinsa.

Muuttuja-arvoille tehdyt muutokset kannattaa raportoida mahdollisimman hyvin, niin alkuperäisen muuttujan selvittäminen onnistuu tarvittaessa. Kerro aina myös mahdollisesta painomuuttujien käytöstä ja kuvaile tarkasti painomuuttujiin liittyvät tiedot.

Myös puuttuvien tietojen määritteleminen on tärkeää. Jos siis vastaaja ei ole esimerkiksi vastannut kyselytutkimuksessa johonkin kysymykseen mitään, vastauksen voi koodata selkeästi muista vastausvaihtoehdoista erottuvalla numerolla kuten 999.

6. Kuvaile tutkimuksen toteutustapa riittävän tarkasti

Kuvaile mahdollisimman tarkasti aineistonkeruuseen liittyvät yksityiskohdat, eli milloin keruu on aloitettu, milloin se on lopetettu ja minkälaisia yksityiskohtia aineistonkeruuseen liittyy. Muista kirjata ylös tutkimuksen alkuperäinen käyttötarkoitus, eli se minkä vuoksi aineisto on kerätty, samoin se, ketkä ovat aineiston tekijät. Pidä mahdollisimman tarkkaa listaa myös siitä, minkälaisiin julkaisuihin aineistoa on käytetty, jotta mahdollinen jatkokäyttäjä tietää, minkälaisia julkaisuja aineistosta on jo tehty.

Aineiston perusjoukko eli aineiston kattama populaatio kannattaa määritellä mahdollisimman tarkasti jo aineistonkeruuvaiheessa. Myös havaintoyksikön määritteleminen on olennaista. Huomaa, että perusjoukko ja havaintoyksikkö voivat olla keskenään eri asiat. Jos esimerkiksi havaintoyksikkönä on kunta, ja tutkimuksessa on haluttu selvittää yksittäisten kuntien tai useiden kuntien tilannetta, perusjoukkona aineistossa saattavat olla esimerkiksi kunnanjohtajat, joita on haastateltu, jotta saadaan tietoa havaintoyksiköstä eli kunnasta.

7. Muista, että huolellinen suunnittelutyö palkitaan

Vaikka aineistonkeruun suunnitteleminen, käsittely ja anonymisointi voivat tuntua työläiltä, kannattaa pitää mielessä, että käytetty aika maksaa itsensä takaisin. Aineistonhallinnan suunnittelu ja johdonmukainen käsittely auttavat jo tutkimuksen toteuttamisvaiheessa, ja takaavat sen, että aineiston avaaminen sujuu helposti ilman ylimääräisiä ponnisteluja.

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

3. heinäkuuta 2017

Tietoarkisto haluaa olla jatkossakin DSA-sertifikaatin arvoinen

Tietoarkistolle on tärkeää avata tutkimusaineistot vastuullisesti ja luotettavasti, ja luonnollisesti haluamme kertoa luotettavuudestamme myös muille. Yksi hyvä luotettavuuden mittari on kansainvälinen Data Seal of Approval (DSA) -sertifikaatti. Sen saaminen edellyttää, että organisaatio säilyttää sähköisiä aineistoja luotettavasti ja mahdollistaa aineistojen jatkokäytön. Tällä hetkellä Tietoarkistolla on voimassa vuosille 2014–2017 myönnetty DSA-sertifikaatti. Koska nykyisen sertifikaatin voimassaolo päättyy vuoden vaihteessa, sen päivittäminen on juuri nyt ajankohtaista. Seuraavaksi kerron yleisesti DSA-sertifikaatista ja sen hakemisesta.

Mikä ihmeen DSA-sertifikaatti?

Kansainvälisen sertifikaatin takana ovat ICSU World Data System (WDS) ja Data Seal Of Approval, jotka yhdessä myöntävät Data Seal of Approval (DSA) -sertifikaatteja. Sertifiointi on suunnattu sähköisten aineistojen säilyttäjille, ja sen avulla pyritään osoittamaan kuinka luotettava tietoja säilyttävä organisaatio on. Luotettavuutta arvioidaan sähköisten aineistojen säilyttämisen kaikissa vaiheissa aina aineistojen vastaanottamisesta niiden pitkäaikaissäilyttämiseen sekä edelleen jakamiseen.

Sertifikaatin vaatimukset perustuvat viiteen kriteeriin. Kriteerien mukaan säilytettävien aineistojen tulee olla löydettävissä verkosta, niiden tulee olla saatavilla selkein käyttöehdoin, aineistojen tulee olla tallennettuina jatkokäytön mahdollistavissa tiedostoformaateissa, aineistojen tulee olla luotettavia ja aineistojen tulee olla yksilöitävissä niin, että niihin voidaan viitata yksiselitteisesti ja pysyvästi. DSA-sertifikaatti on myönnetty vuosiksi 2014–2017 Tietoarkiston lisäksi liki 60 toimijalle ympäri maailmaa.

Sertifikaatin hakeminen

Jotta Tietoarkistolle myönnetty sertifikaatti pysyisi voimassa ilman katkoja, työ sertifikaatin uusimiseksi on aloitettu hyvissä ajoin.

Uuden sertifikaatin hakeminen edellyttää, että hakija täyttää edelleen vaaditut organisatoriset lähtökohdat. Lisäksi hakijan on raportoitava tarkasti organisaation nykyisen toiminnan tilanne. Raportointi perustuu 16 kohdan ohjeistukseen, jonka mukaisesti aineistojen luotettava säilyttäminen on todennettava niin käytäntöjen, tekniikan kuin etiikankin näkökulmasta. Sertifikaatin hakijan täytyy voida osoittaa, että sen toiminnan taso vastaa sertifikaatin vaatimaa tasoa.

Kokosin yhdessä kollegoideni kanssa Tietoarkiston toimintaperiaatteista ja -käytänteistä ohjeistuksen mukaisen raportin, jota varten haastattelin arkiston työntekijöitä eri asiantuntemuksen aloilta ja kävin läpi lukuisia asiakirjoja vuosien varrelta. Sen lisäksi, että toiminnan raportointi on sertifikaatin hakemisen edellytys, raportin kokoaminen on ollut hyödyllistä organisaation itsearvioinnin näkökulmasta. Yhteen dokumenttiin on nyt koottu kattava kokonaiskuva Tietoarkiston toiminnasta vahvuuksineen ja kehityskohtineen.

Tavoitteena sertifioinnin uusiminen vuosille 2017–2019

Raportti sertifikaatin hakemiseksi on toimitettu arvioijille ja odotamme Tietoarkistossa parhaillaan tietoa siitä, myönnetäänkö sertifikaatti meille vuosiksi 2017–2019. Sertifioinnin kriteerit ovat muuttuneet hieman aiemmasta, joten emme oletusarvoisesti pysty toteamaan, että sertifikaatti myönnetään sen perusteella, että se on myönnetty aiemminkin.

Visiomme mukaisesti toteutamme kuitenkin edelleen tehtäväämme luotettavana ja tunnettuna avoimen tieteen ja pitkäaikaissaatavuuden asiantuntijana, johon kuuluu oleellisesti toiminta, joka vastaa DSA-sertifioinnin mukaisia kriteerejä sähköisten aineistojen luotettavana pitkäaikaissäilyttäjänä.

Sertifiointi visuaalisesti esitettynä

Tietoarkisto järjesti keväällä työntekijöillensä koulutuspäivän, jonka aikana pääsimme oppimaan luovuudesta ja visuaalisten muistiinpanojen tekemisestä. Kokeilin oppimani perusteella yksinkertaistaa tässä blogitekstissä kirjoittamaani kokonaisuutta visuaalisiksi muistiinpanoiksi. Oleelliseksi osaksi muistiinpanojani olen nostanut ensinnäkin sen, että Tietoarkisto hakee sertifiointia ja toimittaa asianmukaisen sähköisen raportoinnin toiminnastaan sertifioinnista vastaavalle taholle. Toisena pääkohtana muistiinpanoissa on sertifiointimerkinnän saaminen. Jos toimittamamme raportti vakuuttaa arvioijat, Tietoarkiston toiminta saa julkisen ja kansainvälisesti tunnistetun luotettavuuden sinetin.

Sisällön lisäksi visuaalisten muistiinpanojen tekemisessä ovat tärkeitä pienet visuaaliset yksityiskohdat, kuten hahmojen juurruttaminen paikkaan. Tämän vuoksi Aineistonhallinnan käsikirjastakin tuttu Tietoarkiston Hemmo seisoo muistiinpanoissani kesäisissä tunnelmissa varpaat vihreänä kasvavassa nurmessa. Samaa rentoutumismetodia suosittelen kaikille blogitekstiäni kesällä lukeville henkilöille – kokekaa Hemmon tavoin vihreä kesänurmi sitä paljain varpain tunnustelemalla. Tuloksena nurmikon tunnustelusta paljain varpain ei myönnetä sertifikaatteja, mutta ripaus kesätunnelmaa siitä tarttuu varmasti matkaan.

Lisätietoa:
» Data Seal of Approval
» Tietoarkiston nykyinen DSA-sertifikaatti vuosille 2014–2017

Eliisa Haanpää
tutkimusamanuenssi
etunimi.sukunimi [at] uta.fi