27. maaliskuuta 2025

Japanilaiset hakivat Tietoarkistolta oppia laadullisten aineistojen arkistointiin

Tietoarkisto sai maaliskuun alussa kunnian toivottaa tervetulleiksi japanilaiset kollegansa, kun Japanin yhteiskuntatieteellisestä tietoarkistosta (Social Science Japan Data Archive, SSJDA) saapui vieraita Tampereelle. Päivän kestäneen vierailun aikana Nobutada Yokouchin johtama kolmen henkilön delegaatio tutustui Tietoarkiston laadullisten aineistojen arkistointikäytäntöihin.

Kuten Suomessa, myös Japanissa laadullisten aineistojen käyttö osana yhteiskuntatieteellistä tutkimusta on hyvin yleistä. Tähän asti vain kvantitatiivisia aineistoja arkistoinut SSJDA kokeekin tarpeelliseksi laajentaa arkistointipalvelunsa kattamaan myös laadulliset aineistot. Nobutada Yokouchin mielestä Tietoarkisto oli oikea paikka hakea mallia ja tietoa laadullisten aineistojen arkistointiin. Ei vähiten sen vuoksi, että useilla mittapuilla tarkasteltuna Tietoarkisto Suomessa on yksi kokeneimmista ja edistyksellisimmistä laadullisten aineistojen arkistoinnin asiantuntijoista koko Euroopassa.

Tapaamisen aluksi Tietoarkiston palvelupäällikkö Tuomas J. Alaterä esitteli vieraille Tietoarkiston historiaa, toiminnan perusperiaatteita ja tilastoja. Tämän jälkeen Tietoarkiston laadullisten aineistojen arkistoinnin asiantuntijatiimi vastasi yksityiskohtaisesti SSJDA:n ennalta lähettämiin kysymyksiin. Tietosuoja-, tutkimuseettisiin ja aineistojen käyttöoikeuksia koskeviin kysymyksiin vastasi Tietoarkiston johtava tietosuoja-asiantuntija Arja Kuula-Luumi.

Päivän päätteeksi tietoasiantuntijat Joel Kallio ja Sanni Tujunen esittelivät Tietoarkiston kehittämää laadullisten aineistojen käsittelytyökalu Kvalikristua, joka nopeuttaa laadullisten aineistojen käsittelyä. Työkalun avulla aineistotiedostoihin voidaan tehdä helposti esimerkiksi erilaisia massamuutoksia, sekä luoda aineistolle käytettävyyttä lisäävä html-hakemisto. Kvalikirstun ohella japanilaisvieraita kiinnosti myös Tietoarkiston luoma ja ylläpitämä Penna-kirjoitusaineistojen keruutyökalu, joka palvelee paitsi Tietoarkiston aineistoja kerääviä asiakkaita, myös virtaviivaistaa kirjoitusaineistojen käsittelyä arkistointivaiheessa.

Toiminnoissa paljon yhteneväisyyksiä

Vaikka tapaamisessa keskityttiin Tietoarkiston laadullisten aineistojen arkistointia koskevien käytäntöjen läpikäymiseen, esitteli myös SSJDA vierailun aikana omaa toimintaansa. Päivän aikana havaittiin, että Tietoarkistolla ja Japanin SSJDA:lla on monia yhtäläisyyksiä. Aineistojen arkistointiin liittyvät haasteet ovat hyvin samankaltaisia maasta tai maanosasta riippumatta. Molemmat arkistot osoittautuivat myös suurin piirtein saman ikäisiksi, ja aineistovarannot lähestulkoon samankokoisiksi. Lisäksi molempien arkistojen arkistointikäytännöt ovat monelta osin hyvin yhdenmukaisia. Lukuisista yhtäläisyyksistä huolimatta arkistojen toimintatavoissa ja palvelutarjonnassa huomattiin myös eroja. SSJDA esimerkiksi tarjoaa tutkijoille analyysipalveluja, toisin kuin Tietoarkisto. Tietoarkisto puolestaan tarjoaa kvantitatiivisten aineistojen kuvailujen yhteydessä kattavat muuttujakuvailut, jotka toistaiseksi puuttuvat kokonaan SSJDA:n aineistoista.

Tietoarkistossa vierailleeseen ryhmään kuului Nobu Yokouchin (2. oik.) lisäksi Kenji Ishida ja Sae Taniguchi. Tietoarkistosta osallistuivat Tuomas J. Alaterä, Jarkko Päivärinta, Arja Kuula-Luumi, Sanni Tujunen ja Joel Kallio.

Nobutada Yokouchi esitteli tietoarkistolaisille mm. SSJDA:n aineistokatalogia (JDCat) sekä tapaa, jolla SSJDA hyödyntää tekoälyä aineistokuvailujen laadinnassa. Yokouchin mukaan tekoäly näyttää pystyvän tuottamaan jo lähes yhtä hyviä aineistokuvailuja manuaalisesti tehtyjen kanssa. Tekoälyn hyödyntämismahdollisuudet aineistonkäsittelyn eri vaiheissa kiinnostavat myös Tietoarkistoa. Tietoarkistolla on juuri käynnistynyt Suomen Akatemian rahoittama AIMS-hanke, jossa muun muassa selvitetään tekoälyn hyödyntämisen mahdollisuuksia arkistotyössä. Kokemustenvaihto Japanin ja Suomen tietoarkistojen välillä tekoälyn tarjoamista mahdollisuuksista ei siis varmastikaan rajoitu vain tähän vierailuun.

Kaiken kaikkiaan vierailu oli molemmille osapuolille opettava. Oli kiinnostavaa huomata, että vaikka moni asia tehdään osittain samalla tavalla, on käytäntöjen välillä myös eroja. Uskoaksemme pystyimme tarjoamaan laadullisten aineistojen arkistointiin laajentavalle SSJDA:lle paljon arvokasta tietoa laadullisten aineistojen arkistoinnista. Jäämme mielenkiinnolla odottamaan, että SSJDA saa käynnistettyä laadullisten aineistojen arkistoinnin ja toivomme SSJDA:lle menestystä tässä työssä.

Yhteistyö arkistojen välillä jatkuu varmasti myös tulevaisuudessa. Seuraava yhteinen tilaisuus on jo tiedossa, sillä molemmat arkistot osallistuvat kesällä kansainväliseen IASSIST-konferenssiin, joka kokoaa vuosittain tutkimusaineistojen arkistoinnin asiantuntijat eri puolilta maailmaa yhteen. Tänä vuonna IASSIST järjestetään kesäkuun alussa Bristolissa Englannissa.

Lisätietoa:
» SSJDA
» JDCat
» Kvalikirstu
» Penna
» AIMS-hanke

Jarkko Päivärinta
erityisasiantuntija, kvalitatiivisten aineistojen arkistointi
etunimi.sukunimi [at] tuni.fi

14. helmikuuta 2025

Rakasta dataa! Love Data Week muistutti, että datasta pitää pitää huolta

piirroshahmo, jolla käsissään sydän, jossa teksti Data.
Olemme taas viettäneet dataintoilijoiden kansainvälistä teemaviikkoa. Love Data Week 2025 kysyi ja hieman vastasikin sangen yleiseen ongelmaan "Whose data is it anyway", eli kenen dataa se nyt oikein on? Tietoarkistossa puhumme mielellämme omista datoistamme ja ehkä tekin puhutte Tietoarkiston datoista. Datat eivät kuitenkaan ole meidän, koska sopimusten mukaisesti huolehdimme datoista tekijöiden ja omistajien puolesta.

Metadata sen sijaan on Tietoarkiston tuottamaa, "meidän dataamme" siis. Se on avoimesti saatavilla Creative Commons Nimeä 4.0 Kansainvälinen -lisenssin mukaisesti.

Love Data Weekin järjestää ICPSR. Tapahtumista ja viikon aikana jaetuista tietolähteistä voit lukea lisää tapahtumasivuilta. Tietoarkisto osallistui viikon teemaan sosiaalisen median nostoilla, joissa toimme esiin palveluita ja tietolähteitä, joiden kautta Tietoarkisto ohjeistaa datan omistamisesta tai tekijyydestä sopimiseen. Tähän blogiin on koottu kaikki nämä nostot.

Sopiminen, kun tutkijoita on useita

Jos tutkimushankkeessa on useita tutkijoita, kannattaa hoitaa oikeuksista sopiminen ajoissa, jotta ei tarvitsisi miettiä jälkikäteen, "kenen dataa se nyt oikein on?" Ohjeita saat muun muassa Tietoarkiston Aineistonhallinnan käsikirjan luvusta Sopimukset ja oikeudet.

Tekijä ei ole aina henkilö

Koronapandemian aikana kerätyt tutkimusdatat ovat ajankohtaisia myös nyt. Pandemia osoitti, että yhteiskunnan kriisitilanteissa ilmiötä käsittelevät tutkimusaineistot pitää saada käyttöön joustavasti ja avoimesti. Tutkimusaineistolla ei aina myöskään ole henkilötekijää, vaan se voi olla myös organisaation tuottama. Näistä esimerkkinä on tammikuussa 2025 julkaistu gerontologisen sosiaalityön ja diakoniatyön asiakkaiden sekä ikääntyvien parissa työskentelevien haastatteluaineisto.

Aineistoviite: Helsingin yliopisto & Itä-Suomen yliopisto & Lapin yliopisto: Gerontologisen sosiaalityön ja diakoniatyön asiakkaiden sekä ikääntyvien parissa työskentelevien haastatteluja 2021 [data]. Dataversio 1.0 (2024-09-12). Yhteiskuntatieteellinen tietoarkisto [jakaja]. DOI: https://doi.org/10.60686/t-fsd3862; URN: https://urn.fi/urn:nbn:fi:fsd:T-FSD3862

Aineisto voi jäädä orvoksi

Kenelle kuuluu orpo aineisto? Arja Kuula-Luumi kirjoitti orvoista aineistoista blogin jo yli kymmenen vuotta sitten.

Tuolloin Tietoarkistossa uudistettiin ja yksinkertaistettiin arkistointisopimuksia. Nykyiseen verrattuna Tietoarkistossa oli tuolloin runsaasti dataa, jonka käyttöön piti pyytää alkuperäisen tutkijan tai luovuttajan lupa. Halusimme vähentää näin rajoitettua käyttöä ja lisäksi muuttaa luvanvaraisuuden määräaikaiseksi. Määräaikaisuutta voi karuimmillaan perustella sillä, että aineistosta tulee orpo, kun luvanantaja kuolee eikä vaihtoehtoista toimintatapaa ole määritelty. Aineisto voi kuitenkin jäädä orvoksi myös silloin, kun luvanantaja jostain muusta syystä ole enää tavoitettavissa.

Arkistointiohjeissa kerromme datojen käyttöoikeusluokista.

Kenen data?

Joskus tutkittaville syntyy tekijänoikeuksia tutkimusta varten kerättyyn aineistoon. Näin voi tapahtua, jos tutkittavat esimerkiksi piirtävät tai valokuvaavat tai tuottavat tekstiä, josta tutkija muodostaa aineistonsa. Lue Tietoarkiston Aineistonhallinnan käsikirjasta, mitä sinun pitää ottaa huomioon näin kerättyä aineistoa hyödyntäessäsi ja millaiset sopimukset ovat tarpeen.

Tietoarkisto vaalii huomassaan olevaa dataa jokaisena päivänä – ole yhteydessä asiakaspalveluumme tai täytä arkistointiehdotuslomake, kun datasi kaipaa rakkautta!

suorakaide, jossa teksti Love Data Week.

Helena Laaksonen
johtaja

Tuomas J. Alaterä
palvelupäällikkö

etunimi.sukunimi [at] tuni.fi