26. syyskuuta 2016

Aineistopalkitun puhe: "HYPA-aineisto antaa eväitä keskusteluun sosiaalisesti kestävästä hyvinvointipolitiikasta."

Tutkija Katri Hannikainen-Ingman vastaanotti Tietoarkiston Aineistopalkinnon THL:n tutkimusprofessori Pasi Moision puolesta Aila ja aineistojen jatkokäyttö -seminaarissa Tampereella 15. syyskuuta. Hannikainen-Ingmanin pitämä palkintopuhe oli niin hieno, että Tietoarkisto pyysi luvan julkaista sen blogissa kokonaisuudessansa.

Arvoisat järjestäjät ja hyvä seminaariväki.

Yhteiskuntatieteellisen tietoarkiston Suomalaisten hyvinvointi ja palvelut eli HYPA-tutkimusaineistolle myöntämä Aineistopalkinto on hieno arvostuksen osoitus. Suuri kiitos siitä!

Olemme Sosiaalipolitiikan tutkimusyksikön päällikön tutkimusprofessori Pasi Moision kanssa HYPA-aineiston arkistonhoitajat ja yhteyshenkilöt Terveyden ja hyvinvoinnin laitoksessa. Pasi Moision panos aineiston suunnittelussa ja kehittämisessä on alusta alkaen ollut merkittävä. Myös suuri joukko muita Stakesin ja sittemmin Terveyden ja hyvinvoinnin laitoksen asiantuntijoita on ollut mukana suunnittelemassa ja kehittämässä aineistoa ja saattamassa sitä arkistoitavaksi ja vapaaseen tutkimuskäyttöön.

Jos Suomalaisten hyvinvointi- ja palvelut -kyselylle ja aineiston avoimeen käyttöön saattamiselle täytyisi nimetä isä, hän olisi edesmennyt Stakesin tutkimusprofessori ja pääjohtaja Matti Heikkilä. Hänellä oli selkeä näkemys siitä, että tutkimusaineistojen tulee olla avoimessa käytössä tutkijoiden saatavilla. Vielä 2000-luvun alussa tämä ei ollut niinkään selvää kuin tänä päivänä toistakymmentä vuotta myöhemmin. HYPA-aineisto oli jo tuolloin tarkoitus arkistoida Yhteiskuntatieteelliseen tietoarkistoon, mutta kesti kuitenkin vuosia ennen kuin tilastolain tulkinta muuttui ja HYPA voitiin arkistoida FSD:hen.

Suomalaisten hyvinvointi ja palvelut -kysely on toteutettu neljä kertaa, ensimmäinen vuonna 2004. Kyselyt on suunnattu aikuisväestölle ja niiden rungon ovat muodostaneet puhelinhaastattelut. Haastattelutietoja on täydennetty rekisteritiedoilla sukupuolesta, iästä, perherakenteesta, koulutuksesta, tuloista sekä aluetiedoista. Puhelinhaastattelujen otos muodostuu 18–79-vuotiaista Suomessa vakituisesti asuvista henkilöistä. 80 vuotta täyttäneiltä tiedot on kerätty käyntihaastatteluin. Viimeisessä vuonna 2013 kerätyssä aineistossa puhelinhaastatteluiden otos oli lähes kuusi tuhatta henkilöä ja vastausprosentti reilut 72. 80 vuotta täyttäneillä otos oli kuusisataa henkilöä ja vastausprosentti hieman yli 62.

Koko aikuisväestölle suunnatun kyselyn rinnalla on toteutettu erillisiä lapsiperheille suunnattuja hyvinvointi ja palvelut -postikyselyitä.

HYPA-kysely nykymuodossaan loppuu, mutta sen elämä jatkuu osana Aikuisten terveys- hyvinvointi- ja palvelututkimusta (ATH).

Hallinto ja poliittiset päättäjät tarvitsevat päätöksenteon tueksi tutkittua tietoa. Hyvinvointipolitiikassa tutkimuksen tehtävä on kriittisen ja samalla uskottavan analyysin esittäminen siitä, mikä on hyvinvoinnin ja pahoinvoinnin tila. Samalla on pyrittävä näyttämään, missä määrin politiikka on johtanut hyvään kehitykseen tai ehkäissyt huonoa.

Suomalaisten hyvinvointi ja palvelut -aineistolla tuotetuilla analyyseillä on piirretty kuvaa väestön hyvinvoinnista, palvelujen käytöstä, elämänlaadusta sekä hyvinvointieroista ja niiden kehityksestä 2000-luvulla. HYPA-kyselyillä on saatu myös arvokasta tietoa suomalaisen hyvinvointivaltion kannatusperustasta. Aineisto antaa näin eväitä yhteiskunnalliseen keskusteluun sosiaalisesti kestävästä hyvinvointipolitiikasta.

HYPA-aineistoilla on tuotettu kirjasarja, jonka viimeisin osa julkaistiin kaksi vuotta sitten. Suomalaisten hyvinvointi 2014 -kirjan 18 artikkelia kertovat toisaalta oikeansuuntaisesta hyvinvointipolitiikasta, sillä väestön hyvinvoinnin ja elämänlaadun todettiin keskimäärin olevan hyvät. Toisaalta kuitenkin hyvinvoinnin eriarvo ja yhteiskunnalliset jaot ovat suomalaista todellisuutta ja niiden on nähty viime vuosina jopa kärjistyneen.

Kun keskustellaan yhteiskunnan kestävästä tulevaisuudesta, on tärkeää kysyä, kuinka suureen sosiaaliseen eriarvoisuuteen meillä on varaa. Viimeisimmän, vuonna 2013, toteutetun HYPA-kyselyn valossa joidenkin väestöryhmien väliset hyvinvoinnin erot ovat selvät, ja eriarvo on kansalaistenkin mielestä liian suuri. Vastaajat kannattivat sen kaltaista kollektiivista solidaarisuutta, jossa huolehditaan koko yhteiskunnan tukipilarien kestävyydestä, mutta pyritään samalla turvaamaan hyvinvointi myös heille, jotka eivät ilman tukea sitä saavuta. Tulevaisuutta rakennettaessa kansalaisten näkemykset ja hyväksyntä poliittisille ratkaisuille on tärkeää.

Lopuksi haluan esittää vielä suuren kiitoksen Yhteiskuntatieteelliselle tietoarkistolle. Yhteistyö on sujunut hienosti ja palvelu on ollut erinomaista. Tietoarkisto on mahdollistanut ja varmistanut HYPA-aineiston avoimen ja helpon tutkimuskäytön nyt ja tulevaisuudessa.

HYPA-aineisto on niin sanotusti päässyt hyvään kotiin! Kiitos!

Lisätietoja
» Aila-seminaarin ohjelma, esitykset ja videot

Katri Hannikainen-Ingman
Terveyden ja hyvinvoiniin laitoksen Sosiaalipolitiikan tutkimusyksikön tutkija

20. syyskuuta 2016

Some-aineistojen tutkiminen kariutuu usein tekijänoikeuksiin ja käyttöehtoihin

Sosiaalisen median aineistojen tutkiminen on ajankohtaista sekä humanistisilla aloilla että yhteiskuntatieteissä, mutta se miten uudentyyppisiä aineistoja saa tutkia, on monelle epäselvää.

Tietoarkiston, ATT-hankkeen ja Kielipankin järjestämässä Rajoittaako lainsäädäntö humanistista tutkimusta -seminaarissa some-tutkimuksen haasteisiin saatiin sekä lakiasiantuntijan että tutkijan näkökulmat.

Informaatio-oikeuden asiantuntija Marjut Salokannel (SaReCo) kertoi some-aineistojen käyttöön liittyvistä rajoituksista sopimusoikeudellisista, tekijänoikeudellisista ja tietosuojaan liittyvistä näkökulmista. Tohtoriopiskelija Salla-Maaria Laaksosen esitys taas oli käytännön esimerkki siitä, minkälaisia ongelmia some-tutkija joutuu työssänsä ratkaisemaan.

Vain osa palveluista sallii tutkimuskäytön

Salokannel totesi, että eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin.

Twitterin käyttöehdot sallivat aineiston tutkimuskäytön, kunhan se tapahtuu palvelun määrittämällä tavalla. Twitter tarjoaa tutkijoiden käyttöön esimerkiksi rajapinnan, jonka välityksellä aineiston kerääminen on sallittua.

Facebookin käyttöehdot puolestaan mahdollistavat aineiston ei-kaupallisen käytön, jolloin myös ei-kaupallisen tutkimuskäytön voi Salokanteleen mukaan tulkita sallituksi.

Aller Median omistaman Suomi24:n ehdoissa myönnetään lupa vain aineiston yksityiseen käyttöön, jolloin ammattimainen tutkimuskäyttö on tulkittava kielletyksi. Käytännössä Suomi24:n aineistojen tutkiminen on kuitenkin mahdollista, sillä Aller Media ja Kielipankki ovat tehneet sopimuksen, jonka nojalla Suomi24-aineistot voi ladata tutkimuskäyttöön laillisesti Kielipankin kautta.

Myös Instagramin käyttöehdot ovat tiukat, eikä siellä julkaistuja kuvia voi Salokanteleen tulkinnan mukaan käyttää tutkimukseen ainakaan millään automatisoidulla tavalla.


Marjut Salokannel toteaa, että sosiaalisen median eri palvelut suhtautuvat tutkimukseen hyvin eri tavoin. (Kuva: Laura Chieri).

Suurimmat ongelmat liittyvät tekijänoikeuksiin

Tutkimuksen kannalta suurimmat ongelmat liittyvät Salokanteleen mukaan some-aineistojen tekijänoikeuksiin. Teossuojattujen sisältöjen kopioiminen ja yleisön saataville saattaminen vaativat oikeudenhaltijan luvan aina, jos tekijänoikeuslaissa ei ole oikeuttavaa poikkeussäännöstä. Suomessa sosiaalisen median sisältöjen tutkimisen suurin ongelma onkin Salokanteleen mukaan se, että Suomen laissa ei ole niin sanottua tutkimuspoikkeussäännöstä.

Useimpien teoskynnyksen ylittävien aineistojen tutkiminen ja opetuskäyttö on ollut Suomessa mahdollista Kopioston ja yliopistojen välillä solmitun erillissopimuksen ansiosta. Sopimus ei kuitenkaan kata mitään sosiaalisen median julkaisuja.

Pientä helpotusta tuo se, että tekijänoikeudet ovat voimassa vain silloin, kun julkaisu ylittää teoskynnyksen. Käytännössä kynnys on kuitenkin hyvin matala. Tohtoriopiskelija Salla-Maaria Laaksonen totesi tuntevansa tapauksen, jossa 140 merkin twiitti oli tulkittu teokseksi. Salokannel puolestaan viittasi Luxembourgin tuomioistuimessa käsiteltyyn tapaukseen, jossa teokseksi oli tulkittu 11 sanaa. Esimerkiksi Instagram-kuvat ylittävät teoskynnyksen Salokanteleen mukaan käytännössä aina, samoin vähääkään omaperäisemmät kirjoitukset.


Panelistit Salla-Maaria Laaksonen (oik.), Ulla-Maija Peltonen, Anna Hänninen ja Marjut Salokannel (vas.) keskustelivat seminaarissa siitä, rajoittaako lainsäädäntö humanistista tutkimusta. (Kuva: Laura Chieri).

Salokannel totesi ongelman olevan nimenomaan Suomen laissa. Esimerkiksi Yhdysvalloissa kysymys on ratkaistu fair use -säännöksellä, jonka nojalla tekijänoikeuksien suojaamaa aineistoa voi käyttää tieteelliseen tutkimukseen ilman oikeudenhaltijoiden lupaa.

Salokannel totesikin, että myös Suomen lakiin täytyisi saada oikeuttamisperiaate, jonka nojalla sosiaalisen median aineiston tieteellinen tutkiminen olisi tekijänoikeuksista huolimatta yksiselitteisesti mahdollista. Hänen mukaansa tutkimuksen oikeuttavan säännöksen puuttuminen vaikeuttaa suomalaisen tutkimuksen kilpailua maailmalla ratkaisevasti.

Tietosuoja-asetus ei estä some-datan tutkimista

Tietosuojan puitteissa sosiaalisen median aineistojen tutkiminen on Salokanteleen mukaan useimmissa tapauksissa mahdollista. EU:n uusi tietosuoja-asetus hyväksyttiin toukokuussa, ja sitä aletaan soveltaa suoraan suomalaiseen lainsäädäntöön keväällä 2018.

Uusi asetus mahdollistaa henkilötietoja sisältävän aineiston tutkimuskäytön jopa ilman rekisteröidyn lupaa, kunhan tarvittavista suojatoimista on huolehdittu. Suojatoimet ovat tarpeen aina, kun aineistossa on tietoja, joista yksittäiset henkilöt voidaan tunnistaa joko suoraan tai välillisesti.

Tietosuoja-asetuksen mukaan henkilötietoja sisältävä materiaali tulisi anonymisoida täysin aina, kun se on tutkimuksen tekemisen kannalta mahdollista. Silloin, kun anonymisointi ei tule kysymykseen, yksi mahdollinen suojatoimi voi olla esimerkiksi aineiston pseudonymisointi.

Varteenotettavana suojatoimena Salokannel nosti esille myös lakisääteisen eettisen arvioinnin, jota esimerkiksi Ruotsissa edellytetään aina, kun tutkimuksessa käsitellään arkaluonteista tietoa. Etenkin uuden tietosuoja-asetuksen ajalla, digitaalisessa toimintaympäristössä samanlainen lakisääteinen arviointi olisi hänen mukaansa paikallaan myös Suomessa.

Salokannel kuitenkin korosti, että lakisääteisen eettisen arvioinnin rahoituksen täytyisi tulla valtion budjetista, eli malli ei voisi perustua vapaaehtoisuuteen tai esimerkiksi tutkijoiden niskoille kaatuvaan ylimääräiseen työhön.

Verkkotutkija liikkuu jatkuvasti kaltevalla pinnalla

Some-aineistoja tutkinut tohtoriopiskelija Salla-Maaria Laaksonen totesi omassa puheenvuorossaan, että verkkotutkimusta sääntelevän lainsäädännön sisäistämistä vaikeuttaa kaiken muun ohessa se, että sosiaalisen median palvelut muuttuvat ja kehittyvät koko ajan. Esimerkiksi teknologisten ratkaisujen muutokset vaikuttavat hänen havaintojensa mukaan suoraan siihen, miten ihmiset palveluissa käyttäytyvät. Myös palveluiden käyttöehdot ja rajapinnat muuttuvat tasaiseen tahtiin.


Laaksonen näkee, että sometutkimuksessa data on käytännössä pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. (Kuva: Laura Chieri).

Salokanteleen esitystä Laaksonen kommentoi toteamalla, että käytännön tutkimustyössä data on usein pystyttävä keräämään ilman jokaisen käyttäjän erillistä lupaa. Esimerkiksi hän itse on ollut mukana tutkimassa sosiaalisesta mediasta kerättyä 1,5 miljoonan eduskuntavaaleja käsittelevän viestin aineistoa, jonka kohdalla erillisten lupien pyytäminen olisi ollut täysin utopistista.

Useimmat some-dataa keräävät tutkijat luottavat Laaksosen mukaan joko siihen, että sosiaalisen median palveluissa julkaistu data on julkista tai siihen, että palvelun käyttöehdot mahdollistavat tutkimuskäytön, jolloin myös kaikki käyttäjät ovat periaatteessa suostuneet siihen.

Heti perään hän kuitenkin myönsi, että todellisuudessa harva käyttäjä on kunnolla perehtynyt palveluiden käyttöehtoihin, jolloin ei myöskään voida olettaa, että he tietäisivät mahdollisesta tutkimuskäytöstä. Laaksonen totesikin, että digitutkija joutuu tällä hetkellä liikkumaan sosiaalisessa mediassa jatkuvasti liukkaalla pinnalla.

Lisätietoja
» Seminaarin ohjelma ja esitykset
» Katja Fält, Tietoarkistolehti 2/2016: Someaineistojen arkistointi ja jatkokäyttö kaatuvat useimpien alustojen käyttöehtoihin

Kaisa Järvelä
tiedottaja
etunimi.sukunimi [at] uta.fi

15. syyskuuta 2016

Data Service Portal Aila: accessibility and practicality for non-Finnish speakers

The Finnish Social Science Data Archive (FSD) is one of the most important national resources for the collection and storing of social research data. Among the many services they offer, they aim to make research data available to everyone, free of charge. In order to be able to make data accessible not only to Finnish people, but also to international researchers or students involved in research projects, they provide datasets translated into English.

Their Data Service Portal is called Aila and is easily accessible for international users from the FSD English Website. It contains a list of more than 1,200 datasets, many of which are available in English that can be conveniently searched through by using the feature "Search". This allows users to find data suitable for their project easily, a process that would otherwise be extremely time-consuming and which could also be inconclusive. Access conditions apply to most datasets, some of which are only available for research purposes and others only for research, teaching and study purposes. A small percentage can only be used upon permission from the depositor or creator of the data.

As a placement student at the FSD, who is not familiar with the content of their digital archive, I was asked to assess how easy it is to find and access data in English through Aila. For this purpose, I first started by researching a specific dataset. By using "Data Search" finding the dataset was quick and simple. The results included not only the specific year of the survey I was looking for, but also all of the previous waves. This is useful when one is interested in carrying out a study that compares data over time.

Although the process seems to be very straight forward, one needs to be careful before downloading a dataset, as not all of them contain data that has been translated into English. In fact, the portal Aila includes study descriptions in English for all of the studies in the archive, but this does not imply that all of the data has been translated. To make sure that the data is in English one should double-click on the dataset to open the description page and check on the yellow box on the right-side that it contains related files in English (e.g. the codebook).

Still, even if related files are not currently available in English, users can request for the dataset to be translated, a service offered by the FSD free of charge. This is almost exclusively done for quantitative studies, as the amount of text contained in qualitative studies would require a much more demanding process. Only less than 15% of the datasets are qualitative, however. This means that a translation can be requested for the vast majority of the data.

Many users may also have a specific topic to research, but may still not know the specific name of a dataset available for them to use. With this idea in mind, and focusing on specific terminology from the final project for university that I am currently working on, I used the "Variable Search" tool. As the topic I was searching for was quite niche, I was very surprised to find out that Aila contains some feasible data. This clearly indicates that the archive is truly rich in content. "Variable Search" highlights the exact variables that contain the terms searched for, within all of the datasets available in the archive. This is a quick way to find datasets that have already been translated into English.

In conclusion, the Data Service Portal Aila is an extremely useful tool not only for Finnish people, but also for those looking for data in English. It is accessible to everyone, easy to use and does not require extremely complicated procedures to obtain data. Perhaps requesting the translation of a specific dataset would involve a longer process, however it is certainly undeniable that the FSD succeeds in its aim to make research data available and accessible to everyone.

Laura Chieri
Q-Step Student