21. syyskuuta 2020

ISSP 20 vuotta Suomessa - kurkistus aineistonkeruun toteutukseen

Annika Valaranta
International Social Survey Programme eli ISSP-aineistosarjaa on kerätty Suomessa jo vuodesta 2000 lähtien. Nyt syksyllä kerättävän aineiston teema on ympäristö - sama, jolla 20 vuotta sitten aloitimme. Tämän kunniaksi valotamme hieman, mitä kansainvälisen aineiston keruuprosessi vaatii, jotta kerättävä data on harmonisoitavissa eli yhdistettävissä ja ymmärrettävissä muissa maissa kerättävän datan kanssa.

Tietoarkiston kokenut ISSP-aineistojen käsittelijä Seppo Antikainen jäi eläkkeelle keväällä ja tällä kirjoituksella haluamme myös antaa tunnustusta ja kiittää häntä sarjan eteen tehdystä työstä. Kiitos Seppo!

ISSP-aineiston keruu Suomessa

ISSP:n logo
ISSP-konsortio kerää maailmanlaajuisesti yhteiskuntatieteellistä dataa. Suomessa ISSP-työryhmässä ovat vastaavat tutkijat Harri Melin ja Sami Borg sekä Tietoarkiston ja Tilastokeskuksen kääntämisen, aineistonkäsittelyn ja -keruun asiantuntijat. Tietoarkisto luovuttaa Tilastokeskuksen keräämän ISSP-datan harmonisoinnista vastaavalle Saksan Gesis-arkistolle.

ISSP:ssä tutkittavat aiheet vaihtuvat vuosittain, mutta sama teema toistuu keruissa säännöllisesti, mikä mahdollistaa pitkittäisvertailun. Aiheina ovat olleet muun muassa sosiaaliset verkostot, eriarvoisuus, perhe- ja sukupuoliroolit, työ, uskonto, vapaa-aika ja urheilu sekä ympäristö. Kansainvälinen harmonisoitu data on saatavilla Gesisistä, mutta Suomen kyselyt myös Tietoarkistosta.

ISSP-prosessi alkaa uuden lomakkeen kääntämisellä

Keruuprosessi alkaa joka vuosi vuoden vaihteessa, jolloin Saksasta ISSP-tiimi lähettää osallistuville maille kyselylomakkeen kommentoitavaksi. Sen perusteella muotoutuu lopullinen kyselylomake. Kyselyn kysymykset ovat jaettavissa kolmeen ryhmään: taustamuuttujiin, vanhoihin sisältökysymyksiin ja uusiin kysymyksiin. Kun lopullinen englanninkielinen lomake on valmis, Tietoarkisto kääntää uudet kysymykset ja tarkistaa, pitääkö vanhoja kysymyksiä päivittää ja onko taustamuuttujiin tullut muutoksia. Vahva pääsääntö on, ettei jo aiemmin kysyttyjä kysymyksiä muuteta, sillä uusi kysymyksenasettelu voi estää aiheen pitkittäistarkastelun kokonaan. Kuitenkin pieniä viilauksia on tehty: esimerkiksi ennen käytetty teitittely on muutettu nykyään sinutteluksi.

Kuvituskuva: Karttapallo
Uusien kysymysten kääntäminen suomeksi englanninkielisestä pohjalomakkeesta on tarkkaa työtä, sillä kysymysten tulee olla ymmärrettävissä suomalaisessa kontekstissa. Kun lopulta kansainvälinen data yhdistetään Gesisissä, tulee kysymysten mitata samaa asiaa. Esimerkiksi vuoden 2020 kyselyssä kääntäjät kokivat hankalaksi kääntää lauseen: How willing would you be to accept a reduction in the size of [country's] protected nature areas, in order to open them up for economic development? Suomen kielessä ei ole suoraa vastinetta termille "economic development", joka viittaa monenlaiseen eri taloudelliseen kehitykseen (esim. louhinta, kaavoitus, hakkuut). Lopullisen voiton käännöksessä vei kuitenkin yksinkertainen versio "taloudellinen hyödyntäminen" sujuvan luettavuuden vuoksi. Lopullinen kysymys on Kuinka halukas olisit supistamaan Suomen luonnonsuojelualueiden kokoa, jotta niitä voitaisiin ryhtyä hyödyntämään taloudellisesti?

Datojen kanssa pilkunviilaus on sallittua

Kun Tietoarkisto on keväällä saanut kyseisen vuoden kyselyn käännettyä suomeksi, se lähetetään Tilastokeskukseen, joka tekee lopulliset lomakkeet. ISSP-kyselyyn voi vastata niin verkossa kuin paperisella lomakkeella. Tämä tarkoittaa useaa tarkistusta ennen lopullista Tilastokeskuksen syksyllä tekemää keruuta. Ensin tarkistetaan Tilastokeskuksen suomenkielinen ja käännetty ruotsinkielinen lomake. Sitten tarkistetaan molempien kielten internetkyselyt, joiden pitää vastata täysin paperilomakkeita. Myös tutkittavien informoinnit tulee kääntää ja tarkistaa.

Datojen parissa työskentelyssä tarkkuutta ja tarkistamista ei voi ylikorostaa. Tarkistamisessa kiinnitetään huomiota siihen, että lomakkeissa kysytään kaikki pakolliset kysymykset, kysymysten vastausvaihtoehdot ovat samat ja että niiden määrä vastaa alkuperäistä englanninkielistä kyselylomaketta.

Datan valmistuminen jatkokäyttöön

Tilastokeskus lähettää keruun valmistuttua datan Tietoarkistoon prosessoitavaksi aineistoportaali Ailaa varten. Suomenkielinen data on saatavissa Ailasta usein jo maaliskuussa, siis noin puolen vuoden kuluttua keruusta. Tuore kysely pääsee heti tutkijoiden ja opiskelijoiden tarkasteluun.

Lisäksi Tietoarkisto käsittelee datasta kansainvälisen version lähetettäväksi Gesisille. Käsittely varmistaa aineiston yhdistettävyyden muiden maiden datojen kanssa. Yksityiskohtaiset ohjeet käsittelyyn, kuten miten muuttujat ja selitteet nimetään, tulevat Gesisiltä. Kansainvälinen data eroaa Ailasta ladattavasta aineistosta esimerkiksi muuttujien numeroinnissa. Lisäksi datassa ei saa olla yhtään puuttuvaa tietoa, jolla ei ole selitettä. Luovutettavaan dataan lisätään myös useita uusia muuttujia, kuten muiden maiden vastauksien kanssa yhteensopiva uskontokuntamuuttuja.

Gesisille tulee lähettää myös tarkat tiedot aineistonkeruusta ja siitä, miten muuttujat on koodattu. Pienimmätkin muutokset, kuten yksittäisen sanan yksikkömuotojen muutos monikkoon, kirjataan ylös. Tällä kaikella työllä halutaan varmistaa laadukas kansainvälinen aineistosarja, joka kestää tarkastelua vielä vuosikymmenien ja vuosisatojen päästä.

Tyylitelty maailmankartta jossa on pistein merkitty, mitä maat ovat mukana ISSP-tutkimuksessa.

ISSP:n jäseninä on tällä hetkellä 42 maata, joista 25 on Euroopasta. Mukana ovat maailmanpoliittisesti merkittävät suuret valtiot kuten Yhdysvallat, Venäjä, Kiina ja Intia.

Lisätietoa:

» Tietoarkiston ISSP-sivut
» International Social Survey Programme -tutkimusohjelma
» Gesisin ISSP-sivut
» ISSP-aineistot Ailassa

Annika Valaranta
tietopalveluasiantuntija
etunimi.sukunimi [at] tuni.fi

15. kesäkuuta 2020

Tietoarkisto mahdollistamassa kansainvälistä vertailevaa tutkimusta

Suuri osa Tietoarkiston tekemästä työstä on kansainvälistä yhteistyötä, johon kuuluu myös kaksi merkittävää kansainvälistä aineistonkeruuohjelmaa: International Social Survey Programme (ISSP) ja European Values Survey (EVS). Tietoarkisto on mukana näiden kansainvälisten aineistojen keruun rahoittamisessa, suunnittelussa, käännöstyössä sekä suomalaisen datan käsittelyssä kansainvälisen aineiston vaatimusten mukaiseksi. Tietoarkisto myös arkistoi Suomen maakohtaisen aineiston ISSP:n, EVS:n ja World Values Surveyn (WVS) keruista. Saksalainen sisararkistomme GESIS arkistoi aineistosarjojen kansainväliset aineistot.

Kansainvälinen vertailudata suosittua

Kansainväliset vertailuaineistot kuten ISSP ja EVS kuuluvat Tietoarkiston suosituimpiin aineistoihin, ja palveluportaali Ailassa on tiedot lukuisista julkaisuista, joissa aineistoja käytetään. Aiemmin Ailaan on kuitenkin kerätty julkaisutiedot vain kotimaiseen dataan pohjautuvista julkaisuista. Tänä kesänä käymme läpi kansainvälisiä yhdistelmäaineistoja hyödyntäviä julkaisuja, joissa myös Suomen aineistoa on analysoitu, ja lisäämme niiden tietoja Ailan aineistokuvailuihin.

Monissa maissa ylikansalliset vertailututkimusaineistot ovat muodostuneet tärkeäksi ja suosituksi tutkimusresurssiksi. Vertailuaineistojen ja datan globaalin löydettävyyden kasvava tarve näkyy myös esimerkiksi Euroopan yhteisiä avoimen tieteen pilvipalveluita kehittävässä EOSC-hankkeessa.

Suomi esillä kansainvälisessä tutkimuksessa

Vertailututkimusaineistojen kerääminen on kuitenkin työlästä, sillä yhteensovittamisessa pitää ottaa huomioon eri maiden ja kulttuurien erilaiset käytännöt ja kielet. Yhteistyössä suomalaisten yhteiskuntatieteilijöiden ja tutkimusorganisaatioiden kanssa Tietoarkisto on mahdollistanut viimeisen liki kahdenkymmenen vuoden ajan sen, että Suomi on mukana laajoissa ja tunnetuissa kansainvälisissä aineistosarjoissa.

Laajoihin vertailuaineistojen keruihin osallistuminen mahdollistaa sen, että kotimaiset ilmiöt asettuvat oikeisiin suhteisiinsa ja suomalainen yhteiskunta ja kulttuuri paikalleen muiden joukkoon. Maailmanlaajuisesti tunnettuja tutkimusohjelmia kuten ISSP:tä ja EVS:ää pidetään myös luotettavina sekä hyvin dokumentoituina ja suunniteltuina. Kymmeniätuhansia havaintoyksiköitä sisältäviä kansainvälisiä aineistoja käytetäänkin ahkerasti, sillä ne tarjoavat loputtoman määrän tutkimusasetelmia ja tilastollisia lähestymistapoja.

ISSP- ja WVS/EVS-aineistot ovat tärkeitä myös kotimaisessa yhteiskuntatieteellisessä tutkimuksessa, mutta Suomen datan merkitystä kansainvälisessä kontekstissa ei saa unohtaa. Tietoarkisto seuraa esimerkiksi ISSP:n osalta suomalaisten aineistojen latausten määriä Ailasta, mutta nämä määrät ovat pieniä verrattuna siihen, kuinka paljon saksalaisesta GESISistä ladataan kansainvälisiä yhdistelmäaineistoja. GESISiltä saatujen tilastojen mukaan Suomen datan sisältäviä ISSP-yhdistelmäaineistoja on ladattu vuosina 2016-2019 lähes 30 000 kertaa.

Urakkaa riittää

Kansainvälisten vertailuaineistojen avulla tehdään tutkimusta siis huimia määriä, ja kaikkia Suomen dataa hyödyntäviä julkaisuja ei todennäköisesti koskaan ehditä kirjaamaan Ailaan: pelkästään ISSP:n julkaisuluettelo sisältää yli 9 000 julkaisua, joista suuressa osassa Suomen aineistoja on mukana mutta suuressa osassa ei. Julkaisutietojen kerääminen on työlästä, sillä toistaiseksi niiden koneelliseen haravointiin ei ole olemassa välineitä; kirjattavien julkaisujen selvittäminen vaatii monissa tapauksissa siis julkaisun manuaalista läpikäyntiä.

Tähän mennessä olemme keränneet runsaat kaksisataa viitetietoa Suomen aineistoja hyödyntävistä kansainvälisistä julkaisuista, kuten tutkimusartikkeleista ja monografioista. Työ on siis alkutekijöissään, mutta jo tässä vaiheessa on selvää, että Suomi on näkyvästi vertailevan yhteiskuntatutkimuksen maailmankartalla.

Lisätietoa:

» ISSP:n esittely Tietoarkiston sivuilla
» EVS:n/WVS:n esittely Tietoarkiston sivuilla
» International Social Survey Programme -tutkimusohjelman julkaisuluettelo
» European Values Survey -tutkimusohjelman julkaisuluettelo
» GESIS - Leibniz-Institut für Sozialwissenschaften
» Ailan julkaisuhaku

Niko Koski
tietoasiantuntija
etunimi.sukunimi [at] tuni.fi

Tämä blogikirjoitus on luettavissa myös englanniksi:
FSD Enabling Cross-National Comparative Research.