21. syyskuuta 2020

ISSP 20 vuotta Suomessa - kurkistus aineistonkeruun toteutukseen

Annika Valaranta
International Social Survey Programme eli ISSP-aineistosarjaa on kerätty Suomessa jo vuodesta 2000 lähtien. Nyt syksyllä kerättävän aineiston teema on ympäristö - sama, jolla 20 vuotta sitten aloitimme. Tämän kunniaksi valotamme hieman, mitä kansainvälisen aineiston keruuprosessi vaatii, jotta kerättävä data on harmonisoitavissa eli yhdistettävissä ja ymmärrettävissä muissa maissa kerättävän datan kanssa.

Tietoarkiston kokenut ISSP-aineistojen käsittelijä Seppo Antikainen jäi eläkkeelle keväällä ja tällä kirjoituksella haluamme myös antaa tunnustusta ja kiittää häntä sarjan eteen tehdystä työstä. Kiitos Seppo!

ISSP-aineiston keruu Suomessa

ISSP:n logo
ISSP-konsortio kerää maailmanlaajuisesti yhteiskuntatieteellistä dataa. Suomessa ISSP-työryhmässä ovat vastaavat tutkijat Harri Melin ja Sami Borg sekä Tietoarkiston ja Tilastokeskuksen kääntämisen, aineistonkäsittelyn ja -keruun asiantuntijat. Tietoarkisto luovuttaa Tilastokeskuksen keräämän ISSP-datan harmonisoinnista vastaavalle Saksan Gesis-arkistolle.

ISSP:ssä tutkittavat aiheet vaihtuvat vuosittain, mutta sama teema toistuu keruissa säännöllisesti, mikä mahdollistaa pitkittäisvertailun. Aiheina ovat olleet muun muassa sosiaaliset verkostot, eriarvoisuus, perhe- ja sukupuoliroolit, työ, uskonto, vapaa-aika ja urheilu sekä ympäristö. Kansainvälinen harmonisoitu data on saatavilla Gesisistä, mutta Suomen kyselyt myös Tietoarkistosta.

ISSP-prosessi alkaa uuden lomakkeen kääntämisellä

Keruuprosessi alkaa joka vuosi vuoden vaihteessa, jolloin Saksasta ISSP-tiimi lähettää osallistuville maille kyselylomakkeen kommentoitavaksi. Sen perusteella muotoutuu lopullinen kyselylomake. Kyselyn kysymykset ovat jaettavissa kolmeen ryhmään: taustamuuttujiin, vanhoihin sisältökysymyksiin ja uusiin kysymyksiin. Kun lopullinen englanninkielinen lomake on valmis, Tietoarkisto kääntää uudet kysymykset ja tarkistaa, pitääkö vanhoja kysymyksiä päivittää ja onko taustamuuttujiin tullut muutoksia. Vahva pääsääntö on, ettei jo aiemmin kysyttyjä kysymyksiä muuteta, sillä uusi kysymyksenasettelu voi estää aiheen pitkittäistarkastelun kokonaan. Kuitenkin pieniä viilauksia on tehty: esimerkiksi ennen käytetty teitittely on muutettu nykyään sinutteluksi.

Kuvituskuva: Karttapallo
Uusien kysymysten kääntäminen suomeksi englanninkielisestä pohjalomakkeesta on tarkkaa työtä, sillä kysymysten tulee olla ymmärrettävissä suomalaisessa kontekstissa. Kun lopulta kansainvälinen data yhdistetään Gesisissä, tulee kysymysten mitata samaa asiaa. Esimerkiksi vuoden 2020 kyselyssä kääntäjät kokivat hankalaksi kääntää lauseen: How willing would you be to accept a reduction in the size of [country's] protected nature areas, in order to open them up for economic development? Suomen kielessä ei ole suoraa vastinetta termille "economic development", joka viittaa monenlaiseen eri taloudelliseen kehitykseen (esim. louhinta, kaavoitus, hakkuut). Lopullisen voiton käännöksessä vei kuitenkin yksinkertainen versio "taloudellinen hyödyntäminen" sujuvan luettavuuden vuoksi. Lopullinen kysymys on Kuinka halukas olisit supistamaan Suomen luonnonsuojelualueiden kokoa, jotta niitä voitaisiin ryhtyä hyödyntämään taloudellisesti?

Datojen kanssa pilkunviilaus on sallittua

Kun Tietoarkisto on keväällä saanut kyseisen vuoden kyselyn käännettyä suomeksi, se lähetetään Tilastokeskukseen, joka tekee lopulliset lomakkeet. ISSP-kyselyyn voi vastata niin verkossa kuin paperisella lomakkeella. Tämä tarkoittaa useaa tarkistusta ennen lopullista Tilastokeskuksen syksyllä tekemää keruuta. Ensin tarkistetaan Tilastokeskuksen suomenkielinen ja käännetty ruotsinkielinen lomake. Sitten tarkistetaan molempien kielten internetkyselyt, joiden pitää vastata täysin paperilomakkeita. Myös tutkittavien informoinnit tulee kääntää ja tarkistaa.

Datojen parissa työskentelyssä tarkkuutta ja tarkistamista ei voi ylikorostaa. Tarkistamisessa kiinnitetään huomiota siihen, että lomakkeissa kysytään kaikki pakolliset kysymykset, kysymysten vastausvaihtoehdot ovat samat ja että niiden määrä vastaa alkuperäistä englanninkielistä kyselylomaketta.

Datan valmistuminen jatkokäyttöön

Tilastokeskus lähettää keruun valmistuttua datan Tietoarkistoon prosessoitavaksi aineistoportaali Ailaa varten. Suomenkielinen data on saatavissa Ailasta usein jo maaliskuussa, siis noin puolen vuoden kuluttua keruusta. Tuore kysely pääsee heti tutkijoiden ja opiskelijoiden tarkasteluun.

Lisäksi Tietoarkisto käsittelee datasta kansainvälisen version lähetettäväksi Gesisille. Käsittely varmistaa aineiston yhdistettävyyden muiden maiden datojen kanssa. Yksityiskohtaiset ohjeet käsittelyyn, kuten miten muuttujat ja selitteet nimetään, tulevat Gesisiltä. Kansainvälinen data eroaa Ailasta ladattavasta aineistosta esimerkiksi muuttujien numeroinnissa. Lisäksi datassa ei saa olla yhtään puuttuvaa tietoa, jolla ei ole selitettä. Luovutettavaan dataan lisätään myös useita uusia muuttujia, kuten muiden maiden vastauksien kanssa yhteensopiva uskontokuntamuuttuja.

Gesisille tulee lähettää myös tarkat tiedot aineistonkeruusta ja siitä, miten muuttujat on koodattu. Pienimmätkin muutokset, kuten yksittäisen sanan yksikkömuotojen muutos monikkoon, kirjataan ylös. Tällä kaikella työllä halutaan varmistaa laadukas kansainvälinen aineistosarja, joka kestää tarkastelua vielä vuosikymmenien ja vuosisatojen päästä.

Tyylitelty maailmankartta jossa on pistein merkitty, mitä maat ovat mukana ISSP-tutkimuksessa.

ISSP:n jäseninä on tällä hetkellä 42 maata, joista 25 on Euroopasta. Mukana ovat maailmanpoliittisesti merkittävät suuret valtiot kuten Yhdysvallat, Venäjä, Kiina ja Intia.

Lisätietoa:

» Tietoarkiston ISSP-sivut
» International Social Survey Programme -tutkimusohjelma
» Gesisin ISSP-sivut
» ISSP-aineistot Ailassa

Annika Valaranta
tietopalveluasiantuntija
etunimi.sukunimi [at] tuni.fi