3. helmikuuta 2016

Tietoarkkitehtuurista

TIETOARKkitehtuuri ja TIETOARKisto, onko niillä mitään muuta yhteistä kuin ensimmäiset kahdeksan kirjainta? Tietoarkkitehtuurissa kuvataan tietoa kolmella eri kuvaustasolla: käsitteellinen, looginen ja fyysinen. Tietoarkistossa kuvaillaan tutkimusaineistoja, mutta onko tietoarkiston kuvailutyössä havaittavissa tietoarkkitehtuurissa käytetyt kuvaustasot? Näihin visaisiin, nyt jo lukijan mieltä kovasti kutkuttaviin kysymyksiin, haetaan vastausta tällä kevyellä blogikirjoituksella.

Tietoarkkitehtuurissa tiedon käsitteellisen tason kuvaaminen on eräänlainen hahmotteluvaihe. Siinä pohditaan, mitkä käsitteet liittyvät kuvauksen kohdealueeseen. Myös käsitteiden väliset suhteet hahmotellaan, ja jos käsitteet eivät ole kaikille osapuolille selviä, ne myös määritellään. Tietoarkistossa tutkimusaineistojen kuvailuissa käsitteellisen hahmon muodostavat mm. aihealue ja asiasanat. Ne eivät vielä yksityiskohtaisesti kerro, mistä tutkimusaineistossa on kysymys. Ne kuitenkin auttavat aineistoon tutustuvaa hahmottamaan, olisiko aineisto heitä kiinnostava.

Tietoarkkitehtuurissa pohditaan loogisella tasolla esimerkiksi sitä, mitä ja millaisia käsitteisiin liittyvät tiedot ovat. Myös tietojen väliset suhteet esitetään tarkasti. Usein lisäksi kuvataan, missä tiedot loogisesti sijaitsevat ja missä kaikkialla tiedot kulkevat. Tietoarkiston aineiston kuvailuissa käsitteellistä hahmoa selvennetään muun muassa aineiston tietosisältöä kuvaavalla tiivistelmällä sekä tiedoilla keräysmenetelmistä ja -välineistä, otantamenetelmistä, tekijöistä ja kerääjistä. Kuvailussa kerrotaan myös aineiston looginen sijainti eli aineiston sarja. Julkaisuluettelo havainnollistaa aineiston tietojen virtaamista ympäri maailman.

Tietoarkkitehtuurissa fyysisellä tasolla kuvataan esimerkiksi tiedon fyysinen sijainti ja käytetyt koodistot. Tietoarkistossa kvantitatiivisista aineistoista kuvataan muuttujien tiedot – täsmälliset kysymyslauseet ja vastausvaihtoehdot arvoineen sekä useimmiten myös tilastolliset tunnusluvut. Aineiston fyysinen sijaintikin on kuvailussa kerrottu, tosin tietoturvallisesti, todeten aineiston olevan Tietoarkistossa.

Jos Tietoarkisto ei kuvailisi tutkimusaineistojaan, olisi niiden löytäminen, ymmärtäminen ja uudelleenkäyttö hyvin hankalaa. Sama asia on tietoarkkitehtuurissa. Jos tietoarkkitehtuuria ei tehdä, on tietojen löytäminen, ymmärtäminen ja uudelleenkäyttö ongelmallista. Tietoarkkitehtuuri on siis tiedolle sama kuin Tietoarkiston kuvailutyö tutkimusaineistoille – saattamista löydettäväksi, ymmärrettäväksi ja uudelleenkäytettäväksi.

Katja Moilanen
tietoarkkitehti
katja.j.moilanen [at] uta.fi

11. tammikuuta 2016

Tietoarkisto on aktiivinen eurooppalainen osaaja

Tietoarkisto on CESSDAn Suomen kansallinen palveluntuottaja. Tämä lyhyt toteamus pitää sisällään paljon hankkeita ja paljon työtä – sekä runsaasti puhelin- ja videokokouksia, onhan kysymys yhteiseurooppalaisesta toiminnasta. Kaiken tavoitteena on parempia ja helpommin saavutettavia eurooppalaisia data-, aineistonhallinta- ja koulutuspalveluja tutkijoille.

CESSDA on lyhenne sanoista Consortium of European Social Science Data Archives. Lyhyesti sanottuna CESSDA on eurooppalainen tutkimusinfrastruktuuri, joka tarjoaa tutkijoille kansainvälistä aineistopalvelua ja koulutusta. CESSDAn jäseniä ovat valtiot, ja sen keskustoimisto sijaitsee Bergenissä. Varsinaisten tutkijapalveluiden tuottamisen hoitavat jäsenmaiden data-arkistot, Suomessa siis Tietoarkisto.

Nykyisessä konsortiomuodossaan CESSDA on toiminut kesäkuusta 2013, mutta sen historia Euroopan kansallisten tietoarkistojen epävirallisena kattojärjestönä alkaa jo vuodesta 1976. Tällä hetkellä CESSDAssa tapahtuu enemmän kuin koskaan. Viime vuonna alkoi useita hankkeita, jotka tähtäävät keskitettyjen palveluiden rakentamiseen ja CESSDAn laajentumiseen.


Kuvassa CESSDA House Bergenissä.
Suomen Akatemian FIRI-rahoituksen myötä Tietoarkiston palvelut ja osaaminen ovat viimeisten viiden vuoden aikana nousseet kansainväliselle huipputasolle. Haluammekin viedä meillä käytössä olevat hyvät toimintatavat osaksi eurooppalaisia tutkijapalveluita. Tietenkin haluamme vastaavasti myös tuoda parhaat eurooppalaiset data- ja koulutuspalvelut suomalaisen tutkimusyhteisön ulottuville. Tämä onnistuu parhaiten olemalla CESSDAssa proaktiivinen toimija ja vaikuttaja. Ja sellainen Tietoarkisto on.

Esimerkiksi oma työni koostuu seuraavat kaksi vuotta lähes kokonaan CESSDAan liittyvistä tehtävistä. Myös monet muut tietoarkistolaiset osallistuvat aktiivisesti CESSDAn toimintoihin.

CESSDA etenee palvelujen rakentamisessa työsuunnitelmansa mukaan. Työsuunnitelma koostuu tehtävistä, joita kansalliset palveluntuottajat toteuttavat joko yksin tai yhdessä. Toteuttajat valitaan kilpailumenettelyllä: palveluntuottajat lähettävät CESSDAlle hankehakemuksen, joka sisältää sekä suunnitelman että kustannusarvion, ja ulkoisen arvioinnin jälkeen CESSDA valitsee parhaan hanke-esityksen toteutettavaksi.

Tietoarkisto on mukana kolmessa työsuunnitelman mukaisessa hankkeessa, mitä voidaan pitää erinomaisena saavutuksena. Nämä kolme hanketta ovat:

  • CESSDA Metadata Management -hanke, jota Tietoarkisto johtaa. Hankkeessa luodaan yhteinen metatietomalli ja yhteiset metatietokäytännöt CESSDAn palveluntuottajille. Yhteinen metatietoprofiili ja monikieliset kontrolloidut sanastot tukevat yhteisten eurooppalaisten palvelujen, kuten aineistoluettelon ja kysymyspankin rakentamista. Tietoarkiston lisäksi hankkeessa on mukana seitsemän palveluntuottajaa. Hanke päättyy keväällä 2017.
  • CESSDA Metadata Harvesting Tool -hanke, joka kehittää metadatan haravointiratkaisun muun muassa CESSDAn yhteisen aineistoluettelon rakentamista varten. Hanketta vetää Norjan tietoarkisto NSD ja siinä on mukana neljä palveluntuottajaa. Haravointityökalu valmistuu vuoden 2016 aikana.
  • CESSDA Expert Seminar 2015 on Trust -hanke, joka järjesti joulukuussa 2015 CESSDAn asiantuntijaseminaarin Haagissa. Päävastuun seminaarista kantoi hollantilainen DANS, ja Tietoarkisto oli yksi kolmesta muusta järjestäjästä. Seminaarin aiheina olivat luotettava sähköinen pitkäaikaissäilytys ja CESSDAn palveluntuottajille asettamat vaatimukset.

CESSDA on perustanut myös neljä pysyvää työryhmää ohjaamaan toimintaa. Työryhmät koostuvat palveluntuottajien asiantuntijoista. Tietoarkisto on mukana kolmessa työryhmässä: CESSDA Trust Support Group, CESSDA Training Group ja CESSDA Communications Group. Lisäksi Tietoarkisto on aktiivisesti mukana kehittämässä yhteiskuntatieteiden monikielistä tesaurusta ELSSTiä.

Keskitettyjen palveluiden rakentamisen ohella CESSDA laajentaa verkostoaan seuraavien kahden vuoden aikana. Nykyisten 15 jäsenmaan lisäksi konsortioon halutaan mukaan loputkin Euroopan maat. Tätä varten CESSDA haki ja sai rahoitusta Euroopan unionin tutkimuksen ja innovoinnin Horizon 2020 -puiteohjelmasta. CESSDA SaW: Strengthening and widening the European infrastructure for social science data archives -hanke jatkuu elokuuhun 2017 asti. Tietoarkisto on mukana työpaketissa, jonka teemana on tietämyksen jakaminen eri arkistojen välillä, ja jossa keskitytään muun muassa digitaalisen pitkäaikaissäilyttämisen haasteisiin ja malleihin, sertifiointiin ja kustannuksiin. SaW-projektin myötä CESSDA luo Euroopan tutkimusalueen data-arkistoille entistä tiiviimmän ja vuorovaikutteisemman yhteistyöverkon.

Tässä esitellyt tehtävät ja hankkeet ovat vain alkua CESSDA-palvelujen rakentamiselle. Työsuunnitelmassa riittää tehtävää useammalle vuodelle, ja uusia avauksia otetaan mukaan maailman muuttuessa. Toivon ja uskon, että Tietoarkisto osallistuu aktiivisesti CESSDAn kehittämiseen tässä mainittujen hankkeiden päätyttyäkin. On tehokkaampaa olla luomassa yhteisiä käytäntöjä kuin rakentaa omia erillisiä ratkaisuja tai sopeuttaa omia olemassa olevia ja toimivia ratkaisuja toisten vaatimuksiin.

Lisätietoja:
» CESSDAn palvelut Tietoarkiston sivuilla
» CESSDA SaW
» CESSDAn verkkosivut
» Tietoarkiston hankkeet

Mari Kleemola
kehittämispäällikkö, projektit ja kehittäminen -moduulin johtaja
etunimi.sukunimi [at] uta.fi