Ajankohtaista

Väitös: 1.10.2016 Uusi sovellus monimutkaisten elämänkulkuaineistojen tilastolliseen tutkimiseen (Helske)

Alkamisaika: lauantai 01. lokakuuta 2016, 12.00

Päättymisaika: lauantai 01. lokakuuta 2016, 15.00

Paikka: Seminaarinmäki, S212, Vanha juhlasali

Satu HelskeFM Satu Helskeen tilastotieteen väitöskirjan ”Statistical analysis of life sequence data” tarkastustilaisuus. Vastaväittäjänä Professor Emeritus (Professeur honoraire) Gilbert Ritschard, NCCR LIVES and Institute of Demography and Socioeconomics (IDESO) (University of Geneve, Switzerland) ja kustoksena professori Juha Karvanen (Jyväskylän yliopisto). Väitöstilaisuus on englanninkielinen.

Useilla tieteenaloilla ollaan kiinnostuneita erilaisten elämänkokemusten vaikutuksesta tulevaan elämänkulkuun, esimerkiksi perheenmuodostukseen tai työuraan. Kokemukset ja valinnat eri elämänalueilla ovat usein yhteydessä toisiinsa, joten niitä tulisi yleensä myös tarkastella yhdessä.

Sekvenssi on yksi tapa kuvata tutkittavien elämänkulkua yhdellä tai useammalla elämänalueella. Tutkittavan kokemukset luokitellaan tutkimuksen kannalta kiinnostaviksi “tiloiksi”, joiden avulla kuvataan tämän elämäntilanne kullakin ajanhetkellä, esimerkiksi parisuhde- ja työllisyystilanne vuosi vuodelta.

Helskeen väitöskirja tarkastelee erilaisia tilastollisia menetelmiä (tapahtumahistoria-analyysia, piilo-Markov-malleja ja sekvenssianalyysia) monimutkaisten sekvenssiaineistojen tutkimuksessa. Perinteisesti elämänkulkuaineistojen tutkimuksessa on käytetty tapahtumahistoria-analyysia, jolla voidaan selvittää mahdollisten selittävien tekijöiden yhteyttä yhden tai useamman tapahtuman ajoittumiseen tai kestoon. Piilo-Markov-malleja voidaan käyttää mm. tilanteissa joissa tapahtumat tai niiden ajoittuminen on kirjattu epätarkasti tai niiden taustalla vaikuttaa ilmiö, jota ei voida suoraan havaita. Sekvenssianalyysi on uudempi ns. aineistonlouhintamenetelmä, jossa ei tehdä tai tarvita tilastollisia malleja. Sekvenssianalyysissa tarkastellaan ja verrataan tutkittavien sekvenssejä kokonaisuutena sen sijaan, että tarkasteltaisiin yksittäisten tapahtumien ajoittumista.

Väitöskirjassa näitä kolmea menetelmää kuvataan ja testataan tarkastelemalla kahta monimutkaista elämänkulkuaineistoa: 50-luvun lopulla syntyneiden suomalaisten ja saksalaisten tutkittavien parisuhde-, vanhemmuus- ja työhistorioita 15-vuotiaasta 50-vuotiaaksi. Sekvenssianalyysia käyttäen mm. luokiteltiin tutkittavia tyypillisiin ja epätyypillisiin ryhmiin heidän perhe- ja työhistorioidensa suhteen. Tapahtumahistoria-analyysin menetelmiä käyttäen mallinnettiin lapsuuden sosioemotionaalisten piirteiden ja perhetaustan yhteyttä tulevien parisuhteiden ajoittumiseen ja määrään. Piilo-Markov-mallinnuksen avulla puolestaan etsittiin tutkittavien yleisempiä elämänvaiheita ja tarkasteltiin siirtymiä näiden välillä. Väitöskirjatyön yhteydessä kehitettiin myös uusi, kaikille avoin ohjelmisto, jonka avulla voi tehdä ja sovittaa piilo-Markov-malleja sekä kuvata monimutkaisia sekvenssiaineistoja.

Tutkimuksessa selvisi, että kolme esiteltyä menetelmää tarkastelevat elämäntapahtumia eri tavoin eikä siksi voida sanoa, että jokin olisi aina toista parempi. Menetelmän tai menetelmien valinta riippuukin suurelta osin aineistosta ja tutkimuskysymyksistä. Sekvenssianalyysin ja tilastollisten mallien käyttäminen yhdessä voi myös tuoda ilmiöstä esille jotakin, joka muuten saattaisi jäädä huomaamatta.


Lisätietoja:

Satu Helske, satu.helske@sociology.ox.ac.uk, puh. +44 770 435 1585
Viestintäharjoittelija Katja Ketola, tiedotus@jyu.fi, puh. 040 805 3638

Satu Helske on kirjoittanut ylioppilaaksi Mikkelin Yhteiskoulun lukiosta vuonna 2004. Hän aloitti tilastotieteen opinnot Jyväskylän yliopistossa 2004 ja valmistui filosofian maisteriksi vuonna 2009. Väitöskirjan hän teki Jyväskylän yliopistossa professori Mervi Eerolan ohjauksessa Ihmistieteiden metodikeskuksessa ja matematiikan ja tilastotieteen laitoksella. Helske on saanut tutkimukseensa rahoitusta Jyväskylän yliopiston rehtorin rahastosta, COMAS-tutkijakoulusta sekä Suomen kulttuurirahastosta. Syyskuussa 2016 Helske aloitti tutkijatohtorina Oxfordin yliopistossa sosiologian laitoksella.

Väitöskirja on julkaistu sarjassa University of Jyväskylä, Department of Mathematics and Statistics, Report 157, Jyväskylä 2016, ISSN 1457-8905, ISBN 978-951-39-6757-4. Luettavissa JYX-arkistossa: http://urn.fi/URN:ISBN:978-951-39-6758-1

 

Abstract

Life courses are studied across disciplines for understanding the implications of life transitions on different aspects of life. Life course trajectories include, e.g., family trajectories, residential histories, and occupational careers. Trajectories embed events and transitions that may be singular or repetitive. Links between events and choices in different life domains form an interdependent system, often requiring joint analysis of different dimensions.

This thesis considers and compares different statistical approaches -- event history analysis (EHA), hidden Markov models (HMMs), and sequence analysis (SA) -- in the analysis of complex life sequence data. EHA is the traditional method for analysing the effects of time-constant and time-varying covariates on the timing and duration of events and transitions. In hidden Markov modelling we assume a latent or hidden level, i.e., one or more unobservable statuses that may be constant or time-varying. Observed states are regarded as being generated by a hidden or latent Markov chain. SA is a more recent model-free data-mining type of approach where the focus is on the comparison of whole trajectories. It is a descriptive tool, typically used for finding and visualizing groups of individuals with similar trajectories.

These methods are described and tested with empirical analyses, e.g., to study which types of joint family and career trajectories are typical and which atypical, to find associations between individuals' childhood characteristics and their future partnership trajectories, and to compress information across various life domains into more general life stages. This thesis also presents new software for the analysis and visualization of complex sequence data.

The three approaches provide versatile information on the phenomena of interest, as the methods capture time in different ways. The choice of the method(s) depends on the type of the data and the aims of the study. Applying model-free and modelling approaches or even combining them is often beneficial as they are not substitutes but complete each other in the analysis of life course data.

kuuluu seuraaviin kategorioihin: