Ajankohtaista

Väitös: Pitkittäisaineistoista tarkkuutta pienalue-estimointiin (Nissinen)

Alkamisaika: lauantai 31. tammikuuta 2009, 12.00

Päättymisaika: lauantai 31. tammikuuta 2009, 15.00

Paikka: Seminaarinmäki, Villa Rana, Paulaharju-sali

Kari NissinenYTL Kari Nissisen tilastotieteen väitöskirjan ”Small area estimation with linear mixed models from unit-level panel and rotating panel data” (Pienalue-estimointi yksilötason sekamalleilla paneeliaineistosta ja rotatoivasta paneeliaineistosta) tarkastustilaisuus. Vastaväittäjänä professori Juha Alho (Joensuun yliopisto) ja kustoksena professori Jukka Nyblom.

 

Erityisesti virallisessa tilastotuotannossa, mutta myös esimerkiksi taloustieteellisessä tai terveystieteellisessä tutkimuksessa on kasvavaa kysyntää alueellisille tilastotiedoille ja tunnusluvuille. Käytännön ongelmaksi muodostuu usein kuitenkin se, että tilastoaineistot kerätään etupäässä valtakunnallisia tai kansainvälisiä tarpeita varten, jolloin ne sisältävät vain vähän havaintoja varsinkin pienimmistä alueista. Luotettavien tunnuslukujen saaminen näistä alueista on vaikeaa ellei mahdotonta. Toisaalta myös otoskokojen riittävä kasvattaminen on käytännössä mahdotonta. Tämä ns. pienalue-estimoinnin ongelma ratkaistaan tavallisesti sopivilla tilastollisilla malleilla, joiden avulla tunnuslukujen estimointia tehostetaan hyödyntämällä muista vastaavista alueista tai aikaisemmista vastaavista tutkimuksista saatavia tietoja.

 

Kari Nissinen keskittyi väitöstutkimuksessaan tilanteeseen, jossa käytettävissä on paneeliasetelmalla tai ns. rotatoivalla paneeliasetelmalla kerättyä yksilötasoista pitkittäisaineistoa. Rotatoivassa asetelmassa otoksen kokoonpanoa muutetaan mittausajankohdasta toiseen etukäteen laaditun systeemin mukaisesti. Tällaisia asetelmia käytetään jatkuvasti varsinkin eurooppalaisessa tilastotoimessa kuten Tilastokeskuksessa tai Eurostatissa. Esimerkkinä voidaan mainita Tilastokeskuksen toteuttama rotatoivaa asetelmaa käyttävä kuukausittainen työvoimatiedustelu, jolla tuotetaan Suomen viralliset työttömyysluvut. Työssä esitetään tällaisiin aineistoihin soveltuva lineaarinen sekamalli ja sen pohjalta johdetaan pienaluetotaaleille eli kokonaismäärille estimaattori ja tämän tarkkuutta mittaava keskineliövirhe. Uutta on tällaisen estimaattorin johtaminen nimenomaan yksilötasoisille pitkittäisaineistoille. Aluetasolle soveltuvia malleja ja estimaattoreita on jo käytössä varsinkin Yhdysvalloissa, jossa yksilötasoisia pitkittäisaineistoja ei juuri ole saatavilla.

 

Nissisen simulointitutkimus osoitti, että rotatoivan paneeliaineiston käyttö pienalue-estimoinnissa tuottaa huomattavan tarkkuuden parannuksen perinteisiin poikkileikkausaineistoihin tai jopa täydellisiin paneeliaineistoihin verrattuna. Alueellisten tunnuslukuestimaattien harhaa ja keskineliövirheitä saadaan molempia pienennettyä, mikä johtaa muun muassa kapeampiin, mutta silti päteviin luottamusväleihin. Tutkimus osoitti lisäksi, että rotatoivilla paneeliaineistoilla saadaan myös suojaa virheellisistä malleista johtuvia harhaisia estimointituloksia vastaan. Tämä on sitä arvokkaampaa, mitä pienempää aluetta koskevia tunnuslukuja halutaan estimoida. 

 

Lisätietoja:

 

Kari Nissinen, puh. (014) 260 1229, kari.j.nissinen@jyu.fi

Tiedottaja Liisa Harjula, puh. (014) 260 1043, tiedotus@jyu.fi, josta saa väittelijän kuvan sähköisessä muodossa.

 

Kari Nissinen on kirjoittanut ylioppilaaksi Iisalmen lukiosta vuonna 1979 ja valmistunut Jyväskylän yliopistosta yhteiskuntatieteiden kandidaatiksi vuonna 1987 ja yhteiskuntatieteiden lisensiaatiksi vuonna 1993 pääaineena tilastotiede. Nissinen on toiminut vuosia erilaisissa opetus- ja tutkimustehtävissä Jyväskylän yliopistossa matematiikan ja tilastotieteen laitoksella. Nykyään hän työskentelee tutkijana Jyväskylän yliopistossa kielten laitoksella Varieng-huippututkimusyksikössä.

 

Väitöskirja on julkaistu sarjassa University of Jyväskylä, Department of Mathematics and Statistics, Report 117, Jyväskylä 2009. ISSN 1457-8905, ISBN 978-951-39-3363-0. Sitä voi tiedustella väittelijältä.

 

Abstract

 

The demand for reliable regional statistics is increasing in official statistics as well as in economical or epidemiological research, for example. The problem of small area estimation arises from the fact that for the smallest regions the available sample data often contain too few observations for adequate statistical precision, and this is when special small area estimation methods are needed. A common procedure is to employ statistical models, which make it possible to "borrow strength" for the estimation by utilizing data from similar or neighbouring areas or from earlier similar surveys. This thesis concentrates on the latter alternative, which is often called borrowing strength over time.

 

The thesis considers small area estimation from longitudinal unit-level survey data collected with a panel or a rotating panel design, which are frequently employed by statistical agencies. A suitable linear mixed model is applied to such data and the respective estimator of small area total and its mean squared error are derived within the empirical best linear unbiased prediction (EBLUP) framework.

 

A simulation study shows that in small area estimation it is extremely useful to utilize rotating panel data instead of cross-sectional data or complete panel data. Using rotating panel data leads to smaller bias and more accurate point estimates. Also the mean squared errors of the estimates are reduced, which leads to narrower but still valid confidence intervals. In addition, utilizing rotating panel data provides protection for possible bias caused by misspecified model. These merits appear particularly in the smallest areas.

 

 

 

Tekijä

tiedottaja Liisa Harjula
tiedotus@jyu.fi
014-260 1043
050-310 9972
kuuluu seuraaviin kategorioihin: