Ajankohtaista

Väitös: 16.6.2017: Tiedonlouhinta paljastaa uutta tietoa suomalaisesta koulutusjärjestelmästä (Saarela)

Alkamisaika: perjantai 16. kesäkuuta 2017, 12.00

Päättymisaika: perjantai 16. kesäkuuta 2017, 15.00

Paikka: Mattilanniemi, Agora, Auditorio 3

MSc Mirka Saarelan tietotekniikan väitöskirjan ”Automatic Knowledge Discovery from Sparse and Large-Scale Educational Data - Case Finland” tarkastustilaisuus. Vastaväittäjänä Professor Rolf Vegar Olsen (Oslon yliopisto, Norja) ja kustoksena professori Tommi Kärkkäinen (Jyväskylän yliopisto).

Mirka Saarelan väitöskirjassa käytetään ja kehitetään tiedonlouhintamenetelmiä, joiden avulla saadaan uutta tietoa suomalaisesta koulutusjärjestelmästä. Tiedonlouhinta tarkoittaa laajojen, olemassa olevien tietoaineistojen analysointia. Tiedonlouhinnan tavoitteena on löytää aineistoista uutta ja yllättävää tietoa.

– Suomen erinomaiset oppimistulokset 2000-luvun alun PISA-vertailussa tekivät koulutusjärjestelmästämme kansainvälisesti kuuluisan. Koulutusjärjestelmämme arviointi ja kehittäminen perustuvat kuitenkin lähinnä kasvatustieteilijöiden tutkimustyöhön, jossa yleensä käytetään perinteisiä tiedonkeruu- ja analysointimenetelmiä, Saarela kertoo.

Saarelan tutkimuksessa aihetta lähestytään eri tavalla. Sen sijaan, että tutkimuksen alussa muodostettaisiin vahvoja hypoteeseja, sovelletaan tiedonlouhinnan menetelmiä olemassa olevan monipuolisen aineiston automaattiseksi analysoimiseksi.

– Tämän tyyppisten menetelmien avulla pystytään tuottamaan uusia näkökulmia koulutusjärjestelmästä. Menetelmät tuovat myös esille mahdollisuuksia koulutusjärjestelmän hallintaan liittyvän päätöksenteon automatisoimiseen, Saarela kertoo.

Saarelan käyttämä tiedonlouhinta paljasti esimerkiksi sen, että yläkouluikäisistä keskiverto-oppilaista tytöillä ei ollut mitään aikomusta matemaattisille aloille, mutta kiinnostus koulua ja opiskelua kohtaan oli vahva. Pojat taas olivat motivoituneita nimenomaan matemaattisille aloille, mutta eivät opiskeluun yleensä.

Tiedonlouhinta säästäisi myös resursseja

Merkittävä osa yliopistojen rahoituksesta perustuu tehtyjen akateemisten julkaisujen määrään ja laatuun. Kymmenien tuhansien julkaisukanavien laadun määrittävät eri tieteenalojen asiantuntijoista kootut paneelit, lähinnä käsityönä. 


– Järjestelmästä aiheutuu merkittäviä kustannuksia ja sen ylläpito vaatii hyvin paljon työtunteja, Saarela toteaa.

Valtaosan manuaalisesta arvioinnista voisi korvata käyttämällä tiedonlouhinnan avulla luotuja referenssimalleja, jotka perustuvat muulle, jo olemassa olevalle laatuinformaatiolle.

Niillä julkaisukanavilla, joiden arviot olivat referenssimalleja parempia, oli tavallista suurempi kansallinen julkaisuaktiivisuus.

– Tämä kertoo siitä, että automaattiset mallit voivat olla myös luotettavampia, Saarela huomauttaa.

Lisätietoja

Mirka Saarela, mirka.saarela@jyu.fi, puh. 044 377 0777 (in English)

Viestintäharjoittelija Anni Laine, anni.l.k.laine@jyu.fi, puh. 040 805 4483

Mirka Saarela opiskeli tietojenkäsittelytiedettä Passaun yliopistossa Saksassa ja Jyväskylän yliopistossa. Hän on työskennellyt ohjelmistoarkkitehtinä Hampurissa ja viimeisen neljän vuoden ajan tietotekniikan laitoksella Jyväskylän yliopistossa.

Teos on julkaistu sarjassa Jyväskylä studies in computing, numerona 262, 270 s., ISSN 1456-5390, ISBN 978-951-39-7083-3 (nid.). Väitöskirjaa saa Jyväskylän yliopiston kirjaston julkaisuyksiköstä, puh. 040 805 3825, myynti@library.jyu.fi. Luettavissa JYX-arkistossa: http://urn.fi/URN:ISBN:978-951-39-7084-0

Abstract

The Finnish educational system has received a lot of attention during the 21st century. Especially, the outstanding results in the first three cycles of the Programme for International Student Assessment (PISA) have made Finland’s education system internationally famous, and its unique characteristics have been under active research by various, predominantly educational, scholars since then. However, despite the availability of real but often sparse big data sets that would allow more evidence-based decision making, existing research to date has mostly concentrated on using classical qualitative and (univariate) quantitative methods. This thesis discusses, in general terms, knowledge discovery from large and sparse educational data—particularly from PISA—through the utilization and further development of multivariate data mining techniques and, more specifically, the application of these methods in the context of the Finnish educational system. Therefore, its goals are twofold and interrelated: to advance knowledge discovery methods and algorithms for sparse educational data to gain more interpretable models and to utilize these approaches to learn from the data and improve understanding of educational phenomena. This article-style dissertation is composed of 10 publications. The first publication provides a general knowledge discovery framework for analyzing sparse educational data. The succeeding seven publications discuss and advance methods for the special characteristics and complexities of PISA data and their usage for the quantitative educational knowledge discovery process. The final two publications demonstrate how human advising and decision making in Finnish educational institutions and related to the management of a national educational system can be automated and improved by employing the introduced analysis framework and process. All this provides new insights about Finnish education, advances the overall automatic quantitative knowledge discovery process, increases institutional awareness, and could save costs on various levels of the whole educational system.

Lisätietoja

Mirka Saarela
mirka.saarela@jyu.fi
kuuluu seuraaviin kategorioihin: ,