Ajankohtaista

Väitös: 9.12.2016: Kone oppii – ja erehtyy erilaisin tavoin (Nieminen)

Alkamisaika: perjantai 09. joulukuuta 2016, 12.00

Päättymisaika: perjantai 09. joulukuuta 2016, 15.00

Paikka: Mattilanniemi, MaA 103

Paavo Nieminen
Paavo Nieminen

FM Paavo Niemisen tietotekniikan väitöskirjan "Multilayer Perceptron Training with Multiobjective Memetic Optimization" (Monikerroksisten hermoverkkojen muodostaminen memeettisen monitavoiteoptimoinnin avulla) tarkastustilaisuus. Vastaväittäjänä apulaisprofessori Carlos Cotta (Málagan yliopisto, Espanja) ja kustoksena professori Tommi Kärkkäinen (Jyväskylän yliopisto).

Väitöskirja liittyy oppivien tietokoneohjelmien perustutkimukseen. Lisäksi siinä on kehitetty kaikille tieteenaloille soveltuvaa ohjelmistoavusteista tutkimusmenetelmää.

Koneoppiminen tarkoittaa luonnollisten oppimisprosessien jäljittelemistä keinotekoisten laitteiden tai ohjelmistojen avulla – esimerkiksi sellaisen tietokoneohjelman tekemistä, joka oppii tunnistamaan henkilöitä digitaalisista kasvokuvista. Toinen ymmärrettävä sovellusesimerkki on sairauden tunnistaminen potilaasta mitatuista veriarvoista.

– Tavoitteena on muodostaa väline, joka tekee salamannopeasti arvion, esimerkiksi lääketieteellisen esidiagnoosin, johon ihmisellä kuluisi merkittävästi pidempi aika, väittelijä täsmentää.

Luonnon inspiroimaa laskentaa

Elävät olennot oppivat toimimaan ympäristössään tallentamalla tietoa mm. hermosolujen välisten tiedonvälityskanavien, synapsien, rakenteeseen. Tämän prosessin mallintaminen on pohjana mm. monikerroksisille hermoverkoille, perinteiselle ja helposti toteutettavalle oppivalle koneelle.

Toinen luonnon oppimismuoto on evoluutio. Uusdarwinistisen biologian inspiroimissa tietokoneohjelmissa ratkaisuvaihtoehtojen populaatiota parannetaan keinotekoisella "luonnonvalinnalla", lisääntymisellä ja mutaatioilla. Memeettisissä menetelmissä myös elinaikainen, "kulttuurillinen", oppiminen periytyy jälkipolvelle esidarwinistista evoluutiokäsitystä mukaillen.

– Tietenkin biologia on vain inspiraation lähde näille loppujen lopuksi hyvin karkeille matemaattisille malleille, Nieminen toteaa.

Oppimistuloksessa on monta ulottuvuutta

Koneoppimisessa on useita ristiriitaisia tavoitteita. Esimerkiksi yksinkertainen malli ei yleensä hahmota opetusaineiston piirteitä tarkasti, vaikka sekä yksinkertaisuutta että tarkkuutta tavoitellaan. Toinen esimerkki on kompromissi väärien positiivisten ja väärien negatiivisten diagnoosien mahdollisuuden välillä, jollaisen edessä myös ihminen, esimerkiksi lääkäri, on aina diagnoosia tehdessään.

Tietokoneohjelmien opettamiseksi määritellään matemaattisia funktioita, joista kunkin optimointi vastaa vain yhtä näkökulmaa toivottuun lopputulemaan. Keskenään ristiriitaisten funktioiden samanaikaiseen optimointiin kehitettyjen monitavoiteoptimointimenetelmien järjestelmällinen käyttö on koneoppimisen pitkään historiaan nähden vielä suhteellisen uutta.

Niemisen väitöskirjassa käydään läpi aihepiirin historia alusta nykypäivään asti. Kirjallisuuskatsauksen tekemisessä apuna oli työkaluohjelmisto, jota Nieminen on samalla kehittänyt yhteistyössä muiden tutkijoiden kanssa. Työkalun kehitys ja kokeileminen muodosti lopulta merkittävän osan väitöskirjan sisällöstä. Kirjan neljäs luku onkin käytännön esimerkki tietokoneavusteisen tutkimustyön prosessista, joka soveltuu mille tahansa tieteenalalle.

Väitöskirjassa kerätään yhteen monitavoitteisen koneoppimisen tärkeimmiksi havaitut tavoitteet ja toteutustavat, joiden pohjalta myös kehitetään aiemmin yksitavoitteisena toimivaksi todettua hermoverkkosovellusta.

Opiskelijoita odotetaan joukolla väitökseen

– Tietotekniikan opiskelijoiden ainejärjestö Linkki Jyväskylä ry on nostanut väitökseni tapahtumakalenteriinsa. Toivon, että väitösten seuraamisesta tulisi opiskelijoille perinne ja he alkaisivat enemmänkin seurata paikallista tutkimusta, Nieminen toivoo.

– Vastaväittäjäni on lisäksi luvannut jututtaa opiskelijoita tarkastustilaisuuden jälkeen – toivon tuon jälkikeskustelun valaisevan heidän opintopolkujaan, Nieminen lisää.

Lisätietoja:

Paavo Nieminen, puh. 040 576 8507, paavo.j.nieminen@jyu.fi
tiedottaja Anitta Kananen tiedotus@jyu.fi, puh. +358 40 805 4142

Paavo Nieminen valmistui ylioppilaaksi Pieksämäen lukiosta vuonna 1998. Filosofian maisteriksi hän valmistui Jyväskylän yliopiston tietotekniikan laitokselta vuonna 2006, minkä jälkeen hän on työskennellyt laitoksella vaihtelevissa opetus-, tutkimus- ja opintoneuvontatehtävissä, joissa hän myös väitöksen jälkeen jatkaa. Väitöskirjaan tähtäävän jatko-opiskelun Nieminen aloitti muiden tehtäviensä ohella vuonna 2009. Niemisen aiempaan työhistoriaan kuuluu myös ohjelmistokehitys Numerola Oy:ssä ennen siirtymistä yliopiston palvelukseen.

Teos julkaistaan sarjassa Jyväskylä Studies in Computing. ISSN 1456-5390; 247; ISBN 978-951-39-6823-6 (nid.); ISBN 978-951-39-6824-3 (PDF) E-julkaisuna: https://jyx.jyu.fi/dspace/handle/123456789/51933
Väitöskirjaa myyvät yliopistokauppa Soppi, puh. 040 805 3825 tai myynti@library.jyu.fi ja yliopiston verkkokauppa.

 

Abstract

Machine learning tasks usually come with several mutually conflicting objectives. One example is the simplicity of the learning device contrasted with the accuracy of its performance after learning. Another common example is the trade-off that must often be made between the rate of false positive and false negative predictions in diagnostic applications. For computer programs that learn from data, these objectives are formulated as mathematical functions, each of which describes one facet of the desired learning outcome. Even functions that intend to optimize the same facet may behave in a subtly different and mutually conflicting way, depending on the task and the dataset being examined. Multiobjective optimization methods developed for simultaneous optimization of such multiple objectives found their way to machine learning a few decades ago.

This dissertation discusses the past and current uses of multiobjective optimization in supervised learning, especially in training a multilayer perceptron (MLP) artificial neural network for object classification. A literature overview of multiobjective MLP training is presented, supported by a semi-automatic survey using a software tool created partly by the author. Based on the literature, key goals and algorithmic elements are identified and applied to create a new framework for training MLPs consistent with an implementation used earlier for industrial projects using single-objective methods. Simulated datasets are used to illustrate the functionality of the created training algorithm, and how memetic Pareto-based multiobjective learning can be used for MLP classifier training. Emphasis is put on formulating useful representations and objective functions for the task.

kuuluu seuraaviin kategorioihin: ,