Ajankohtaista

Väitös: 14.12.2017 Elena Ivannikova (Informaatioteknologian tiedekunta, tietotekniikka)

Alkamisaika: torstai 14. joulukuuta 2017, 12.00

Päättymisaika: torstai 14. joulukuuta 2017, 15.00

Paikka: Mattilanniemi, Agora Beeta

Elena Ivannikovan tietotekniikan väitöskirjan "Intelligent solutions for real-life data-driven applications" tarkastustilaisuus. Vastaväittäjänä dosentti Xiao-Zhi Gao (Aalto-yliopisto) ja kustoksena professori Timo Hämäläinen (Jyväskylän yliopisto). Väitöstilaisuus on englanninkielinen.

ElenaIvannikovanettikuvaajaRufinaValievaSpiceIcePhotography.jpg
Elena Ivannikova kuva: Rufina Valieva / Spice and Ice Photography
Elena Ivannikovan tietotekniikan väitöskirjan "Intelligent solutions for real-life data-driven applications" tarkastustilaisuus. Vastaväittäjänä dosentti Xiao-Zhi Gao (Aalto-yliopisto) ja kustoksena professori Timo Hämäläinen (Jyväskylän yliopisto). Väitöstilaisuus on englanninkielinen.

Koneoppiminen on tehokas työkalu suurta tietojenkäsittelyä vaativissa tehtävissä, joissa oman ohjelman kirjoittaminen ongelman ratkaisemiseksi on vaikeaa tai jopa mahdotonta. Koneoppiminen voidaan katsoa lähestymistavaksi, joka oppii ja tekee itse ohjelmia käsittelemistään tiedoista. Kaikkien koneoppimisalgoritmien yhteinen tavoite on kerätä hyödyllistä tietoa datasta ja hyödyntää sitä ongelmien ratkaisemiseksi.

- Koneoppimisalgoritmit voidaan jakaa karkeasti kahteen kategoriaan eli valvottuun ja ei-valvottuun koneoppimiseen. Valvottua oppimista käytetään ennakointi- ja luokittelutehtävissä, joissa oppimiseen liittyvät esimerkkitunnisteet tunnetaan etukäteen. Ei-valvottu oppiminen viittaa tilanteeseen, jossa tunnisteita ei ole saatavilla ennakkoon. Tässä tapauksessa yleiset rakenteet löydetään datasta, Ivannikova kertoo. 

Koneoppiminen vastaa teollisuuden tarpeisiin

Teollisuus etsii jatkuvasti parempia menetelmiä tuotantoonsa ja kustannustensa minimointiin, johon koneoppiminen on hyvä työkalu suuria tietomassoja käsitellessä. Tähän liittyen tutkimuksessa esitetään tapaustutkimuksia, joissa ehdotetaan matemaattisia malleja paperin laadun ennustamiseksi.

Väitöskirjan muut julkaisut kohdistuvat ilman valvontaa tapahtuvaan koneoppimiseen. Pääpaino on samankaltaisuuksien havainnointiin tarkoitettujen tekniikoiden kehittämisessä erilaisia yhteisöjä ja poikkeavuuksia varten.

- Painopisteenä on ollut poikkeamienhavainnointialgoritmien kehittäminen tietoverkoissa. Tässä yhteydessä työssä esitetään todennäköisyyteen perustuva siirtymäpohjainen lähestymistapa sovelluskerroksen hajautetun palvelunestohyökkäyksen havaitsemiseksi, Ivannikova sanoo.

Kehitettyjä lähestymistapoja on testattu todellisella verkkoliikenteellä ja ne kykenevät tehokkaisiin ratkaisuihin. Väitöskirjassa esitetyt menetelmät ovat sovellettavissa muuttujan valinnan, kaavion segmentoinnin ja poikkeamien havainnointiin erilaisissa sovelluksissa.

Lisätietoja:

Elena Ivannikova, +358440334430, elena.v.ivannikova@student.jyu.fi

Viestintäpäällikkö Liisa Harjula, 040 8054403, viestinta@jyu.fi

Elenva Ivannikova sai Master of Science in Applied Mathematics -tutkintonsa vuonna 2004 Demidov Yaroslavl State Universitystä Venäjällä. Vuosina 2004–2010 hän työskenteli ohjelmistoinsinöörinä Confirmitillä. Vuonna 2012 hän sai toisen maisterintutkintonsa Jyväskylän yliopistosta informaatioteknologiasta. Valmistumisensa jälkeen Ivannikova aloitti tohtoriopintonsa.

Teos on julkaistu sarjassa Jyväskylä Studies in Computing,  ISSN 1456-5390;  Number 270;  Pages: 54 p. (+included articles) ISBN 978-951-39-7278-3 (nid.) ISBN 978-951-39-7279-0 (PDF).

Abstract

The subject of this thesis belongs to the topic of machine learning or, specifically, to the development of advanced methods for regression analysis, clustering, and anomaly detection. Industry is constantly seeking improved production practices and minimized production time and costs. In connection to this, several industrial case studies are presented in which mathematical models for predicting paper quality were proposed. The most important variables for the prediction models are selected based on information-theoretic measures and regression trees approach. 

The rest of the original papers are devoted to unsupervised machine learning. The main focus is developing advanced spectral clustering techniques for community detection and anomaly detection. As part of these efforts, a number of enhancements for the dependence clustering algorithm have been proposed. These enhancements include adding regularization for controlling the size of clusters, extension to the ensemble version for improving model stability, handling overlapping clusters, and adaptation to solving anomaly detection problems and handling big datasets. Another focus of the thesis is on developing anomaly detection algorithms for network security data. In connection to this, a probabilistic transition-based approach is proposed for detecting application-layer distributed denial-of-service attacks. 

The developed approaches are tested on real datasets and are capable of efficiently solving the given tasks with high accuracy and good performance. They are shown to be applicable to solving variable selection, graph segmentation, and anomaly detection tasks in different applications.

Lisätietoja

Elena Ivannikova
elena.v.ivannikova@student.jyu.fi
kuuluu seuraaviin kategorioihin: