Kaisa_2012_3_photo by Veikko Somerpuro

Ilmoittaudu
29.11.2016 klo 08:00 - 10.3.2017 klo 23:59

Aikataulu

Tästä osiosta löydät kurssin opetusaikataulun. Tarkista mahdolliset muut aikataulut kuvauksesta.

PäivämääräAikaOpetuspaikka
Ma 13.3.2017
12:15 - 13:45
To 16.3.2017
10:15 - 11:45
Ma 20.3.2017
12:15 - 13:45
To 23.3.2017
10:15 - 11:45
Ma 27.3.2017
12:15 - 13:45
To 30.3.2017
10:15 - 11:45
Ma 3.4.2017
12:15 - 13:45
To 6.4.2017
10:15 - 11:45
Ma 10.4.2017
12:15 - 13:45
To 20.4.2017
10:15 - 11:45
Ma 24.4.2017
12:15 - 13:45
To 27.4.2017
10:15 - 11:45
To 4.5.2017
10:15 - 11:45

Kuvaus

Opintojakso on pakollinen pää- ja sivuaineopiskelijoille.

CLT237 (Ohjelmointi ja luonnollisen kielen käsittely 1) ja CLT238 (Ohjelmointi ja luonnollisen kielen käsittely 2) tai vastaavat tiedot

Osallistujat oppivat soveltamaan tilastollisia menetelmiä erilaisiin luonnollisen kielen käsittely osatehtäviin sekä saavat alustavan käsityksen näiden menetelmien perustana olevasta todennäköisyyslaskennasta, tilastotieteestä ja koneoppimisesta.

Kurssin kohteina ovat esim. saneistus (tokenization), virkkeiksi jakaminen, dokumenttien luokittelu, oikeinkirjoituksen korjaaminen, tiedon eristäminen, jäsentäminen ja automaattinen kysymyksiin vastaaminen sekä kielimallien ja perustavanlaatuisten algoritmien kuten n-grammeihin perustuvat kielimallit, naiivit Bayesin ja entropiaan perustuvat luokittimet, Markovin piilomallit sekä probabilistinen dependenssijäsentäminen ja lausekerakennekielioppien mukainen jäsentäminen.

harjoituksia ja harjoitustyö

Verkkomateriaalia ja osia teoksista: Stephen Bird, Ewan Klein and Edward Loper, Natural Language Processing with Python (vapaasti verkossa luettavissa), Chris Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing (MIT Press, 1999).

Yleinen arviointiasteikko.

Yliopistonlehtori