Bible paper by Dave Bullock CC BY 2.0

Enrol
29.11.2016 at 08:00 - 10.3.2017 at 23:59

Timetable

Here is the course’s teaching schedule. Check the description for possible other schedules.

DateTimeLocation
Mon 13.3.2017
12:15 - 13:45
Thu 16.3.2017
10:15 - 11:45
Mon 20.3.2017
12:15 - 13:45
Thu 23.3.2017
10:15 - 11:45
Mon 27.3.2017
12:15 - 13:45
Thu 30.3.2017
10:15 - 11:45
Mon 3.4.2017
12:15 - 13:45
Thu 6.4.2017
10:15 - 11:45
Mon 10.4.2017
12:15 - 13:45
Thu 20.4.2017
10:15 - 11:45
Mon 24.4.2017
12:15 - 13:45
Thu 27.4.2017
10:15 - 11:45
Thu 4.5.2017
10:15 - 11:45

Description

Opintojakso on pakollinen pää- ja sivuaineopiskelijoille.

CLT237 (Ohjelmointi ja luonnollisen kielen käsittely 1) ja CLT238 (Ohjelmointi ja luonnollisen kielen käsittely 2) tai vastaavat tiedot

Osallistujat oppivat soveltamaan tilastollisia menetelmiä erilaisiin luonnollisen kielen käsittely osatehtäviin sekä saavat alustavan käsityksen näiden menetelmien perustana olevasta todennäköisyyslaskennasta, tilastotieteestä ja koneoppimisesta.

Kurssin kohteina ovat esim. saneistus (tokenization), virkkeiksi jakaminen, dokumenttien luokittelu, oikeinkirjoituksen korjaaminen, tiedon eristäminen, jäsentäminen ja automaattinen kysymyksiin vastaaminen sekä kielimallien ja perustavanlaatuisten algoritmien kuten n-grammeihin perustuvat kielimallit, naiivit Bayesin ja entropiaan perustuvat luokittimet, Markovin piilomallit sekä probabilistinen dependenssijäsentäminen ja lausekerakennekielioppien mukainen jäsentäminen.

harjoituksia ja harjoitustyö

Verkkomateriaalia ja osia teoksista: Stephen Bird, Ewan Klein and Edward Loper, Natural Language Processing with Python (vapaasti verkossa luettavissa), Chris Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing (MIT Press, 1999).

Yleinen arviointiasteikko.

Yliopistonlehtori