Kaisa_2012_3_photo by Veikko Somerpuro

Anmäl dig
29.11.2016 kl. 08:00 - 10.3.2017 kl. 23:59

Tidsschema

I den här delen hittar du kursens tidsschema. Kontrollera eventuella andra tider i beskrivning.

DatumTidPlats
mån 13.3.2017
12:15 - 13:45
tors 16.3.2017
10:15 - 11:45
mån 20.3.2017
12:15 - 13:45
tors 23.3.2017
10:15 - 11:45
mån 27.3.2017
12:15 - 13:45
tors 30.3.2017
10:15 - 11:45
mån 3.4.2017
12:15 - 13:45
tors 6.4.2017
10:15 - 11:45
mån 10.4.2017
12:15 - 13:45
tors 20.4.2017
10:15 - 11:45
mån 24.4.2017
12:15 - 13:45
tors 27.4.2017
10:15 - 11:45
tors 4.5.2017
10:15 - 11:45

Beskrivning

Opintojakso on pakollinen pää- ja sivuaineopiskelijoille.

CLT237 (Ohjelmointi ja luonnollisen kielen käsittely 1) ja CLT238 (Ohjelmointi ja luonnollisen kielen käsittely 2) tai vastaavat tiedot

Osallistujat oppivat soveltamaan tilastollisia menetelmiä erilaisiin luonnollisen kielen käsittely osatehtäviin sekä saavat alustavan käsityksen näiden menetelmien perustana olevasta todennäköisyyslaskennasta, tilastotieteestä ja koneoppimisesta.

Kurssin kohteina ovat esim. saneistus (tokenization), virkkeiksi jakaminen, dokumenttien luokittelu, oikeinkirjoituksen korjaaminen, tiedon eristäminen, jäsentäminen ja automaattinen kysymyksiin vastaaminen sekä kielimallien ja perustavanlaatuisten algoritmien kuten n-grammeihin perustuvat kielimallit, naiivit Bayesin ja entropiaan perustuvat luokittimet, Markovin piilomallit sekä probabilistinen dependenssijäsentäminen ja lausekerakennekielioppien mukainen jäsentäminen.

harjoituksia ja harjoitustyö

Verkkomateriaalia ja osia teoksista: Stephen Bird, Ewan Klein and Edward Loper, Natural Language Processing with Python (vapaasti verkossa luettavissa), Chris Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing (MIT Press, 1999).

Yleinen arviointiasteikko.

Yliopistonlehtori