Kaisa_2012_3_photo by Veikko Somerpuro

Enrol
29.11.2016 at 08:00 - 10.3.2017 at 08:00

Timetable

Here is the course’s teaching schedule. Check the description for possible other schedules.

DateTimeLocation
Tue 14.3.2017
14:15 - 15:45
Thu 16.3.2017
12:15 - 13:45
Tue 21.3.2017
14:15 - 15:45
Thu 23.3.2017
12:15 - 13:45
Tue 28.3.2017
14:15 - 15:45
Thu 30.3.2017
12:15 - 13:45
Tue 4.4.2017
14:15 - 15:45
Thu 6.4.2017
12:15 - 13:45
Tue 11.4.2017
14:15 - 15:45
Thu 13.4.2017
12:15 - 13:45
Thu 20.4.2017
12:15 - 13:45
Tue 25.4.2017
14:15 - 15:45
Thu 27.4.2017
12:15 - 13:45
Tue 2.5.2017
14:15 - 15:45
Thu 4.5.2017
12:15 - 13:45

Description

Mikäli halukkaita on enemmän kuin ryhmään mahtuu, osallistuja ei valita ilmoittautumisjärjestyksen perusteella, vaan etusijalla ovat 1) yleisen kielitieteen ja kieliteknologian pääaineopiskelijat, 2) yleisen kielitieteen ja kieliteknologian sivuaineopiskelijat / Digitaalinen humanismi -kokonaisuutta suorittavat , 3) muut

Saada yleiskuva siitä, miten tekstikorpuksia voidaan käsitellä valmiiden ohjelmien (kuten Natural Language Tool kit, NLTK) avulla sekä totutella siihen, että itse voi enemmänkin vaikuttaa siihen, millaisia tuloksia saa

ensimmäisen opiskeluvuoden keväällä

Valmiin ohjelman (kuten NLTK:n) puitteissa havainnollistetaan esim. tekstiä sanojen muodostaman jonona, sanoja merkkijonona, jonon alkioiden osoittamista (indeksointia), sananmuotojen frekvenssien laskemista, tekstikorpuksen käyttöä, sanaparien (bigrammien) frekvenssejä, sanojen ehdollisia frekvenssejä viereisen sanan suhteen, kollokaatioiden tunnistamista, tekstigenrejä, sanojen annotaatiota (part of speech tags), annotoitujen korpusten tutkimista, digitaalisia leksikoita, sanalistoja, hukkasanalistoja, sanojen alamerkityksiä ja käsitetietokantoja (WordNet).

harjoitustehtäviä

verkkomateriaalia ja Stephen Bird, Ewan Klein, Edward Loper, Natural Language Processing with Python (vapaasti verkossa luettavissa). (NLTK on avointa lähdekoodia ja kirjakin vapaasti verkossa luettavissa.)

yleinen arvosteluasteikko

Harjoitusryhmät: ryhmä 1 ti 14-16, ryhmä 2 to 12-14

yliopistonlehtori