Bible paper by Dave Bullock CC BY 2.0

Ilmoittaudu
1.1.2017 klo 08:00 - 31.3.2017 klo 23:59

Aikataulu

Tästä osiosta löydät kurssin opetusaikataulun. Tarkista mahdolliset muut aikataulut kuvauksesta.

PäivämääräAikaOpetuspaikka
Ti 14.3.2017
16:15 - 17:45
To 16.3.2017
14:15 - 15:45
Ti 21.3.2017
16:15 - 17:45
To 23.3.2017
14:15 - 15:45
Ti 28.3.2017
16:15 - 17:45
To 30.3.2017
14:15 - 15:45
Ti 4.4.2017
16:15 - 17:45
To 6.4.2017
14:15 - 15:45
Ti 11.4.2017
16:15 - 17:45
To 13.4.2017
14:15 - 15:45
Ti 18.4.2017
16:15 - 17:45
To 20.4.2017
14:15 - 15:45
Ti 25.4.2017
16:15 - 17:45
To 27.4.2017
14:15 - 15:45
Ti 2.5.2017
16:15 - 17:45
To 4.5.2017
14:15 - 15:45

Kuvaus

Tilastomenetelmät kielentutkimuksessa -kurssin tavoitteena on antaa perustiedot ja - taidot tilastollisesta lähestymistavasta kielitieteessä. Kurssin suoritettuaan opiskelija ymmärtää tilastollisen tutkimuksen perusteet kielitieteeseen sovellettuna sekä alan keskeiset erityiskysymykset, osaa tilastomatematiikan perustaitoja ja osaa lisäksi käyttää yksinkertaisia tilastollisia menetelmiä R-ohjelmointiympäristössä. Opintojakso kuuluu yleisen kielitieteen oppiaineen valinnaisiin kursseihin ja sen voi halutessaan sisällyttää aine-, syventäviin tai jatko-opintoihin (soveltuvana erikoiskurssina). Kieliteknologian opiskelijoille kurssin suorittaminen korvaa kurssin Tulosten esittäminen ja niiden arviointi tilastomenetelmillä (CLT255). Myös muiden oppiaineiden pääaineopiskelijat ovat tervetulleita kurssille.

CLT261 Kielen morfologisen käsittelyn työkalut 1 ja CLT237 Ohjelmointi ja luonnollisen kielen käsittely 1 tai vastaavat tiedot ja taidot

Tavoitteena on antaa kieliteknologeille todennäköisyyslaskennan ja tilastomatematiikan perustaitoja määrällistä tietoa käsittelevän harjoitustyön, opinnäytteen tai artikkelin laatimiseksi.

Osallistujilta edellytetään kurssien Fonologian ja morfologian harjoituskurssi (CYK130) sekä Syntaksin harjoituskurssi (CYK140) suorittaminen tai vastaavat tiedot. Laskennassa käytetään R-tilasto-ohjelmaa, jonka voi ladata vapaasti verkosta. Esitietoja ohjelman käytöstä ei vaadita, vaan tarvittavat tiedot opetetaan luennoilla ja kurssimateriaalin avulla.

Luennot koostuvat tiiviistä teoriaosuudesta sekä kieliaineiston havainnollisesta tilastollisesta analyysista. Kurssilla käsitellään korpusaineistoja, sosiolingvististä aineistoa sekä typologisia tietokantoja. Kurssin sisältö kattaa mm. seuraavat aiheet: otanta, aineiston tarkastelu ja visualisointi, assosiaatiot ja korrelaatiot, johtopäätösten tekeminen ja testaaminen sekä tilastollinen merkitsevyys. Kurssi ei ole yleinen johdatus tilastomatematiikkaan eikä R-tilasto-ohjelmaan, vaan se antaa valmiuksia ymmärtää ja käyttää kielentutkimukseen sopivia tilastomenetelmiä (mm. khiin neliö ja korrelaatiotestit) ja jatkaa menetelmien opiskelua itsenäisesti.

1. luennot ja harjoitustehtävät

* Aika: tiistaisin klo 16-18 ja torstaisin klo 14-16

* Paikka: (ilmoitetaan myöhemmin)

* Kesto: 14.3. – 4.5.2017 (4. periodi; huom. opetusta ei 28.3., 30.3., 13.4. ja 25.4.)

2. oppimispäiväkirja ja oheiskirjallisuus

* Oheiskirjallisuutta (lisätietoa kurssin alussa) tulee noin 200 sivua.

* Oppimispäiväkirja kirjoitetaan luentojen ja oheiskirjallisuuden perusteella. Sisällöstä ja palautuksesta annetaan lisätietoa kurssin alussa.

3. harjoitustyö

* Kurssin suoritukseen kuuluu harjoitustyön tekeminen, jossa käytetään omaa tai opettajan antamaa aineistoa. Aiheesta ja aineistosta sovitaan erikseen opettajan kanssa. Palautus 14. toukokuuta 2017 mennessä.

Verkkomateriaalia ja oheislukemistona osia teoksesta: R. H. Baayen, Word Frequency Distributions, Kluwer Academic Publishers, Dordrecht, 2001.

yleinen arviointiasteikko

professori