1 kommentti

korpustutkimus

3.2.2010 10:32

Hyvä bloggaaja,

Olemme turkulainen tutkimusryhmä joka työskentelee suomenkielisen tekstin ja sen automaattisen käsittelyn,
erityisesti jäsentämisen, parissa. Rakennamme elektronista tekstikokoelmaa, korpusta, johon lisäämme muiden
tekstilajien ohella myös blogitekstiä. Olemme valinneet blogisi niiden joukkoon, joiden tekstiä haluaisimme
lisätä korpukseen, eli olisimme kiinnostuneita lisäämään tähän mennessä kirjoittamaasi tekstiä noin kahdensadan
lauseen verran. Mitään tekstiä ei lisätä kokoelmaan sellaisenaan, vaan lauseisiin lisätään syntaktiset analyysit
(ks. esimerkkejä: http://bionlp.utu.fi/static/fintreebank-online/w002.html) ja ne muodostavat korpuksen yhdessä
tuhansien muiden lauseiden kanssa.

Jos olet kiinnostunut osallistumaan, lisätietoja saat osoitteesta http://bionlp.utu.fi/writers.html. Jos olet
tämän luettuasi edelleen kiinnostunut, pyytäisimme vastausta mahdollisimman pian, mieluiten kahden viikon
kuluessa.

Mielenkiinnostasi kiittäen,
Turun yliopiston korpustutkimusryhmän puolesta
Katri Haverinen