Turku Izhevsk Corpus
Avainsanat: kirjakieli, lehtitekstit
Turku Izhevsk Corpus sisältää noin 11 000 udmurtinkielistä tekstiä yhdestä sanomalehdestä ja viidestä aikakauslehdestä:
- Udmurt dunne: 10 366 tekstiä vuosilta 1997–2001
- Dzhetshbur: 152 tekstiä
- Vordskem kyl: 139 tekstiä
- Invozho: 130 tekstiä
- Kenesh: 116 tekstiä
- Kizili: 116 tekstiä
Saneiden määrä korpuksessa on noin 4 232 000.
Korpuksen kehittivät yhteistyössä Turun yliopiston Volgan alueen kielten tutkimusyksikkö sekä Udmurtian historia-, kieli- ja kirjallisuusinstituutin kielten laitos (Izhevsk).
Korpus on käytettävissä Finno-Ugric Corpora portal -käyttöliittymän kautta.
Lisätietoja korpuksesta on saatavilla alempaa sivulta löytyvästä englanninkielisestä tiedostosta.
Aineiston tiedot
Sisältö
- kieli: udmurtti
- aineiston muoto: kirjoitettu kieli
- tekstilaji: lehtitekstit
- aineiston koko: 11 000 tekstiä, 4 232 000 sanetta
- aineiston aikajänne: 1997–2002
Tekijät
| Jorma Luutonen | koordinaattori |
Saatavuus
Saatavilla osoitteessa
Yhteyshenkilö
| Jussi Ylikoski | volgaserver *at* utu.fi |