Turku Komi-Permyak Corpus (TuKPC)
Avainsanat: kirjakieli, lehtitekstit, kaunokirjallisuus, akateeminen kieli
Turku Komi-Permyak corpus v1.0 on kokoelma kominkielistä kirjallisuuttta. Se sisältää enimmäkseen fiktiota (kaunokirjallisuutta, runoutta ja näytelmäkirjallisuutta), mutta myös jonkin verran akateemisia tekstejä ja lehtitekstejä.
Korpus sisältää noin 3 011 000 sanetta.
Korpuksen on luonut Jorma Luutonen Enye Lavin keräämien tekstien pohjalta. Se on käytettävissä Finno-Ugric Corpora portal -käyttöliittymän kautta.
Aineiston tiedot
- kieli: komipermjakki
- aineiston muoto: kirjoitettu kieli
- tekstilaji: kaunokirjallisuus, lehtitekstit, lyriikka, näytelmät, tieteelliset tekstit
- aineiston koko: n. 3 011 000 sanetta
| Jorma Luutonen | koordinaattori |
| Enye Lav | tutkija |
Saatavilla osoitteessa
Yhteyshenkilö
| Jussi Ylikoski | volgaserver *at* utu.fi |
Viittausohje
Viittauksen korpukseen tulisi sisältää seuraavat osat:
- korpuksen nimi: Turku Komi-Permyak Corpus
- korpuksen nimen lyhenne: TuKPC
- viittauskohteen rivinumero tekstissä
Korpuksen tekstien nimille ei ole ennalta määrättyjä lyhenteitä. Voit muodostaa lyhenteet itse.
Jos käytät korpusta Finno-Ugric Corpora portal -käyttöliittymän kautta, tietoa teksteistä on saatavilla seuraavalla tavalla: Tehtyäsi tiedustelun paina tekstin tunnistetta (esim. A67) sarakkeessa "Text". Näin näet tekstin nimen, joka sisältää myös julkaisun nimen.
Korpuksen tekstitiedostojen alkuperäiset rivinumerot ovat nähtävillä tiedustelun tuloksissa muodossa "8323:", "8324:" jne. Niiden avulla voit tarkentaa sijaintia tietyssä tekstissä.