Turku Komi-Permyak Corpus (TuKPC)

Avainsanat: kirjakieli, lehtitekstit, kaunokirjallisuus, akateeminen kieli

Turku Komi-Permyak corpus v1.0 on kokoelma kominkielistä kirjallisuuttta. Se sisältää enimmäkseen fiktiota (kaunokirjallisuutta, runoutta ja näytelmäkirjallisuutta), mutta myös jonkin verran akateemisia tekstejä ja lehtitekstejä.

Korpus sisältää noin 3 011 000 sanetta.

Korpuksen on luonut Jorma Luutonen Enye Lavin keräämien tekstien pohjalta. Se on käytettävissä Finno-Ugric Corpora portal -käyttöliittymän kautta. 

Aineiston tiedot

Sisältö
  • kieli: komipermjakki
  • aineiston muoto: kirjoitettu kieli
  • tekstilaji: kaunokirjallisuus, lehtitekstit, lyriikka, näytelmät, tieteelliset tekstit
  • aineiston koko: n. 3 011 000 sanetta
Tekijät
Jorma Luutonenkoordinaattori
Enye Lavtutkija
Saatavuus

Yhteyshenkilö

Jussi Ylikoskivolgaserver *at* utu.fi
Viittaaminen

Viittausohje

Viittauksen korpukseen tulisi sisältää seuraavat osat:

  • korpuksen nimi: Turku Komi-Permyak Corpus
  • korpuksen nimen lyhenne: TuKPC
  • viittauskohteen rivinumero tekstissä

Korpuksen tekstien nimille ei ole ennalta määrättyjä lyhenteitä. Voit muodostaa lyhenteet itse.

Jos käytät korpusta Finno-Ugric Corpora portal -käyttöliittymän kautta, tietoa teksteistä on saatavilla seuraavalla tavalla: Tehtyäsi tiedustelun paina tekstin tunnistetta (esim. A67) sarakkeessa "Text". Näin näet tekstin nimen, joka sisältää myös julkaisun nimen.

Korpuksen tekstitiedostojen alkuperäiset rivinumerot ovat nähtävillä tiedustelun tuloksissa muodossa "8323:", "8324:" jne. Niiden avulla voit tarkentaa sijaintia tietyssä tekstissä.