Turku Izhevsk Corpus

Avainsanat: kirjakieli, lehtitekstit

Turku Izhevsk Corpus sisältää noin 11 000 udmurtinkielistä tekstiä yhdestä sanomalehdestä ja viidestä aikakauslehdestä:

  • Udmurt dunne: 10 366 tekstiä vuosilta 1997–2001
  • Dzhetshbur: 152 tekstiä
  • Vordskem kyl: 139 tekstiä
  • Invozho: 130 tekstiä
  • Kenesh: 116 tekstiä
  • Kizili: 116 tekstiä

Saneiden määrä korpuksessa on noin 4 232 000.

Korpuksen kehittivät yhteistyössä Turun yliopiston Volgan alueen kielten tutkimusyksikkö sekä Udmurtian historia-, kieli- ja kirjallisuusinstituutin kielten laitos (Izhevsk).

Korpus on käytettävissä Finno-Ugric Corpora portal -käyttöliittymän kautta. 

Lisätietoja korpuksesta on saatavilla alempaa sivulta löytyvästä englanninkielisestä tiedostosta.

Aineiston tiedot

Sisältö
  • kieli: udmurtti
  • aineiston muoto: kirjoitettu kieli
  • tekstilaji: lehtitekstit
  • aineiston koko: 11 000 tekstiä, 4 232 000 sanetta
  • aineiston aikajänne: 1997–2002
Tekijät
Jorma Luutonenkoordinaattori
Saatavuus

Yhteyshenkilö

Jussi Ylikoskivolgaserver *at* utu.fi

Korpuksen tarkempi kuvaus (englanninkielinen pdf-tiedosto)