MokshEr Corpus
Avainsanat: kirjakieli, lehtitekstit, kaunokirjallisuus
MokshEr-korpus sisältää sanoma- ja aikakauslehtiartikkeleita vuosilta 2002–2009 sekä muutamia kaunokirjallisia teoksia. Tekstejä ei ole annotoitu.
Ersänkieliset tekstit ovat peräisin aikakauslehdestä Syatko (2003–2004, 2006–2008) sekä sanomalehdistä Erzyan pravda (2005–2008) ja Erzyan mastor (2003–2009).
Mokšankieliset tekstit ovat aikakauslehdistä Moksha (2002–2003, 2005–2007) ja Yakster tyashtenya (2005) sekä sanomalehdestä Mokshen pravda (2002–2005).
Korpus on käytettävissä Finno-Ugric Corpora portal -käyttöliittymän kautta.
Aineiston tiedot
Sisältö
- kieli: ersä, mokša
- aineiston muoto: kirjoitettu kieli
- tekstilaji: kaunokirjallisuus, lehtitekstit
- aineiston koko: 4 291 tekstiä (ersä: 2 991 tekstiä, n. 2 785 000 sanetta. mokša 1 300 tekstiä, n. 1 742 000 sanetta)
- aineiston aikajänne: 2002–2009
Saatavuus
Saatavilla osoitteessa
Yhteyshenkilöt
| Jussi Ylikoski | volgaserver *at* utu.fi |