Prosovar - suomen kielen prosodian alueellisen ja sosiaalisen variaation korpus

Avainsanat: murteet, elisitoidut äänitystehtävät, prosodia, puhekieli

Suomen kielen prosodian alueellisen ja sosiaalisen variaation tutkimushanke (Prosovar) on Koneen säätiön rahoittama projekti, jonka yksi päätavoitteista on ollut koostaa ensimmäinen suomen kielen prosodian variaation tarkasteluun tarkoitettu korpus. Taustana tälle on, että vaikka puhuttua suomea ja sen variaatiota on tutkittu runsaasti, prosodian ja sen variaation tutkimus on ollut yksittäisiä poikkeuksia lukuun ottamatta niukkaa.

Prosovar-hankkeessa äänitteitä kartutettiin uutta korpusta varten elisitoiduin äänitystehtävin verkkokeruun avulla. Keruun toteuttamiseksi hankkeessa luotiin kokonainen oma aineistonkeruusivusto ja kehitettiin tätä varten äänentallennussovelluksia, jotka mahdollistivat informanttien äänen tallentamisen omilta tietokoneiltaan ja mobiililaitteiltaan. Sivustolle kuka tahansa kiinnostunut pystyi luomaan oman käyttäjätunnuksen, kunhan hän hyväksyi käyttöehdot ja antoi luvan käyttää tieteelliseen tarkoitukseen omalta tietokoneeltaan äänittämiään äänitekatkelmia. Elisitoiduissa tehtävissä informanteille esitettiin visuaalisia, auditiivisia ja tekstuaalisia ärsykkeitä, joihin informanttien piti reagoida verbaalisesti. Nämä reaktiot äänitettiin. Vapaaehtoisia osallistujia kehotettiin käyttämään sellaista kieltä kuin he käyttäisivät tavallisessa arkipäiväisessä vuorovaikutuksessa. Sivustolla kerättiin aineistoa 8.4.2014–31.12.2016, ja ääntään kävi tallentamassa 440 informanttia. Heiltä karttui äänitekorpukseen eri elisitoiduista tehtävistä yhteensä yli 5700 näytettä.

Aineisto on koostettu ennen muuta suomen prosodian ja sen variaation tutkimukseen, mutta yhtä lailla se soveltuu esimerkiksi kansanlingvististen tutkimusten aineistoksi. Aineistoa on mahdollista käyttää myös dialektologisissa tai sosiolingvistisissä tutkimuksissa, joissa tarkasteltavana ovat segmentaaliset tai suprasegmentaaliset ilmiöt.

Aineiston tiedot

Sisältö
  • kieli: suomi
  • aineiston muoto: puhuttu kieli, informanttien taustatiedot sisältävä tietokanta
  • tekstilaji: puhekieli
  • aineiston koko: n. 5 700 äänitekatkelmaa
  • aineiston aikajänne: 2014–2016
Annotointi
  • prosodia
Tekijät
Tommi Kurkiperustaja ja hankkeen vastuullinen johtaja
Tommi Nieminenperustaja ja ohjausryhmän jäsen
Hamid Behravanprojektitutkija
Saatavuus
Aineisto on käytettävissä ottamalla yhteyttä yhteyshenkilöön

Yhteyshenkilö

Tommi Kurkitommi.kurki *at* utu.fi

Muuta huomioitavaa

sisältää henkilötietoja
Viittaaminen
Aineiston pysyväisosoite