Lauseopin arkiston murrekorpus
Avainsanat: murteet
Litteroiduista murrehaastatteluista koostuva korpus, joka a) kattaa kaikki Suomen murrealueet, b) sisältää 70 190 virkettä, 193 947 lausetta, 1 078 183 sanaa ja käsittää 133 pitäjää ja c) joka on Suomen ensimmäinen morfologisesti ja syntaktisesti koodattu kieliaineisto. Murrekorpus on kehitetty Turun yliopiston ja Kotimaisten kielten (tutkimus)keskuksen yhteistyönä.
Lauseopin arkiston murrekorpus edustaa kaikkia nykyisen Suomen alueella puhuttuja suomen kielen murteita sekä lisäksi niitä murteita, joita puhuttiin Neuvostoliitolle viime sotien yhteydessä luovutetuilla alueilla ennen alueiden luovuttamista.
Puhujat ovat syntyneet vuosina 1860–1910 (suurin osa 1880-luvulla), ja haastattelut on tehty 1950–1970-luvuilla, jolloin puhujat ovat olleet keskimäärin 80-vuotiaita.
Yhdestä pitäjänmurteesta on yleensä valittu käsiteltäväksi yksi noin tunnin laajuinen äänite. Murreaineisto on litteroitu sekä koodattu morfologisesti ja syntaktisesti.
Aineiston tiedot
- kieli: suomi
- aineiston muoto: äänitteet, litteraatit
- tekstilaji: haastattelu
- aineiston koko: 133 tuntia ääntä, 133 tekstiä (70 190 virkettä, 1 078 183 sanaa)
- aineiston aikajänne: 1952–1974
Noin 85 % äänitteistä on 1960-luvulta: 1950-luvulta on 9 äänitettä, 1960-luvulta 119 äänitettä ja 1970-luvulta 14 äänitettä.
- lemma
- morfologia
- syntaksi
| Osmo Ikola | perustaja ja hankkeen alkuperäinen johtaja |
| Nobufumi Inaba | Lauseopin arkiston erikoistutkija |
| Marja-Liisa Helasvuo | Lauseopin arkiston johtoryhmän puheenjohtaja ja oppiaineen esimies |
| Tommi Kurki | Lauseopin arkiston johtoryhmän jäsen |
Saatavilla osoitteessa
Yhteyshenkilö
| Nobufumi Inaba | ninaba *at* utu.fi |