Miljardin sanan syntaksianalyysi tutkimuksen tarpeisiin

13.05.2014

Turun yliopiston Veronika Laippalan ja Filip Ginterin Kielitieteen päivien kutsuesitelmä kantoi nimeä Suomenkielinen internet kieliaineistoksi – miljardin sanan syntaksianalyysi ja entäs sitten?

​Tutkimuksessa pyritään keräämään koko suomenkielinen internet kieliaineistoksi, joka on tutkijoiden vapaasti hyödynnettävissä.

Korpuksen eli tekstikokoelman avulla on mahdollista tutkia esimerkiksi kielen syntaksia sekä sanojen samankaltaisuutta.

– Tähän mennessä on analysoitu 115 miljoonaa lausetta, 1,5 miljardia sanaa sekä 6 miljoonaa sivua, ja projektin on tarkoitus valmistua vuonna 2016, Ginter kertoi.

Uusia välineitä suomalaisen viittomakielen kuvaamiseen

Perjantain työpajoissa kuultiin muun muassa tuoreesta suomalaisen viittomakielen tutkimuksesta.

Jorma Laaksonen Aalto-yliopistosta kertoi viittomakielivideoiden automaattisesta analysoinnista CoBaSiL-tutkimusprojektissa, jota voidaan hyödyntää viittomakielen lingvistisessä tutkimuksessa.

Tutkimuksessa on analysoitu esimerkiksi viittojien suun asentoa, silmien avoimuutta sekä pään liikkeitä.

Jyväskylän yliopiston akatemiatutkija Tommi Jantusen tutkimus puolestaan käsittelee viittoman kestoa, sen alkua ja loppua viittomakielen kuvaamisen näkökulmasta.

Perinteisen käsityksen mukaan viittoman kesto mielletään yhteneväksi käden liikkeen keston kanssa, mutta uudempi suuntaus huomioi myös muiden viittomakielen rakennepiirteiden keston.

Jantusen mukaan tietyt rakennepiirteet, kuten huulio, käsimuoto ja orientaatio ovat paitsi valmiina jo ennen käden liikettä, myös havaittavissa vielä sen jälkeen.

Turun yliopistossa 8.–10.5. järjestettyjen Kielitieteen päivien teemana oli Kieli ja kielitiede teknistyvässä maailmassa.

Jo 41. kertaa järjestetty konferenssi esitteli uusinta kielitieteellistä tutkimusta laidasta laitaan.

 

Teksti: Aura Jaakkola

Luotu 13.05.2014 | Muokattu 20.07.2021