Hanna-Mari Kupari profiilikuva
Hanna-Mari
Kupari
väitöskirjatutkija, digitaalinen kielentutkimus, espanja, italia, kiina, ranska, saksa
filosofian maisteri - Master of Arts
Keskiajan latinan tutkimus korpuslingvistiikan metodeilla

Ota yhteyttä

Arcanuminkuja 1
20500
Turku

Asiantuntijuusalueet

Latina
keskiaika
korpuslingvistiikka
TEI-xml
automaattinen morfosyntaktinen jäsentäminen

Opetus

KKLT0040-3004 Korpuksia ja kieliteknologiaa kurssi perustutkinto-opiskelijoille, syksy 2023. Viisi luentoa. Käsiteltävät aihepiirit: opiskelijaprojekti, eettiset näkökulmat ja generatiiviset kielimallit, nimitettyjen entiteettien tunnistus, sentimenttianalyysi, automaattinen morfosyntaktinen jäsennys, kielen esittäminen vektoreina sekä ohjattu ja ohjaamaton koneoppiminen.

Kielimaisemat kurssi perustutkinto-opiskelijoille kevät 2023, luennoitsija Hanna Lantto. Yksi luento 2023-03-15 yhdessä professori Marko Lambergin kanssa "Historiallisten kirjallisten lähteiden näkökulmia kielimaisemiin Turussa"


Tutkimus

Väitöskirjassani tutkin keskiaikaisen paavinhallinnon alaisuudessa toimineen penitentiariaattiviraston vuosina 1410–1526 tuottamien asiakirjojen latinaa digitaalisen kielentutkimuksen menetelmin. Tutkimuksen kohteena ovat kielellisen vaihtelun piirteet eli rekisteritutkimus keskiajan latinassa. Avoimesti saatavilla olevan kielellisen analyysin sisältävän tietokannan luominen penitentiariaattiasiakirjoista.


TurkuNLP ja TUCEMEMS tutkimusryhmien jäsen.


Työskentelyni mahdollistaa Emil Aaltosen säätiö 2022 ja 2023, Turun yliopistosäätiön tutkimusapurahaston matka-apuraha 2023, Turkun yliopiston tutkimusapurahasto 2022 and 2021, Suomen kulttuurirahaston Varsinais-Suomen rahasto 2021, Uskelan opintorahastosäätiö 2020

Julkaisut

Järjestä:

FinGPT: Large Generative Models for a Small Language (2023)

Conference on Empirical Methods in Natural Language Processing
Luukkonen Risto, Komulainen Ville, Luoma Jouni, Eskelinen Anni, Kanerva Jenna, Kupari Hanna-Mari, Ginter Filip, Laippala Veronika, Muennighoff Niklas, Piktus Aleksandra, Wang Thomas, Tazi Nouamane, Scao Le Teven, Wolf Thomas, Suominen Osma, Sairanen Samuli, Merioksa Mikko, Heinonen Jyrki, Vahtola Aija, Antao Samuel, Pyysalo Sampo
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))

Textual Paraphrase Dataset for Deep Language Modelling (2022)

Kanerva Jenna, Ginter Filip, Chang Li-Hsin, Skantsi Valtteri, Kilpeläinen Jemina, Kupari Hanna-Mari, Piirto Aurora, Saarni Jenna, Sevón Maija, Tarkka Otto
(Vertaisarvioitu artikkeli kokoomateoksessa (A3))