Sampo Pyysalo profiilikuva

Sampo
Pyysalo

yliopistotutkija, data-analytiikka

Ota yhteyttä

Julkaisut

Järjestä:

Scaling Data-Constrained Language Models (2025)

Journal of Machine Learning Research
Muennighoff, Niklas; Rush, Alexander M.; Barak, Boaz; Le Scao, Teven; Piktus, Aleksandra; Tazi, Nouamane; Pyysalo, Sampo; Wolf, Thomas; Raffel, Colin
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )

An Expanded Massive Multilingual Dataset for High-Performance Language Technologies (HPLT) (2025)

Annual Meeting of the Association for Computational Linguistics
Burchell, Laurie; De Gibert Bonet, Ona; Arefyev, Nikolay; Aulamo, Mikko; Bañón, Marta; Chen, Pinzhen; Fedorova, Mariia; Guillou, Liane; Haddow, Barry; Hajič, Jan; Helcl, Jindřich; Henriksson, Erik; Klimaszewski, Mateusz; Komulainen, Ville; Kutuzov, Andrey; Kytöniemi, Joona; Laippala, Veronika; Mæhlum, Petter; Malik, Bhavitvya; Mehryary, Farrokh; Mikhailov, Vladislav; Moghe, Nikita; Myntti, Amanda; O’Brien, Dayyán; Oepen, Stephan; Pal, Proyag; Piha, Jousia; Pyysalo, Sampo; Ramírez-Sánchez, Gema; Samuel, David; Stepachev, Pavel; Tiedemann, Jörg; Variš, Dušan; Vojtěchová, Tereza; Zaragoza-Bernabeu, Jaume
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)

A New Massive Multilingual Dataset for High-Performance Language Technologies (2024)

Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), LREC Proceedings
de Gibert, Ona; Nail, Graeme; Arefyev, Nikolay; Bañón, Marta; van der Linde, Jelmer; Ji, Shaoxiong; Zaragoza-Bernabeu, Jaume; Aulamo, Mikko; Ramírez-Sánchez, Gema; Kutuzov, Andrey; Pyysalo, Sampo; Oepen, Stephan; Tiedemann, Jörg
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)