Sampo
Pyysalo
yliopistotutkija, data-analytiikka
Ota yhteyttä
Julkaisut
Scaling Data-Constrained Language Models (2023)
Conference on Neural Information Processing Systems, Advances in Neural Information Processing Systems
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)
The STRING database in 2023: protein-protein association networks and functional enrichment analyses for any sequenced genome of interest (2023)
Nucleic Acids Research
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))
Towards better structured and less noisy Web data: Oscar with Register annotations (2022)
International Conference on Computational Linguistics, International Conference on Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Register identification from the unrestricted open Web using the Corpus of Online Registers of English (2022)
Language Resources and Evaluation
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))
Fine-grained Named Entity Annotation for Finnish (2021)
Nordic Conference on Computational Linguistics, Linköping Electronic Conference Proceedings
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Overview of DrugProt BioCreative VII track: quality evaluation and large scale text mining of drug-gene/protein relations (2021)
BioCreative
(Vertaisarvioimaton konferenssijulkaisu (B3))
Quantitative Evaluation of Alternative Translations in a Corpus of Highly Dissimilar Finnish Paraphrases (2021)
Workshop on Modelling Translation
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
WikiBERT Models: Deep Transfer Learning for Many Languages (2021)
Nordic Conference on Computational Linguistics, Linköping Electronic Conference Proceedings
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Beyond the English web: Zero-shot cross-lingual and lightweight monolingual classification of registers (2021)
European Chapter of the Association for Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Deep learning for sentence clustering in essay grading support (2021)
International Conference on Educational Data Mining
(Artikkeli ammatillisessa konferenssijulkaisussa (D3))