Sampo
Pyysalo
yliopistotutkija, data-analytiikka
Ota yhteyttä
Julkaisut
Multi-CrossRE A Multi-Lingual Multi-Domain Dataset for Relation Extraction (2023)
Nordic Conference on Computational Linguistics, NEALT proceedings series
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Overview of DrugProt task at BioCreative VII: data and methods for large-scale text mining and knowledge graph generation of heterogenous chemical-protein relations (2023)
Database: The Journal of Biological Databases and Curation
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))
Towards better structured and less noisy Web data: Oscar with Register annotations (2022)
International Conference on Computational Linguistics, International Conference on Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Register identification from the unrestricted open Web using the Corpus of Online Registers of English (2022)
Language Resources and Evaluation
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))
Quantitative Evaluation of Alternative Translations in a Corpus of Highly Dissimilar Finnish Paraphrases (2021)
Workshop on Modelling Translation
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
WikiBERT Models: Deep Transfer Learning for Many Languages (2021)
Nordic Conference on Computational Linguistics, Linköping Electronic Conference Proceedings
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Beyond the English web: Zero-shot cross-lingual and lightweight monolingual classification of registers (2021)
European Chapter of the Association for Computational Linguistics
(Vertaisarvioitu artikkeli konferenssijulkaisussa (A4))
Deep learning for sentence clustering in essay grading support (2021)
International Conference on Educational Data Mining
(Artikkeli ammatillisessa konferenssijulkaisussa (D3))
Correction to 'The STRING database in 2021: customizable protein-protein networks, and functional characterization of user-uploaded gene/measurement sets' (vol 49, pg D605, 2021) (2021)
Nucleic Acids Research
(O2 Muu julkaisu )
The STRING database in 2021: customizable protein–protein networks, and functional characterization of user-uploaded gene/measurement sets (2021)
Nucleic Acids Research
(Vertaisarvioitu alkuperäisartikkeli tai data-artikkeli tieteellisessä aikakauslehdessä (A1))