Sampo
Pyysalo
yliopistotutkija, data-analytiikka
Ota yhteyttä
Julkaisut
Scaling Data-Constrained Language Models (2025)
Journal of Machine Learning Research
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Annotated textual dataset PV600 of perovskite bandgaps for information extraction from literature (2025)
Scientific Data
(A1 Vertaisarvioitu data-artikkeli tieteellisessä lehdessä)
LSD600: the first corpus of biomedical abstracts annotated with lifestyle–disease relations (2025)
Database: The Journal of Biological Databases and Curation
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
An Expanded Massive Multilingual Dataset for High-Performance Language Technologies (HPLT) (2025)
Annual Meeting of the Association for Computational Linguistics
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)
CoNECo: a Corpus for Named Entity recognition and normalization of protein Complexes (2024)
Bioinformatics Advances
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
RegulaTome: a corpus of typed, directed, and signed relations between biomedical entities in the scientific literature (2024)
Database: The Journal of Biological Databases and Curation
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Application of the Question Answering method to extract information from materials science literature (2024)
ML4MS
(Abstrakti)
A New Massive Multilingual Dataset for High-Performance Language Technologies (2024)
Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), LREC Proceedings
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)
Linguistic variation beyond the Indo-European web: Analyzing Turkish web registers in TurCORE (2024)
Register studies
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Lifestyle factors in the biomedical literature: An ontology and comprehensive resources for named entity recognition (2024)
Bioinformatics
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )