Sampo
Pyysalo
yliopistotutkija, data-analytiikka
Ota yhteyttä
Julkaisut
LSD600: the first corpus of biomedical abstracts annotated with lifestyle–disease relations (2025)
Database: The Journal of Biological Databases and Curation
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
An Expanded Massive Multilingual Dataset for High-Performance Language Technologies (HPLT) (2025)
Annual Meeting of the Association for Computational Linguistics
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)
Scaling Data-Constrained Language Models (2025)
Journal of Machine Learning Research
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Question Answering models for information extraction from perovskite materials science literature (2025)
Communications materials
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Annotated textual dataset PV600 of perovskite bandgaps for information extraction from literature (2025)
Scientific Data
(A1 Vertaisarvioitu data-artikkeli tieteellisessä lehdessä)
STRING-ing together protein complexes: Corpus and methods for extracting physical protein interactions from the biomedical literature (2024)
Bioinformatics
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Improving dictionary-based named entity recognition with deep learning (2024)
Bioinformatics
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )
Question Answering models for information extraction from perovskite materials science literature (2024)
MRS Fall Meeting and Exhibit
(Abstrakti)
Building Question-Answer Data Using Web Register Identification (2024)
Language Resources and Evaluation, LREC Proceedings
(A4 Vertaisarvioitu artikkeli konferenssijulkaisussa)
The STRING database in 2025: protein networks with directionality of regulation (2024)
Nucleic Acids Research
(A1 Vertaisarvioitu alkuperäisartikkeli tieteellisessä lehdessä )