Turun yliopisto ja SiloGen kehittävät yhteistyössä maailman suurinta avointa kielimallia

28.08.2023

Turun yliopisto ja Euroopan suurimpiin tekoäly-yhtiöihin lukeutuvan Silo AI:n tytäryhtiö SiloGen käynnistävät laajan yhteistyöprojektin, jonka tavoitteena on kehittää joukko avoimia ja luotettavia kielimalleja, mukaan lukien maailman suurin avoin kielimalli. Hankkeen tavoitteena on myös vahvistaa Euroopan digitaalista itsenäisyyttä sekä varmistaa tasavertainen mahdollisuus käyttää suuria kielimalleja.

Turun yliopiston TurkuNLP-tutkimusryhmä ja tekoäly-yhtiö Silo AI:n kielimalleihin keskittyvä tytäryhtiö SiloGen käynnistävät konsortion, jonka päämääränä on kehittää maailman suurin avoin kielimalli. Hankkeessa tehdään yhteistyötä myös monien eurooppalaisten instituutioiden ja organisaatioiden kanssa.

Konsortion tavoitteena on, että uusi suuri kielimalli olisi saatavilla kaikilla virallisilla eurooppalaisilla kielillä. Tavoitteena on myös vahvistaa Euroopan digitaalista itsenäisyyttä ja parantaa kielimallien saavutettavuutta. Lisäksi yhteistyönä kehitettävät perusmallit tulevat tarjoamaan yrityksille mahdollisuuden luoda ja kouluttaa erikoistuneita kielimalleja yritysten omiin tarpeisiin.

Tutkimuskonsortio käyttää kehitystyössä apunaan LUMI-supertietokonetta, joka on suurin supertietokone Euroopassa ja kolmanneksi suurin koko maailmassa. TurkuNLP-Tutkimusryhmä on jo vuoden ajan rakentanut kielimalleja LUMIlla ja julkaisi aikaisemmin tänä vuonna ensimmäisen suuren suomenkielisen generatiivisen kielimallin FinGPT:n. Uuden kielimallin pohjana käytetään valikoituja aineistoja, jotka edustavat luotettavasti ja tarkasti eurooppalaisia kieliä. Tutkimusryhmä käyttää kehitystyössään apuna esimerkiksi High Performance Language Technologies (HPLT) -konsortiohankkeessa viime vuosien aikana tuotettuja aineistoja. HPLT on monen yliopiston yhteinen EU-rahoitteinen konsortio.

Sampo Pyysalo lähikuvassa.

Turun yliopiston data-analytiikan yliopistotutkija Sampo Pyysalo johtaa High Performance Language Technologies -konsortion Turun osaa.

– Suuret kielimallit ovat nopeasti mullistaneet tapamme käyttää tietoa ja olla vuorovaikutuksessa teknologian kanssa. Kun kielimallien vaikutus kasvaa, on entistäkin tärkeämpää varmistaa, että kielimalleja kehitetään läpinäkyvällä ja toisinnettavalla tavalla ja että ne ovat avoimesti saatavilla, vastuullisia ja yhdenvertaisesti kaikkien käytettävissä. Eurooppalaisesta näkökulmasta on erityisen tärkeää, että mallit suunnitellaan ensisijaisesti monikielisiksi ja kielellisesti tasavertaisiksi. HPLT-hankkeen tavoitteena onkin luoda avoimia eurooppalaisia aineistoja ja kielimalleja. HPLT on tässä konsortiossa yhteistyössä markkinajohtaja Silo AI:n kanssa, jonka kanssa jaamme yhteiset näkemykset kielimallien tulevaisuudesta, kertoo Turun yliopiston data-analytiikan yliopistotutkija Sampo Pyysalo, joka johtaa HPLT-konsortion Turun osaa.

Peter Sarlin lähikuvassa.

Peter Sarlin on Silo AI:n toimitusjohtaja ja perustaja.

– Silo AI on tiiviisti mukana avointen kielimallien kehitystyössä. Riippumattomien ja luotettavien sekä eurooppalaisten arvojen mukaisten perusmallien kehitys on tärkeää digitaalisen itsenäisyytemme kannalta. Pyrimme hankkeessa varmistamaan, että perusmallit pohjautuvat aineistoon, joka edustaa alueen kansalaisia ja organisaatioita sekä noudattaa sääntelyä ja tietosuoja-asetuksia. Tarvitsemme tulevaisuudessa itsenäisiä keinoja tiedon jalostukseen ja arvon luomiseen, mikä vaatii luotettavia ja turvallisia perusmalleja, jotka puolestaan mahdollistavat mallien hienosäädön toimialakohtaisiin tarpeisiin. Tällöin voimme pitää huolta digitaalisesta itsenäisyydestä samalla kun edistämme teknologian kehitystä, kertoo Silo AI:n toimitusjohtaja ja perustaja Peter Sarlin.

TurkuNLP-tutkimusryhmän vahva osaaminen luonnollisten kielten käsittelyssä ja kielimalleissa yhdistettynä SiloGenin tutkimukseen generatiivisista tekoälyjärjestelmistä luo pohjan uudenlaisten avoimien kielimallien luomiselle. Turun yliopistossa hanketta johtavat professori Filip Ginter ja yliopistotutkija Sampo Pyysalo ja SiloGenillä kehitykseen osallistuu teknologiajohtaja Aarne Talman sekä johtavat tekoälytutkijat Magnus Sahlgren, Jussi Karlgren, Jonathan Burdge, Antti-Ville Suni ja moni muu Silo AI:n noin 300 tekoälyasiantuntijan ja 150 väitellyn tohtorin joukosta.

TurkuNLP-tutkimusryhmä
TurkuNLP-tutkimusryhmä perustettiin Turun yliopistossa vuonna 2001. Ryhmä on erikoistunut jo yli 20-vuoden ajan luonnollisten kielten käsittelyn tutkimukseen ja digitaaliseen kielentutkimukseen keskittyen kehittämään koneoppivia sovelluksia tekstin automaattista analyysiä ja tuottamista varten. Turku NLP on suomen johtava tutkimusryhmä suurissa generatiivisissa kielimalleissa ja mukana EU:n Horisontti Eurooppa -ohjelmaan kuuluvassa High Performance Language Technologies -projektissa, joka on parhaillaan luomassa seuraavan sukupolven eurooppalaisia kielimalleja LUMI-supertietokoneella.

Silo AI
Silo AI on yksi Euroopan suurimmista yksityisistä tekoälylaboratorioista. Olemme luotettu kumppani, joka tuo tekoälyn avulla kilpailuetua tuotekehitykseen. Rakennamme tekoälyyn perustuvia ratkaisuja ja tuotteita, jotka mahdollistavat älykkäät laitteet, itseohjautuvat autot, teollisuus 4.0:n sekä älykkäät kaupungit. Silo AI tarjoaa asiakkailleen ainutlaatuista maailmanluokan tekoälyosaamista sekä Silo OS -infrastruktuurin, joka nopeuttaa tekoälyn kehittämistä ja käyttöönottoa. Vuonna 2017 perustetun Silo AI:n tavoitteena on kasvaa Euroopan tekoälykentän lippulaivaksi. Tällä hetkellä yritys toimii yhdeksässä eri toimistossa kuudessa eri maassa - Suomessa, Ruotsissa, Tanskassa, Alankomaissa ja Kanadassa.

SiloGen
Silo AI:n tytäryhtiö SiloGen on laajamittainen hanke Euroopan digitaalisen suvereniteetin varmistamiseksi. SiloGen kokoaa yhteen Euroopan johtavia generatiivisen tekoälyn ja suurten kielimallien asiantuntijoita, sekä kattavan kielimallidatan, tehokkaat laskentaresurssit ja tarvittavan infrastruktuurin kielimallien kouluttamiseksi ja käyttämiseksi. Vuonna 2022 käynnistetyn SiloGenin asiakkaita ovat muun muassa Allianz, Sandvik ja Tietoevry. SiloGenin tavoitteena on kehittää toimialakohtaisia sovelluksia, sekä varmistaa, että yrityksillä on käytössään luotettavia malleja yksityiselle ja luottamukselliselle datalle. Luotettavana toimijana SiloGen tarjoaa pohjamalleja ja erikoistuneita malleja sekä kehitystyökaluja tarkkojen, luotettavien ja robustien mallien jatkokehittämiseen.

Luotu 28.08.2023 | Muokattu 28.08.2023