Tekoälymalleja
Tekoälymalleja käsittelee yleisesti matemaattisena mallina, jonka avulla tietokone voi tehdä ennusteita, päätelmiä tai päätöksiä hyödyntämällä aiemmin kerättyä dataa. Malli koostuu rakenteesta ja sen parametreista, jotka opetetaan koulutuksen aikana datasta. Tekoälymallit voivat olla yksinkertaisia tilastollisia malleja tai monimutkaisempia neuroverkkoja; tyypillisiä lähestymistapoja ovat koneoppimisen mallit sekä syvät oppimisalustat, kuten transformerit. Niitä käytetään esimerkiksi luokittelussa, regressiossa, kuvankäsittelyssä, puheentunnistuksessa sekä luonnollisen kielen käsittelyssä.
Koulutuksessa data jaetaan tyypillisesti koulutus- ja validointijoukkoihin; testijoukko mahdollistaa suorituskyvyn arvioinnin uudella datalla. Parametrit optimoidaan sopeuttamalla
Arviointi perustuu mittareihin kuten tarkkuus, herkkyys ja F1-arvo sekä ROC-AUC; joissakin tapauksissa perplexity on keskeinen mittari,
Eettiset ja sääntelykysymykset ovat keskeisiä: mallit voivat heijastaa tai vahvistaa yhteiskunnallisia vinoumia, ja niiden käyttö vaatii