szövegbányászat
Szövegbányászat (text mining) a strukturálatlan vagy félig strukturált szövegadatokból származó hasznos információk és mintázatok kinyerésének tudománya és gyakorlata. A terület a természetes nyelvfeldolgozás, az adatbányászat, a gépi tanulás és az információ-visszakeresés módszereinek integrációját jelenti, és számos területen alkalmazzák, például üzleti intelligenciában, kutatásban és közösségi médiában.
Az adatforrások között lehetnek vállalati dokumentumok, e-mailek, weboldalak, cikkek és közösségi média bejegyzések. A szövegbányászat tipikus
Az adatok reprezentációja történhet hagyományos módszerekkel, mint a bag-of-words vagy TF–IDF, vagy fejlett beágyazásokkal (word embeddings)
Az alkalmazások közé tartozik a piaci és versenyképes intelligencia, ügyfél visszajelzések elemzése, reputáció- és kockázatfigyelés, automatizált
Fontos szempontok a hitelesség és átláthatóság, a magánélet védelme és az adatvédelmi rendelkezések betartása (például GDPR),