Home

patroonontdekking

Patroonontdekking is het proces waarbij terugkerende patronen, regelmaat of structuren in datasets worden geïdentificeerd en geanalyseerd. Het vormt een kernactiviteit binnen data mining en de bredere discipline van knowledge discovery in databases (KDD). Het doel is om bruikbare kennis te vinden die niet direct zichtbaar is uit de oorspronkelijke data, bijvoorbeeld regelmaat in aankopen, sequenties van gebeurtenissen of patronen in netwerken.

Binnen patroonontdekking onderscheiden we verschillende typen patronen. Veelvoorkomende itemsets en associatieregels waarnemen bijvoorbeeld welke gebeurtenissen samen

Methoden en algoritmes spelen een centrale rol. Voor frequente itemsets zijn algoritmen zoals Apriori en FP-Growth

Het proces bevat meestal datavoorbewerking, patroonontdekking en interpretatie/validatie van de gevonden patronen. Toepassingen zijn onder andere

voorkomen
en
in
welke
mate.
Sequentiële
patronen
onderzoeken
de
volgorde
van
gebeurtenissen,
terwijl
patroonontdekking
in
grafen
gericht
is
op
subgraph
patronen.
Ook
temporele
en
anomaliepatronen
komen
aan
bod,
afhankelijk
van
de
aard
van
de
data.
bekend;
voor
sequentiële
patronen
bestaan
algoritmes
als
PrefixSpan.
Graph-pattern
mining
vereist
technieken
voor
patroonmatches
en
subgraafdetectie.
Patrondiscovery
maakt
gebruik
van
evaluatiestatistieken
zoals
support,
confidence
en
lift,
naast
andere
measures
voor
interestingness
en
relevantie
van
de
patronen.
marktanalyses,
bioinformatica,
fraude-
en
netwerkdetectie,
en
webgedraganalyse.
Belangrijke
uitdagingen
zijn
schaalbaarheid,
ruis
en
hoge-dimensionaliteit,
evenals
privacy-
en
dynamische
veranderingen
in
gegevens.