Home

driftdetectie

Driftdetectie is het proces van het tijdig opsporen van veranderingen in de gegevens of in de relatie tussen inputs en outputs van een model, zodat de betrouwbaarheid van beslissingssystemen behouden blijft. Het is relevant in machine learning, data-analyse en industriële toepassingen waar data continu stroomt.

Vormen: concept drift verwijst naar veranderingen in de relatie tussen input en target; covariate shift naar

Detectietechnieken: monitoring van prestaties (bijv. daling van nauwkeurigheid, verhoogde foutmaten) en statistische tests op de inkomende

Toepassingen: driftdetectie speelt een rol in fraude- en risicoanalyse, aanbevelingssystemen, predictive maintenance, productie en sensornetwerken, waar

Uitdagingen: drift kan tijdelijk zijn of door ruis worden veroorzaakt; hoge-dimensie data bemoeilijken detectie; bepalen wat

Zie ook: concept drift, data kwaliteit, modelonderhoud.

veranderingen
in
de
inputverdeling
terwijl
de
doelrelatie
gelijk
blijft;
prior
probability
shift
naar
verschuivingen
in
de
klassenverdeling.
data.
Veelgebruikte
methoden
zijn
drift
detection
methods
zoals
DDM
(Drift
Detection
Method)
en
EDDM
(Early
Drift
Detection
Method),
de
Page-Hinkley-test,
en
distributiegerelateerde
benaderingen
zoals
PSI
(Population
Stability
Index)
en
divergences
zoals
KL-divergence
of
Jensen-Shannon.
Bij
hoge-dimensie
data
worden
vaak
windowed
of
online-benaderingen
toegepast
waarbij
statistieken
continu
worden
bijgehouden.
tijdige
detectie
van
drift
leidt
tot
tijdige
retraining
of
modelaanpassingen.
een
aanvaardbaar
niveau
van
drift
is;
kiezen
wanneer
retraining
nodig
is
en
hoe
dit
efficiënt
uit
te
voeren.