distributieverschuiving
Distributieverschuiving, soms ook distributieverschuiving genoemd, is een begrip uit statistiek en machine learning dat verwijst naar veranderingen in de verdeling van data tussen de trainingsfase en de fase waarin een model in productie wordt gebruikt. Wanneer de trainingsdata niet identiek zijn aan de operationele data kan een model slechter presteren dan verwacht.
Vormen van distributieverschuiving omvatten onder meer covariate shift, waarbij de marginals van de input X veranderen
Oorzaken zijn onder meer veranderende gebruikersgedragingen, gewijzigde dataverzamelingsmethoden, andere sensoren of hardware, geografische variatie, seizoenpatronen en
Gevolgen van distributieverschuiving kunnen bestaan uit verminderde nauwkeurigheid, biased voorspellingen, en onverwachte foutpatronen, waardoor betrouwbaarheid en
Detectie gebeurt door monitoring van modelprestatie op productiegegevens, drift-detectie en statistische metingen zoals afwijkingen in verdelingen,
Mitigatie omvat technieken zoals domain adaptation en transfer learning, importance weighting om trainingsdata aan te passen
Het begrip speelt een belangrijke rol in veel AI-toepassingen waar data evolueert naarmate systemen in gebruik