indicatorvarianten

Indicatorvarianten verwijzen naar de verschillende manieren om categorische variabelen om te zetten in numerieke indicatoren die gebruikt worden bij statistische modellen. Een indicatorvariabele is doorgaans een binaire variabele die aangeeft of een categorie aanwezig is. Bij indicatorvarianten gaat het om de verschillende coderingen en constructies die mogelijk zijn om dezelfde categorieën te representeren in een dataset.

Veelvoorkomende varianten zijn: eenvoudige indicatoren (0/1 voor een specifieke categorie), dummyvariabelen met referentiecoding (een van de

Toepassingen: indicatorvarianten worden veel gebruikt in lineaire en logistieke regressie, gegeneraliseerde lineaire modellen (GLM), ANOVA en

Praktische overwegingen: kies codering op basis van modelinterpretatie en dataset; let op het aantal kolommen bij

coëfficiënten

coëfficiënten

multicollineariteit

referentiecategorie

cross-validatie