Inputkenmerken
Inputkenmerken, ook wel features of voorspellende variabelen genoemd, zijn de variabelen die dienen als invoer voor een statistisch model, algoritme of analyse. Samen vormen ze de kenmerken van de te onderzoeken entiteit (bijv. een klant, woning of tijdreeks) en bepalen ze in welke mate de uitkomst kan worden voorspeld.
Ze kunnen verschillende typen hebben: numerieke kenmerken (continu of discreet), categorische kenmerken (nominaal), ordinale kenmerken (met
Voorbewerking: data bevatten vaak ontbrekende waarden, ruis of verschillende schalen. Voor inputkenmerken worden stappen zoals imputatie,
In een voorspellend model vormen inputkenmerken het belangrijkste middel om de doelvariabele te voorspellen. De keuze,