kernkolommen
kernkolommen, oftewel core columns, zijn kolommen in een dataset die de essentie van de informatie bevatten en cruciaal zijn voor het uitvoeren van analyses of voor het trainen van voorspellende modellen. Deze kolommen bevatten hoogst variabele gegevens die veel onderscheid bieden tussen datapoints en bevatten daarom een groot deel van de explainable variance in een model. Kernkolommen worden vaak geïdentificeerd via statistische technieken zoals feature importance, correlatieanalyse of via modelgebaseerde methoden zoals random forest importance.
In de context van data science hebben kernkolommen een centrale rol bij dimensionale reductie, omdat zij meestal
De term wordt gangbaar gebruikt in zowel academische literatuur als in het bedrijfsleven, met name in het