datakilde
Datakilde er enhver kilde, der leverer data, som anvendes af systemer, analyseværktøjer eller beslutningsstøttesystemer. Begrebet bruges bredt inden for informationsteknologi og dataforskning og omfatter både operationelle data og analytiske datasæt. En datakilde kan være intern, såsom virksomhedens ERP- eller CRM-systemer, logfiler og transaktionsdatabaser, eller ekstern, som offentlige registre, open data-portaler, tredjepartsdata og sociale medier. Data fra en datakilde kan leveres i realtid eller i batch og kan være struktureret, semistruktureret eller ustruktureret.
Formater og typer: Strukturerede kilder som relationelle databaser og regneark; semistrukturerede som JSON og XML; ustrukturerede
Kvalitet, sporbarhed og metadata: Det er almindeligt at dokumentere datakildens oprindelse, opdateringsfrekvens, format, rettigheder og kvalitet.
Anvendelse og styring: Datakilder bruges i data integration, ETL/ELT-processer, business intelligence, data governance og dataforskning. Styres