Home

collaboratiefiltering

Collaboratiefiltering is een klasse van aanbevelingssystemen die voorspellingen doet over de voorkeuren van een gebruiker op basis van eerdere interacties en de voorkeuren van soortgelijke gebruikers of items. Het maakt gebruik van gegevens zoals beoordelingen, klikken of aankopen om aanbevelingen te genereren.

Er zijn twee hoofdbenaderingen. Bij user-based collaboratieve filtering zoekt men naar gebruikers met vergelijkbare smaakprofielen en

Data spelen een centrale rol. In veel systemen ontstaat een ruimtatssparse matrix van gebruikers versus items.

Veelgebruikte modelmatige benaderingen zijn matrixfactorisatie-technieken zoals SVD of ALS, die de interactiematrix factoriseren in latente gebruikers-

Uitdagingen zijn onder meer data-sparsiteit, cold-start voor nieuwe gebruikers of items, schaalbaarheid bij grote catalogi, en

Toepassingen vinden plaats in e-commerce, streamingdiensten, nieuws en sociale platforms. Evaluatie gebeurt met nauwkeurigheidsmaatregelen zoals RMSE

raadt
men
items
aan
die
deze
vergelijkbare
gebruikers
hebben
gewaardeerd.
Bij
item-based
collaboratieve
filtering
zoekt
men
naar
items
die
vergelijkbaar
zijn
met
items
die
de
gebruiker
in
het
verleden
heeft
gewaardeerd
en
raadt
men
die
aan.
Similariteit
kan
worden
gemeten
met
bijvoorbeeld
cosine
similarity,
Pearson
correlatie
of
Jaccard.
Er
zijn
twee
hoofdtypen
methoden:
memory-based
(Directe
berekening
van
overeenkomsten
en
aanbevelingen)
en
model-based
(leren
van
latente
factoren
via
factorisatie
of
machine
learning
om
beter
te
generaliseren
naar
onbekende
gebruikers
of
items).
en
itemfactoren.
Recente
ontwikkelingen
bevatten
ook
neurale
collaboratieve
filtering
en
andere
deep
learning-benaderingen
die
embeddings
en
neurale
netwerken
combineren.
mogelijk
bias
of
filterbubbels.
Privacyoverwegingen
spelen
ook
een
rol
bij
het
analyseren
van
gebruikersgedrag.
en
MAE,
en
rangschikkingsmetrics
zoals
precision@k,
recall@k
en
NDCG.
Voordelen
zijn
efficiënt
gebruik
van
bestaande
interactiegegevens;
nadelen
zijn
afhankelijkheid
van
datakwaliteit
en
neiging
tot
populariteitsbias.