waardefuncties
Waardefuncties zijn wiskundige functies die een scalar waarde koppelen aan uitkomsten, toestanden of beslissingen, op basis van de mate van voorkeur of verwachte opbrengst die zij vertegenwoordigen. Ze geven een numerieke maat voor de desirability of waarde van een situatie en worden gebruikt om keuzes te sturen.
In economie en besliskunde verschijnen waardefuncties vaak als utilityfunctie U(x), die een consumptiebundel x toekent aan
In dynamische systemen en optimalisatie wordt vaak de waardefunctie V(s) gebruikt, die de maximale verwachte totale
In kunstmatige intelligentie en reinforcement learning worden waardefuncties meestal V^π(s) en Q^π(s,a) genoemd, afhankelijk van een
Waardefuncties dragen bij aan evaluatie en optimalisatie in praktijkscenario's zoals welfare-analyse, consumentengedrag en controllerontwerp. Ze vereisen
Samenvatting: een waardefunctie vertaalt toestanden, uitkomsten of beslissingen naar een enkel getal dat de waarde of