förstärkningslärande
Förstärkningslärande, eller reinforcement learning på engelska, är ett område inom maskininlärning som handlar om hur en agent ska agera i en miljö för att maximera en kumulativ belöning. Till skillnad från övervakad inlärning där man får tydliga exempel på rätt svar, och oövervakad inlärning där man letar efter mönster, får agenten i förstärkningslärning feedback i form av belöningar eller straff baserat på sina handlingar.
Kärnan i förstärkningslärning är en dynamisk process. Agenten observerar miljön, väljer en handling, utför handlingen, och
Viktiga koncept inom förstärkningslärning inkluderar tillstånd (state), handling (action), belöning (reward), policy (strategy), och värdefunktion (value
Användningsområden för förstärkningslärning är många och inkluderar robotik, spel (som schack och Go), rekommendationssystem, autonom körning