autoskalning

Autoskalning är processen att automatiskt justera mängden tillgängliga beräkningsresurser i en applikation eller tjänst utifrån belastning eller andra mätvärden. Syftet är att bibehålla prestanda och tillgänglighet samtidigt som kostnaderna hålls nere. Lösningen används vanligtvis i offentliga molnmiljöer där infrastrukturtjänster erbjuder autoskalning som en del av plattformen.

Det främsta uppdelningen är horisontell och vertical autoskalning. Horisontell skalning (scale out/scale in) innebär att antalet

Autoskalning bygger på mätvärden som CPU-användning, minne, genomströmning, antal köer eller anpassade metrikvärden. Policies styr när

Nyckelkomponenter inkluderar en autoskalsgrupp eller motsvarande kontrollenhet, policyer och affiniteter till lastbalanserare samt health checks. I

Fördelar inkluderar förbättrad tillgänglighet och kostnadseffektivitet, medan utmaningar omfattar komplexitet, risken för thrashing och kalla uppstarter.

Innehållsbaserad

tröskelbaserade

i

jämviktsintervall

containerbaserade

i

containerorkestrering

begränsningar,

hälsokontroller.