autoskalning
Autoskalning är processen att automatiskt justera mängden tillgängliga beräkningsresurser i en applikation eller tjänst utifrån belastning eller andra mätvärden. Syftet är att bibehålla prestanda och tillgänglighet samtidigt som kostnaderna hålls nere. Lösningen används vanligtvis i offentliga molnmiljöer där infrastrukturtjänster erbjuder autoskalning som en del av plattformen.
Det främsta uppdelningen är horisontell och vertical autoskalning. Horisontell skalning (scale out/scale in) innebär att antalet
Autoskalning bygger på mätvärden som CPU-användning, minne, genomströmning, antal köer eller anpassade metrikvärden. Policies styr när
Nyckelkomponenter inkluderar en autoskalsgrupp eller motsvarande kontrollenhet, policyer och affiniteter till lastbalanserare samt health checks. I
Fördelar inkluderar förbättrad tillgänglighet och kostnadseffektivitet, medan utmaningar omfattar komplexitet, risken för thrashing och kalla uppstarter.