Home

autoskalning

Autoskalning är processen att automatiskt justera mängden tillgängliga beräkningsresurser i en applikation eller tjänst utifrån belastning eller andra mätvärden. Syftet är att bibehålla prestanda och tillgänglighet samtidigt som kostnaderna hålls nere. Lösningen används vanligtvis i offentliga molnmiljöer där infrastrukturtjänster erbjuder autoskalning som en del av plattformen.

Det främsta uppdelningen är horisontell och vertical autoskalning. Horisontell skalning (scale out/scale in) innebär att antalet

Autoskalning bygger på mätvärden som CPU-användning, minne, genomströmning, antal köer eller anpassade metrikvärden. Policies styr när

Nyckelkomponenter inkluderar en autoskalsgrupp eller motsvarande kontrollenhet, policyer och affiniteter till lastbalanserare samt health checks. I

Fördelar inkluderar förbättrad tillgänglighet och kostnadseffektivitet, medan utmaningar omfattar komplexitet, risken för thrashing och kalla uppstarter.

instanser,
containrar
eller
arbetsenheter
ökar
eller
minskar.
Vertical
skalning
(scale
up/scale
down)
innebär
att
kapaciteten
hos
varje
enhet
ändras,
till
exempel
mer
minne
eller
CPU.
Innehållsbaserad
applikationer
med
containrar
används
ofta
tillsammans
med
orkestrering
när
det
gäller
horisontell
skalning.
och
hur
skalningen
sker:
målspårning
(target
tracking)
som
försöker
hålla
en
viss
metriksnivå,
enkla
tröskelbaserade
regler,
eller
stegskalning
som
justerar
i
flera
steg.
Ett
cooldown-
eller
jämviktsintervall
används
för
att
undvika
snabba,
upprepade
ändringar.
containerbaserade
miljöer
används
ofta
Horizontal
Pod
Autoscaler
i
kombination
med
containerorkestrering
som
Kubernetes.
Viktiga
faktorer
är
starttid
för
nya
enheter,
distribution
över
regioner
och
balans
mellan
prestanda
och
kostnad.
God
praxis
innefattar
tydliga
metrikmål,
begränsningar,
testning
och
korrekt
konfiguration
av
hälsokontroller.