Home

autoskalering

Autoskalering er en metode i cloud computing og IT-infrastruktur, der automatisk justerer antallet eller størrelsen af beregningsressourcer i forhold til den observerede efterspørgsel. Formålet er at opretholde ydeevne og tilgængelighed samtidig med at omkostningerne optimeres.

Der findes to hovede tilgange: vandret skalering (tilføje eller fjerne instanser eller containere) og lodret skalering

Arbejdsgang: en overvågningskomponent indsamler metrics, autoskaleren anvender politikkerne og resizererer ved at starte nye instanser, fjerne

Fordele: forbedret ydeevne, høj tilgængelighed og omkostningsoptimering gennem pay-for-use. Udfordringer: tilstandfulde tjenester og datakonsistens, opstartslatens og

Anvendelse: udbredt i offentlige skyer og containerplatforme; ofte integreret med load balancing og helbredskontrol.

(ændre
ressourcerne
for
en
enkelt
instans
eller
container).
Vandret
er
mest
udbredt
i
moderne
skyer.
Nøglekomponenter
inkluderer
overvågning
og
målinger,
skaleringspolitikker
og
en
orkestrator
eller
autoskaleringgruppe.
Måleparametre
kan
være
CPU-brug,
hukommelsesforbrug,
anmodningshastighed,
latenstid,
kødybde
eller
brugerdefinerede
metrics.
Skaleringspolitikker
kan
være
målbaserede
(target
tracking),
trinbaserede
eller
tidsplanbaserede.
En
cooldown-periode
forhindrer
hyppige
svingninger.
eksisterende
eller
justere
instansstørrelser.
I
Kubernetes
justerer
Horizontal
Pod
Autoscaler
antallet
af
pods;
i
skyleverandører
håndterer
autoskalering
af
virtuelle
maskiner
grupperne.
behov
for
finjustering
af
politikker.
Overvejelser:
mindste
og
maksimale
grænser,
belastningsbalancering
og
cooldown-indstillinger.