autoskalering - Infinite Lexicon - Infinite Lexicon

autoskalering

Autoskalering er en metode i cloud computing og IT-infrastruktur, der automatisk justerer antallet eller størrelsen af beregningsressourcer i forhold til den observerede efterspørgsel. Formålet er at opretholde ydeevne og tilgængelighed samtidig med at omkostningerne optimeres.

Der findes to hovede tilgange: vandret skalering (tilføje eller fjerne instanser eller containere) og lodret skalering

Arbejdsgang: en overvågningskomponent indsamler metrics, autoskaleren anvender politikkerne og resizererer ved at starte nye instanser, fjerne

Fordele: forbedret ydeevne, høj tilgængelighed og omkostningsoptimering gennem pay-for-use. Udfordringer: tilstandfulde tjenester og datakonsistens, opstartslatens og

Anvendelse: udbredt i offentlige skyer og containerplatforme; ofte integreret med load balancing og helbredskontrol.

i

Nøglekomponenter

skaleringspolitikker

autoskaleringgruppe.

hukommelsesforbrug,

anmodningshastighed,

brugerdefinerede

Skaleringspolitikker

tidsplanbaserede.

cooldown-periode

instansstørrelser.

I

i

skyleverandører

belastningsbalancering

cooldown-indstillinger.