kaaosinsinööörin
Kaaosinsinööri, englanniksi chaos engineer, on ohjelmisto- ja järjestelmäsovellusten luotettavuuteen keskittyvä insinööri, jonka tehtävänä on parantaa järjestelmien sietokykyä suunnittelemalla ja toteuttamalla hallittuja virheitä sekä kokeellisia häiriötilanteita. Tavoitteena on tunnistaa haavoittuvuudet sekä palautumiskyvyn puutteet ennen kuin ne vaikuttavat käyttäjiin, ja oppia kokeilujen kautta, miten järjestelmä reagoi todellisissa vikatilanteissa. Kaaosinsinöörin voi suunnitella kokeilut, määritellä niiden laajuuden (blast radius) ja riskit sekä saada hyväksynnän sidosryhmiltä. Hän seuraa havainnointia ja hälytyksiä, analysoi kokeilujen tulokset ja toteuttaa parannuksia järjestelmän resiliennin, toiminnan ja toipumisen edistämiseksi. Työ sisältää usein virheiden sietokyvyn ja toipumisen kehittämistä sekä incident managementin parantamista.
Kaaosinsinööri toimii tyypillisesti pilvi- ja mikropalveluarkkitehtuureissa sekä hajautetuissa järjestelmissä, joissa häiriöt voivat vaikuttaa laajasti. Keskeisiä ympäristöjä
Käytettäviä välineitä ovat esimerkiksi Gremlin, Chaos Mesh, LitmusChaos sekä muita avoimia ja kaupallisia työkaluja hallittujen virheiden
Kaaosinsinöörin käsite juontaa chaos engineeringin periaatteista, joiden tavoitteena on lisätä järjestelmien luotettavuutta systemaattisen kokeilun ja oppimisen